Le Intel® Data Center Diagnostic Tool est un outil permettant de vérifier l’état des cœurs de processeurs.
La version actuelle est 639 et a été publié le March 26, 2025.
L’un des principaux objectifs des fournisseurs de cloud hyperscale et des centres de données d’entreprise a toujours été de fournir le meilleur temps de fonctionnement et la meilleure fiabilité possible. Historiquement, l’industrie s’est plutôt bien comportée, atteignant régulièrement >99,999% de disponibilité. Cependant, l’infrastructure informatique moderne entraîne des attentes toujours croissantes des utilisateurs en matière de qualité de service (QoS) et de haute disponibilité. Ces attentes soulignent la nécessité de disposer d’outils logiciels puissants permettant d’identifier et de minimiser les défaillances système inattendues susceptibles de compromettre la qualité de service ou la disponibilité.
Chez Intel, nous concevons et utilisons des outils avancés de test et de validation des composants qui réduisent considérablement les défauts de nos produits susceptibles d’entraîner des erreurs système. Nos clients hyperscale et leurs fournisseurs utilisent ces mêmes outils logiciels développés par Intel pour maintenir la santé de la flotte tout au long de la vie de leurs systèmes. Ils reconnaissent qu’au fil du temps, une surveillance étroite des actifs système peut améliorer la résilience globale de la flotte et la qualité de service des clients.
Intel reconnaît que de nombreux clients différents peuvent bénéficier des mêmes capacités, et le Intel® Data Center Diagnostic Tool est une version simplifiée de ce logiciel pour la gestion des environnements sur site.
Le Intel® Data Center Diagnostic Tool (Intel® DCDiag) est conçu pour permettre aux responsables informatiques d’effectuer la maintenance périodique de leurs parcs de centres de données. Intel® DCDiag peut être utilisé sur n’importe quelle taille de centre de données pour garantir le plus haut niveau de qualité et de disponibilité continues. De plus, DCDiag peut être utilisé pour un filtrage périodique de la flotte au premier plan (~45 minutes d’exécution) ou en mode arrière-plan et peut identifier les microprocesseurs défectueux. L’exécution d’une maintenance périodique du système permet d’identifier de manière proactive les problèmes potentiels et donne aux administrateurs système la possibilité de remplacer ces microprocesseurs.
Intel® DCDiag est une suite de tests qui vérifie méthodiquement la plupart des fonctionnalités du SoC, y compris celles de chaque cœur de microprocesseur. En vérifiant que chaque calcul DCDiag est correct, et pas seulement en confirmant que le test a terminé l’exécution correctement, DCDiag est capable de détecter de nombreux types de défauts, y compris ceux qui se manifestent par des erreurs de données silencieuses.
Intel® DCDiag détecte les défaillances en vérifiant les résultats corrects du fonctionnement du processeur à l’aide de plusieurs tests.
Des ensembles de données aléatoires sont utilisés pour tester les instructions et les cœurs. Le rapport de sortie est une réussite/échec facile à comprendre sur un processeur. Les processeurs qui échouent au test doivent être retournés au vendeur ou au distributeur du système pour remplacement.
Les résultats des tests DCDiag sont conçus pour être faciles à comprendre. Une fois le diagnostic terminé, le système renvoie l’un des messages suivants :
Vérifiez le modèle et la version du processeur du système. Ce message s’affiche si le Intel Data Center Diagnostic Tool ne détecte pas de version de production des processeurs pris en charge. Les échantillons d’ingénierie ne sont pas pris en charge par cet outil.
La dernière version du microcode résout les problèmes connus. Intel recommande d’installer la dernière version de mise à jour.
Si les résultats des tests révèlent un échec, vérifiez si les processeurs de votre nœud serveur sont toujours sous garantie.
Si vous avez un processeur Intel® Xeon® en boîte toujours sous garantie de 3 ans, contactez-Intel Customer Support pour obtenir de l’aide.
Si vous avez un processeur en plateau, contactez le fournisseur ou le lieu d’achat de votre système ou processeur.
Le Intel® Data Center Diagnostic Tool est une application disponible pour les systèmes d’exploitation Linux* et Windows*. L’outil peut être installé et exécuté sur de nombreuses distributions Linux* et Windows* actuelles, voir Installation sous Linux* et Windows*.
À partir de la version 558, l’outil peut être installé sur Windows* à l’aide du programme d’installation MSI fourni et fonctionner sur n’importe quelle version de Windows® 10, Windows* Server 2016 ou ultérieure actuellement prise en charge par Microsoft. Consultez les informations sur la version de Windows* Server pour déterminer quelles versions de systèmes Windows* Server sont actuellement disponibles et prises en charge.
Pour une meilleure couverture, exécutez l’application dans le système racine d’un serveur. Il est possible de l’exécuter à l’intérieur d’un conteneur ou d’une machine virtuelle, mais sachez que certaines fonctionnalités peuvent être désactivées.
En outre, Intel a introduit une nouvelle fonctionnalité de fiabilité, de disponibilité et de facilité d’entretien (RAS) appelée Intel® In-Field Scan. Il s’agit d’une famille d’outils conçus pour aider les administrateurs système à trouver rapidement et facilement les processeurs qui sont tombés en panne au fil du temps. Pour plus d’informations sur Intel In-Field Scan, consultez ce lien.
Intel® In-Field Scan et Intel® DCDiag sont des outils de test complémentaires. Intel® In-Field Scan est minimalement intrusif et conçu pour tester rapidement un cœur, tandis que tous les autres cœurs du nœud continuent d’exécuter les charges de travail des clients. Intel® DCDiag est une suite de tests de processeurs complète, qui est plus efficace lorsque l’ensemble du nœud de traitement est dédié aux tests. Les outils exécutant des contenus de test différents, Intel a constaté que chaque outil identifie des défaillances différentes parmi les processeurs testés.
Note: Pour les développeurs : Intel a lancé le projet Open Data Center Diagnostic, qui ouvre le cadre de diagnostic du centre de données d’Intel et fournit des tests sélectionnés. Cela offre aux développeurs un cadre de développement de tests cohérent qui invite la créativité de la communauté Open-Source à améliorer la gestion de flotte dans le cloud grâce au développement d’écrans de test uniques et d’autres solutions innovantes. Pour plus d’informations, consultez cette infrastructure et ces tests.
Date | Version | Description |
07 juillet 2021 | 540 | Version initiale |
16 août 2022 | 549 | Correction d’un bug |
20 sept. 2022 | 549 | Commande modifiée pour activer l’outil et vérifier l’activation |
10 janv. 2023 | 550 | Inclure les processeurs Intel® Xeon® de 4e génération |
20 janv. 2023 | 576 | Version 576 Release |
Déc 14, 2023 | 594 | Version 594 Release |
22 mars 2024 | 603 | Version 603 Release |
22 avril 2024 | 605 | Version 605 Release |
21 juin 2024 | 612 | Version 612 Release |
22 juillet 2024 | 613 | Version 613 : version du correctif |
20 septembre 2024 | 621 | Version 621 Release |
12 décembre 2024 | 630 | Version 630 Release |
26 mars 2025 | 639 | Version 639 Release |