Passer au Contenu principal
Base de connaissances pour l'assistance

Intel® Data Center Diagnostic Tool pour les processeurs Intel® Xeon®

Type de contenu: Maintenance et performances   |   ID de l'article: 000058107   |   Dernière révision: 26/03/2025

Environnement

Processeurs Intel® Xeon®

Présentation du produit

Le Intel® Data Center Diagnostic Tool est un outil permettant de vérifier l’état des cœurs de processeurs.

La version actuelle est 639 et a été publié le March 26, 2025.

Environnement

L’un des principaux objectifs des fournisseurs de cloud hyperscale et des centres de données d’entreprise a toujours été de fournir le meilleur temps de fonctionnement et la meilleure fiabilité possible. Historiquement, l’industrie s’est plutôt bien comportée, atteignant régulièrement >99,999% de disponibilité. Cependant, l’infrastructure informatique moderne entraîne des attentes toujours croissantes des utilisateurs en matière de qualité de service (QoS) et de haute disponibilité. Ces attentes soulignent la nécessité de disposer d’outils logiciels puissants permettant d’identifier et de minimiser les défaillances système inattendues susceptibles de compromettre la qualité de service ou la disponibilité.

Chez Intel, nous concevons et utilisons des outils avancés de test et de validation des composants qui réduisent considérablement les défauts de nos produits susceptibles d’entraîner des erreurs système. Nos clients hyperscale et leurs fournisseurs utilisent ces mêmes outils logiciels développés par Intel pour maintenir la santé de la flotte tout au long de la vie de leurs systèmes. Ils reconnaissent qu’au fil du temps, une surveillance étroite des actifs système peut améliorer la résilience globale de la flotte et la qualité de service des clients.

Intel reconnaît que de nombreux clients différents peuvent bénéficier des mêmes capacités, et le Intel® Data Center Diagnostic Tool est une version simplifiée de ce logiciel pour la gestion des environnements sur site.

Outil de diagnostic Intel® ® Data Center

Le Intel® Data Center Diagnostic Tool (Intel® DCDiag) est conçu pour permettre aux responsables informatiques d’effectuer la maintenance périodique de leurs parcs de centres de données. Intel® DCDiag peut être utilisé sur n’importe quelle taille de centre de données pour garantir le plus haut niveau de qualité et de disponibilité continues. De plus, DCDiag peut être utilisé pour un filtrage périodique de la flotte au premier plan (~45 minutes d’exécution) ou en mode arrière-plan et peut identifier les microprocesseurs défectueux. L’exécution d’une maintenance périodique du système permet d’identifier de manière proactive les problèmes potentiels et donne aux administrateurs système la possibilité de remplacer ces microprocesseurs.

Intel® DCDiag est une suite de tests qui vérifie méthodiquement la plupart des fonctionnalités du SoC, y compris celles de chaque cœur de microprocesseur. En vérifiant que chaque calcul DCDiag est correct, et pas seulement en confirmant que le test a terminé l’exécution correctement, DCDiag est capable de détecter de nombreux types de défauts, y compris ceux qui se manifestent par des erreurs de données silencieuses.

Intel® DCDiag détecte les défaillances en vérifiant les résultats corrects du fonctionnement du processeur à l’aide de plusieurs tests.

  • Exécute plusieurs boucles de code ou exécute le même code sur tous les cœurs et vérifie que les résultats sont identiques.
  • Vérifie les caches, les communications de cœur à cœur et la plupart des instructions du processeur.

Des ensembles de données aléatoires sont utilisés pour tester les instructions et les cœurs. Le rapport de sortie est une réussite/échec facile à comprendre sur un processeur. Les processeurs qui échouent au test doivent être retournés au vendeur ou au distributeur du système pour remplacement.

How Does DCDIAG Work?

Résultats du test

Les résultats des tests DCDiag sont conçus pour être faciles à comprendre. Une fois le diagnostic terminé, le système renvoie l’un des messages suivants :

  • Test réussi. Aucun problème détecté.
  • Test réussi. Une ou plusieurs erreurs de vérification de la machine se sont produites. Vérifiez les journaux système.
  • Ce processeur n’est pas pris en charge par cette version de l’outil.
    • Vérifiez le modèle et la version du processeur du système. Ce message s’affiche si le Intel Data Center Diagnostic Tool ne détecte pas de version de production des processeurs pris en charge. Les échantillons d’ingénierie ne sont pas pris en charge par cet outil.

    • Trouvez de l’aide pour identifier le processeur.

  • Test terminé. Les résultats ne sont pas concluants en raison d’une version obsolète du microcode.
    • La dernière version du microcode résout les problèmes connus. Intel recommande d’installer la dernière version de mise à jour.

  • Le test a échoué. Contactez le fabricant de votre système ou le fournisseur de votre processeur pour obtenir de l’assistance.
    • Si les résultats des tests révèlent un échec, vérifiez si les processeurs de votre nœud serveur sont toujours sous garantie.

    • Si vous avez un processeur Intel® Xeon® en boîte toujours sous garantie de 3 ans, contactez-Intel Customer Support pour obtenir de l’aide.

    • Si vous avez un processeur en plateau, contactez le fournisseur ou le lieu d’achat de votre système ou processeur.

Configuration requise

Le Intel® Data Center Diagnostic Tool est une application disponible pour les systèmes d’exploitation Linux* et Windows*. L’outil peut être installé et exécuté sur de nombreuses distributions Linux* et Windows* actuelles, voir Installation sous Linux* et Windows*.

À partir de la version 558, l’outil peut être installé sur Windows* à l’aide du programme d’installation MSI fourni et fonctionner sur n’importe quelle version de Windows® 10, Windows* Server 2016 ou ultérieure actuellement prise en charge par Microsoft. Consultez les informations sur la version de Windows* Server pour déterminer quelles versions de systèmes Windows* Server sont actuellement disponibles et prises en charge.

Pour une meilleure couverture, exécutez l’application dans le système racine d’un serveur. Il est possible de l’exécuter à l’intérieur d’un conteneur ou d’une machine virtuelle, mais sachez que certaines fonctionnalités peuvent être désactivées.

Processeurs pris en charge :

  • Intel® Xeon® 6 (nom de code Sierra Forest et Granite Rapids)
  • Processeurs Intel® Xeon® évolutifs de 5e génération (ancien nom de code Emerald Rapids)
  • Processeurs Intel® Xeon® évolutifs de 4e génération (ancien nom de code Sapphire Rapids)
  • Intel® Xeon® CPU Max Series (nom de code Sapphire Rapids HBM)
  • Processeurs Intel® Xeon® évolutifs de 3e génération (ancien nom de code Ice Lake et Cooper Lake)
  • Processeurs Intel® Xeon® évolutifs de 2e génération (ancien nom de code Cascade Lake)
  • Processeurs Intel® Xeon® évolutifs de 1re génération (ancien nom de code Skylake)
  • Famille de processeurs Intel® Xeon® E5 v4 (nom de code Broadwell)
  • Famille de processeurs Intel® Xeon® E7 v4 (nom de code Broadwell)

En outre, Intel a introduit une nouvelle fonctionnalité de fiabilité, de disponibilité et de facilité d’entretien (RAS) appelée Intel® In-Field Scan. Il s’agit d’une famille d’outils conçus pour aider les administrateurs système à trouver rapidement et facilement les processeurs qui sont tombés en panne au fil du temps. Pour plus d’informations sur Intel In-Field Scan, consultez ce lien.

Intel® In-Field Scan et Intel® DCDiag sont des outils de test complémentaires. Intel® In-Field Scan est minimalement intrusif et conçu pour tester rapidement un cœur, tandis que tous les autres cœurs du nœud continuent d’exécuter les charges de travail des clients. Intel® DCDiag est une suite de tests de processeurs complète, qui est plus efficace lorsque l’ensemble du nœud de traitement est dédié aux tests. Les outils exécutant des contenus de test différents, Intel a constaté que chaque outil identifie des défaillances différentes parmi les processeurs testés.

Intel® Data Center Diagnostic Tool pour Windows sur les processeurs Intel® Xeon®

Intel® Data Center Diagnostic Tool pour Linux sur les processeurs Intel® Xeon®

Comment tester le processeur Intel® Xeon® à l’aide de Intel® Data Center Diagnostic Tool

Note: Pour les développeurs : Intel a lancé le projet Open Data Center Diagnostic, qui ouvre le cadre de diagnostic du centre de données d’Intel et fournit des tests sélectionnés. Cela offre aux développeurs un cadre de développement de tests cohérent qui invite la créativité de la communauté Open-Source à améliorer la gestion de flotte dans le cloud grâce au développement d’écrans de test uniques et d’autres solutions innovantes. Pour plus d’informations, consultez cette infrastructure et ces tests.

Historique des versions

Date Version Description
07 juillet 2021 540 Version initiale
16 août 2022 549 Correction d’un bug
20 sept. 2022 549 Commande modifiée pour activer l’outil et vérifier l’activation
10 janv. 2023 550 Inclure les processeurs Intel® Xeon® de 4e génération
20 janv. 2023 576 Version 576 Release
Déc 14, 2023 594 Version 594 Release
22 mars 2024 603 Version 603 Release
22 avril 2024 605 Version 605 Release
21 juin 2024 612 Version 612 Release
22 juillet 2024 613 Version 613 : version du correctif
20 septembre 2024 621 Version 621 Release
12 décembre 2024 630 Version 630 Release
26 mars 2025 639 Version 639 Release

Avis de non-responsabilité

Le contenu de cette page est une combinaison de traduction humaine et informatique du contenu original en anglais. Ce contenu vous est fourni pour votre commodité et à titre informatif seulement et ne saurait être totalement exact ou complet. En cas de contradiction entre la version anglaise de cette page et la traduction, c'est la version anglaise qui prévaut. Afficher la version anglaise de cette page.