Passer au Contenu principal
Base de connaissances pour l’assistance

L’analyse® Intel sur le terrain des processeurs Intel® Xeon® de 5e génération améliore la gestion du parc de serveurs

Type de contenu: Installation et configuration   |   ID de l'article: 000099537   |   Dernière révision: 31/01/2025

Présentation de l’analyse Intel® sur le terrain

Les processeurs Intel® Xeon® Scalable de 5e génération, anciennement connus sous le nom de code Emerald Rapids, ont introduit une nouvelle fonctionnalité de fiabilité, de disponibilité et de facilité d’entretien (RAS) appelée Intel® In-Field Scan. Il s’agit d’une famille d’outils conçus pour aider les administrateurs système à trouver rapidement et facilement les processeurs qui sont tombés en panne au fil du temps. Intel® In-Field Scan dispose d’une feuille de route des capacités qui seront incluses sur les processeurs actuels et futurs. L’analyse sur le terrain (SAF) et l’autotest intégré à la matrice (BIST) sont les deux premières fonctionnalités de la famille In-Field Scan, et les deux sont disponibles sur les processeurs Intel® Xeon® de 5e génération.

Intel® In-Field Scan est minimalement intrusif et conçu pour tester rapidement un cœur, tandis que tous les autres cœurs du nœud continuent d’exécuter les charges de travail des clients.

    Résumé de l’analyse sur le terrain

    Scan* est une méthode standard de l’industrie pour détecter les défauts des dispositifs à semi-conducteurs. Jusqu’à présent, le scan était utilisé par des équipements de test spécialisés dans les usines de fabrication de puces. Intel utilise l’analyse pour tester les processeurs lors de la fabrication en gros volumes (HVM).

    Scan-At-Field permet aux clients d’exécuter un sous-ensemble de tests d’analyse de fabrication d’Intel pour vérifier si les cœurs de traitement individuels présentent des défauts. À l’aide de modèles de test fournis par Intel (appelés images de test de numérisation), chaque cœur du package du processeur peut être testé indépendamment pour confirmer son bon fonctionnement.

    Auto-test intégré de la batterie (BIST)

    L’utilitaire BIST de la matrice vérifie les caches L1 (niveau 1) et L2 (niveau 2) ainsi que de nombreux fichiers de registres et tableaux de données de chaque cœur. Étant un auto-test intégré (BIST), il n’y a pas d’images de test à charger. Tous les tests sont coordonnés par un module de test dédié dans chaque cœur.

    Plus d’informations

    Un aperçu technique de haut niveau de SAF et ArrayBIST est fourni dans le document technique Finding Faulty Components in a Live Fleet Environment. Vous trouverez des détails sur la configuration système requise et la manière d’exécuter l’analyse sur le terrain dans le Guide d’activation de l’analyse Intel sur le terrain pour le processeur Intel® Xeon® de 5e génération.

    Intel® In-Field Scan est une avancée importante dans le domaine des services de fiabilité et de disponibilité, car il permet aux clients d’utiliser les capacités de test de l’industrie pour identifier rapidement les unités défectueuses de leur parc.

    Configuration requise

    Il existe des exigences matérielles et logicielles pour activer Intel® In-Field Scan sur une plate-forme. Vous trouverez ci-dessous un résumé des exigences.

    • Un processeur Intel® Xeon® qui prend en charge Intel® In-Field Scan
    • Numériser les images de test (analyser les modèles de test pour les cœurs)
    • Le pilote de l’appareil Intel® In-Field Scan Linux
    • L’application Intel® In-Field Scan

    Tests et résultats des tests

    Intel® In-Field Scan est conçu et optimisé pour être utilisé par les administrateurs système afin de tester périodiquement le parc afin de s’assurer que les processeurs fonctionnent correctement. Intel® In-Field Scan fournit aux administrateurs système un test de processeur très rapide qui peut être exécuté sur des nœuds actifs (c’est-à-dire un nœud qui est en ligne et exécute des applications utilisateur) sans interrompre le fonctionnement de l’ensemble du nœud. Dans ce cas, le terme très rapide signifie ~200ms ou moins.

    Des tests périodiques de la flotte sont recommandés pour trouver les composants qui sont défectueux au fil du temps. La question de savoir à quelle fréquence tester la flotte et quelle est l’étendue d’un test à effectuer. De nombreuses variables entrent en jeu, par exemple : depuis combien de temps le processeur fonctionne-t-il ; quel est le taux prévu de défaillance dans le temps (FIT) 2 du processeur ; quelle est la tolérance du client pour les SDE (Silent Data Errors) ; et le temps que l’administrateur système est prêt à consacrer à la maintenance proactive du système.

    Le document technique Finding Faulty Components in a Live Fleet Environment fournit des considérations et un exemple de la fréquence à laquelle l’analyse sur le terrain peut être exécutée.

    Le guide d’activation® de l’analyse Intel sur le terrain des processeurs Intel Xeon de 5e génération contient des informations détaillées sur l’exécution, les tests et la compréhension des résultats.

    ® Les images de test Intel In-Field Scan Scan pour processeurs d’Intel® Xeon® de 5e génération et les instructions pour vérifier la version ou charger une nouvelle image sont publiées (compte NDA requis - Comment demander un centre de ressources et de documentation Intel®).

    L’application Intel In-Field Scan est publiée (compte NDA® requis - Comment postuler pour un centre de ressources et de documentation Intel®).

    Conclusion

    Dans un parc comprenant des centaines de milliers ou des millions de processeurs, des pannes peuvent se produire régulièrement. La détection de ces défauts le plus rapidement possible est essentielle pour minimiser les interruptions des opérations des clients.

    Intel est à la pointe du secteur en fournissant de multiples outils et une feuille de route de fonctionnalités pour tester le bon fonctionnement des processeurs. Intel® In-Field Scan développe ces capacités de test pour améliorer la gestion du parc par les administrateurs système.

    Intel propose également le Intel® Data Center Diagnostic Tool (Intel® DCDiag). Intel® DCDiag est une suite de tests qui vérifie méthodiquement la plupart des fonctionnalités du SoC, y compris celles de chaque cœur de microprocesseur. En vérifiant que chaque calcul DCDIAG est correct, et pas seulement en confirmant que le test s’est correctement exécuté, DCDIAG est capable de détecter de nombreux types de défauts, y compris ceux qui se manifestent par des erreurs de données silencieuses. Pour plus d’informations sur Intel® DCDiag , consultez ce lien.

    Intel® In-Field Scan et Intel® DCDiag sont des outils de test complémentaires. Intel® In-Field Scan est minimalement intrusif et conçu pour tester rapidement un cœur, tandis que tous les autres cœurs du nœud continuent d’exécuter les charges de travail des clients. Intel® DCDiag est une suite de tests de processeurs complète, qui est plus efficace lorsque l’ensemble du nœud de traitement est dédié aux tests. Les outils exécutant des contenus de test différents, Intel a constaté que chaque outil identifie des défaillances différentes parmi les processeurs testés.

    Note: Les références des processeurs Intel® Xeon® de 5e génération ne prennent pas toutes en charge® Intel In-Field Scan.

    Téléchargements d’images de test de numérisation sur le terrain

    Produits associés

    Cet article s'applique aux produits 1.

    Avis de non-responsabilité

    Le contenu de cette page est une combinaison de traduction humaine et informatique du contenu original en anglais. Ce contenu vous est fourni pour votre commodité et à titre informatif seulement et ne saurait être totalement exact ou complet. En cas de contradiction entre la version anglaise de cette page et la traduction, c'est la version anglaise qui prévaut. Afficher la version anglaise de cette page.