ID de l'article: 000035277 Type de contenu: Dépannage Dernière révision: 14/11/2023

Comment déterminer l’emplacement du processeur et le banc de barrettes DIMM appropriés pour le Module de calcul Intel® HNS2600BPB

Environnement

OS Independent

BUILT IN - ARTICLE INTRO SECOND COMPONENT
En bref

Contenu de dépannage permettant de localiser un module de mémoire défectueux

Descriptif

Comment puis-je déterminer l’emplacement de l’unité centrale de traitement (CPU) (1 ou 2) et la banque de modules de mémoire DIMM (Dual In-line Memory Modules) en cas de suspicion de module de mémoire défectueux ?

Résolution

Procédez comme indiqué ci-dessous, qui se base sur les étapes de diagnostic visant à trouver le DIMM à l’origine d’un ECC_error IErr :

NoteAssurez-vous que l’outil ipmitool (voir IPMI, V2.0, Command Test Tool) est chargé ou disponible pour s’exécuter sur ce nœud. Cela vous permettra d’examiner le journal des événements système (qui est un binaire).
Note
Examinez le journal des événements système en examinant la liste étendue de la manière suivante :
#sudo ipmitool sel elist | Moins
1c | 24/08/2018 | 22 :51 :49 | Capteur ECC Mm de mémoire | ECC non corrigible | Affirmé
1D | 24/08/2018 | 22 :51 :49 | Capteur ECC Mm de mémoire | ECC non corrigible | Affirmé

Vous pouvez ensuite inspecter n’importe quelle entrée du journal des événements système en vous référant à la valeur hexadécimale (HEX) dans la première colonne :
#sudo ipmitool sel obtenir 0x1c
ID du dossier SEL : 001c
Type d’enregistrement : 02
Horodatage : 24/08/2018 22 :51 :48
ID du générateur : 0033
EvM Révision : 04
Type de capteur : Mémoire
Numéro de capteur : 02
Type d’événement : Descrete spécifique au capteur
Direction de l’événement : événement d’assertion
Données d’événements (RAW) : a10103
Interprétation de l’événement : Manquant
Description : ECC non corrigible

ID du capteur : Capteur Mmry ECC (0x2)
ID d’entité : 32.1 (Périphérique de mémoire)
Type de capteur : Mémoire (0x0c)



Déboguer l’emplacement du journal des données d’événement (RAW)

  1. Entrez ce nombre dans une calculatrice :
    User-added image
  2. Examinez la valeur binaire (BIN), en particulier les 8 derniers octets. Dans l’image ci-dessus, regardez les bits les plus à droite (en surbrillance).
    • Convertissez-le en décimal et, comme l’indique le tableau ci-dessous, les bits les plus à droite représentent la valeur du socket DIMM : 0=A, 1=B, 2=C,3=D, etc.

    Les deuxièmes bits les plus à droite représentent le socket du processeur.
    User-added image

    Dans ce cas, b0000 = CPU1. b0001 serait égal à CPU2.
Informations complémentaires

Lors de l’utilisation d’IPMI, il n’est pas possible d’obtenir le niveau de détail affiché dans l’interface utilisateur graphique Web (GUI) du contrôleur BMC (Baseboard Management Controller). Cependant, vous pouvez utiliser Redfish en exécutant la commande suivante : curl -k -u <user> :<password> https://<ip>/redfish/v1/Systems/<serial #>/LogServices/SEL/Entries ?$skiptoken=0.

Note

SkipToken est l’endroit où commencer. Il retournera normalement 50 enregistrements, donc skiptoken sera 0, 50, 100, et ainsi de suite. À la fin de la réponse, il vous indique quel devrait être le prochain skiptoken pour continuer à lire.

Vous pouvez également utiliser la Intel® Server Debug and Provisioning Tool (Intel® SDP Tool) de votre système de gestionnaire de serveur en exécutant la commande SDPtool <ipv4> <username> <password> debuglog <filename> .

Le contenu de cette page est une combinaison de traduction humaine et informatique du contenu original en anglais. Ce contenu vous est fourni pour votre commodité et à titre informatif seulement et ne saurait être totalement exact ou complet. En cas de contradiction entre la version anglaise de cette page et la traduction, c'est la version anglaise qui prévaut. Afficher la version anglaise de cette page.