Comment puis-je déterminer l’emplacement de l’unité centrale de traitement (CPU) (1 ou 2) et la banque de modules de mémoire DIMM (Dual In-line Memory Modules) en cas de suspicion de module de mémoire défectueux ?
Procédez comme indiqué ci-dessous, qui se base sur les étapes de diagnostic visant à trouver le DIMM à l’origine d’un ECC_error IErr :
Note | Assurez-vous que l’outil ipmitool (voir IPMI, V2.0, Command Test Tool) est chargé ou disponible pour s’exécuter sur ce nœud. Cela vous permettra d’examiner le journal des événements système (qui est un binaire). |
Note |
Examinez le journal des événements système en examinant la liste étendue de la manière suivante :
#sudo ipmitool sel elist | Moins
1c | 24/08/2018 | 22 :51 :49 | Capteur ECC Mm de mémoire | ECC non corrigible | Affirmé
1D | 24/08/2018 | 22 :51 :49 | Capteur ECC Mm de mémoire | ECC non corrigible | Affirmé Vous pouvez ensuite inspecter n’importe quelle entrée du journal des événements système en vous référant à la valeur hexadécimale (HEX) dans la première colonne : #sudo ipmitool sel obtenir 0x1c
ID du dossier SEL : 001c Type d’enregistrement : 02 Horodatage : 24/08/2018 22 :51 :48 ID du générateur : 0033 EvM Révision : 04 Type de capteur : Mémoire Numéro de capteur : 02 Type d’événement : Descrete spécifique au capteur Direction de l’événement : événement d’assertion Données d’événements (RAW) : a10103 Interprétation de l’événement : Manquant Description : ECC non corrigible ID du capteur : Capteur Mmry ECC (0x2) ID d’entité : 32.1 (Périphérique de mémoire) Type de capteur : Mémoire (0x0c) |
Déboguer l’emplacement du journal des données d’événement (RAW)
Lors de l’utilisation d’IPMI, il n’est pas possible d’obtenir le niveau de détail affiché dans l’interface utilisateur graphique Web (GUI) du contrôleur BMC (Baseboard Management Controller). Cependant, vous pouvez utiliser Redfish en exécutant la commande suivante : curl -k -u <user> :<password> https://<ip>/redfish/v1/Systems/<serial #>/LogServices/SEL/Entries ?$skiptoken=0.
Note |
SkipToken est l’endroit où commencer. Il retournera normalement 50 enregistrements, donc skiptoken sera 0, 50, 100, et ainsi de suite. À la fin de la réponse, il vous indique quel devrait être le prochain skiptoken pour continuer à lire. |
Vous pouvez également utiliser la Intel® Server Debug and Provisioning Tool (Intel® SDP Tool) de votre système de gestionnaire de serveur en exécutant la commande SDPtool <ipv4> <username> <password> debuglog <filename> .