Étapes de dépannage des erreurs indiquées dans les journaux concernant l’alimentation, l’alimentation électrique ou les ventilateurs
Exemples de messages d’erreur visibles dans les journaux :
- PSU2, ca perdu, ca retiré.
- Non redondant, suffisant pour ne pas être suffisant. Le système ne fonctionne pas en mode bloc d’alimentation redondant. Cet événement est accompagné d’une erreur spécifique du bloc d’alimentation, à l’heure de la suppression du courant (CA).
- Non redondant, insuffisant. Le système ne fonctionne pas en mode alimentation redondante.
Étape 1 :
- Mettre à jour le microprogramme du BIOS (FW) vers la dernière version disponible (version 22010091 ou plus récente). Des correctifs ont été ajoutés à la communication du microprogramme (FW) de l’unité de bloc d’alimentation (PSU) et du contrôleur BMC (Baseboard Management Controller). Vous pouvez vous référer aux notes de version du contrôleur BMC et de l’unité remplaçable sur site et de l’enregistrement des données du capteur (FRUSDR).
- Une fois que le bioS FW a été mis à jour, s’il reste des problèmes d’alimentation, suivez l’étape 2 ci-dessous.
Étape 2 :
Solution de contournement : plusieurs pannes d’alimentation détectées
- Si vous voyez des erreurs dans les journaux liées à l’alimentation électrique, aux blocs d’alimentation ou aux ventilateurs, Note la couleur des diodes électroluminescentes (LED) de statut etVérifier les capteurs pour voir si les mesures sont normales ou anormales.
- Les blocs d’alimentation (PS1, PS2, PS3) doivent être dans les plages normales pour l’alimentation d’entrée, le %curr out, la température d’entrée, la température et la redondance (2+1).
- Si les mesures du capteur semblent anormales, Effectuer dépannage pour voir lequel des processeurs PSU suspects sont en fait défectueux les échanger.
- Le problème suit-il l’échange de PSU ?
- Si les mesures du capteur semblent normales, mais qu’il y a des erreurs liées à l’alimentation dans les journaux, Vérifier les voyants d’état.
- Si des voyants ambres sont allumés tout le temps lors de l’exécution d’une lourde charge de travail, il existe une solution de contournement. L’exécution de la commande ci-dessous devrait faire disparaître le voyant ambre :
Commande : désactivez la redondance à froid du bloc d’alimentation. 0x30 0x2d 0x01 0x00 brute ipmitool
- Si l’exécution de la commande ci-dessus ne résout pas les problèmes signalés dans les journaux, et que vous avez déjà croisé les processeurs graphiques (en échangeant des processeurs autour), mais que le voyant est toujours ambre, l’alimentation suspecte devra être remplacée.
Fausse alerte : un rapport de nœud a été perdu
- Vérifier pour de fausses alertes.
- Si le voyant ambre s’efface, mais que vous voyez toujours les messages d’erreur perdus par CA dans les journaux, vérifiez si les journaux montrent les erreurs enregistrées par le nœud esclave.