Qu’est-ce que ça veut dire ?
Un IERR est une erreur catastrophique signalée par le processeur, mais généralement causée par des périphériques extérieurs au cœur du processeur (par exemple, mémoire, PCIe).
- L’exécution du processeur est au point mort, généralement en raison d’un événement extérieur au processeur.
- Ce problème est souvent accompagné d’un événement CATERR qui peut être recoupé pour plus d’informations.
Comment résoudre le problème :
Suivez ces étapes dans l’ordre :
- Consultez le journal des événements système (SEL) pour rechercher des événements de code de correction d’erreur (ECC). Une mémoire défectueuse peut déclencher un IERR.
- Examinez le SEL pour tout événement PCIe. Un dysfonctionnement des périphériques PCIe peut déclencher une IERR.
- Assurez-vous que les pilotes du système d’exploitation (SE) sont à jour pour le serveur ainsi que pour tout périphérique matériel récemment ajouté. Les pilotes de système d’exploitation obsolètes peuvent déclencher un IERR.
- Vérifiez les journaux du système d’exploitation pour toute entrée MCA (Machine Check Architecture) qui pourrait indiquer une défaillance matérielle qui aurait pu déclencher l’IERR.
- Confirmez que vous disposez de la dernière version du BIOS pour le système serveur.
- Accédez à Baseboard Management Controller Web Console > Configuration > Memory Configuration > Type PPR et définissez les paramètres PPR sur Hard (Matériel).
- Si les journaux confirment qu’un ou plusieurs modules de mémoire spécifiques peuvent être à l’origine du problème, réinstallez la ou les clés USB et surveillez le serveur pendant 24 heures.