Gestion thermique des processeurs Intel® Xeon® évolutifs de 1re génération

Documentation

Maintenance et performances

000006710

16/10/2024

Cliquez sur la rubrique pour plus d’informations :

Vue d’ensemble de la gestion thermique

Pour les processeurs en boîte et en plateau, visitez : Quelle est la différence entre les processeurs Intel® en boîte et en plateau ?

Qu’est-ce que la solution de gestion thermique ?

La solution de gestion thermique des processeurs Intel® Xeon® évolutifs, destinée au multitraitement 4 ou 8 voies, est spécifique au fabricant de la carte mère et du châssis. Tous les processeurs évolutifs en boîte Intel® Xeon® sont vendus sous forme de kit comprenant :

  • Solution thermique
  • Carte mère
  • Châssis
  • Alimentation

Pour obtenir les spécifications de gestion thermique, reportez-vous à la fiche technique du fabricant du système ou Intel® Xeon® processeur. Le processeur soufflerie (PWT) est uniquement destiné à être utilisé avec un serveur à usage général (2U et plus) Intel® Xeon® un processeur évolutif, et non le processeur MP Intel Xeon ou le processeur Intel Xeon pour serveurs montés en rack 1U.

Pouvez-vous me donner quelques notions de base sur la gestion thermique ?

Les systèmes utilisant des processeurs Intel® Xeon® évolutifs nécessitent une gestion thermique. Ce document suppose une connaissance et une expérience générales du fonctionnement, de l’intégration et de la gestion thermique des systèmes. Les intégrateurs qui suivent les recommandations présentées peuvent fournir à leurs clients des systèmes plus fiables et verront moins de clients revenir avec des problèmes de gestion thermique. (Le terme processeurs en boîte Intel® Xeon® processeurs évolutifs désigne les processeurs emballés pour être utilisés par les intégrateurs de systèmes.)

La gestion thermique des systèmes basés sur des processeurs Intel® Xeon® évolutifs peut affecter à la fois les performances et le niveau de bruit du système. Les processeurs Intel® Xeon® évolutifs utilisent la fonction de surveillance thermique pour protéger le processeur lorsque le silicium fonctionnerait au-delà des spécifications. Dans un système bien conçu, la fonction Moniteur thermique ne doit jamais devenir active. Cette fonction est conçue pour fournir une protection dans des circonstances inhabituelles telles que des températures de l’air ambiant supérieures à la normale ou une défaillance d’un composant de gestion thermique du système (tel qu’un ventilateur de système). Tant que la fonction Moniteur thermique est active, les performances du système peuvent tomber en dessous de son niveau de performance de pointe normal. Il est essentiel que les systèmes soient conçus pour maintenir des températures ambiantes internes suffisamment basses pour empêcher les processeurs Intel® Xeon® évolutifs d’entrer dans un état actif de surveillance thermique. Vous trouverez des informations sur la fonctionnalité Moniteur thermique dans la fiche technique des processeurs évolutifs Intel® Xeon®.

De plus, le dissipateur thermique des processeurs Intel® Xeon® évolutifs utilise une solution de conduit actif appelée soufflerie de processeur (PWT), qui comprend un ventilateur de haute qualité. Ce ventilateur de processeur fonctionne à une vitesse constante. Ce conduit fournit une circulation d’air adéquate à travers le dissipateur thermique du processeur tant que la température ambiante est maintenue en dessous de la spécification maximale.

Permettre aux processeurs de fonctionner à des températures supérieures à leur température de fonctionnement maximale spécifiée peut raccourcir la durée de vie du processeur et entraîner un fonctionnement peu fiable. Le respect des spécifications de température du processeur relève en dernier ressort de la responsabilité de l’intégrateur système. Lors de la construction de systèmes qualité utilisant le processeur Intel Xeon, il est impératif d’examiner attentivement la gestion thermique du système et de vérifier la conception du système avec des tests thermiques. Ce document détaille les exigences thermiques spécifiques du processeur Intel Xeon. Les intégrateurs de systèmes utilisant le processeur Intel Xeon sont invités à se familiariser avec ce document.

Qu’est-ce qu’une bonne gestion thermique ?

Une bonne gestion thermique dépend de deux éléments majeurs : un dissipateur thermique correctement monté sur le processeur et une circulation efficace de l’air dans le châssis du système. Le but ultime de la gestion thermique est de maintenir le processeur à sa température de fonctionnement maximale ou en dessous.

Une gestion thermique correcte est obtenue lorsque la chaleur est transférée du processeur à l’air du système, qui est ensuite évacué du système. Les processeurs en boîte Intel® Xeon® évolutifs sont livrés avec un radiateur et le PWT, qui peuvent transférer efficacement la chaleur du processeur dans l’air du système. Il incombe à l’intégrateur de systèmes d’assurer une circulation d’air adéquate. Les processeurs évolutifs en plateau Intel® Xeon® ne sont pas livrés avec un radiateur et le PWT, il est de la responsabilité de l’intégrateur de système de garantir une circulation d’air adéquate.

Opérations de gestion thermique

Comment installer le radiateur ? Vous devez fixer solidement le dissipateur thermique (inclus avec les processeurs Intel® Xeon® évolutifs en boîte) au processeur. Le matériau d’interface thermique (appliqué lors de l’intégration du système) assure un transfert de chaleur efficace du processeur au radiateur du ventilateur.

Critique: L’utilisation du processeur en boîte sans appliquer correctement le matériau d’interface thermique inclus annulera la garantie du processeur en boîte et pourrait endommager le processeur. Veillez à suivre les procédures d’installation documentées dans le manuel du processeur en boîte et dans la présentation de l’intégration.

Le ventilateur de la soufflerie du processeur est un ventilateur à roulement à billes de haute qualité qui fournit un bon flux d’air local. Ce flux d’air transfère la chaleur du dissipateur thermique à l’air à l’intérieur du système. Cependant, déplacer la chaleur vers l’air du système n’est que la moitié de la tâche. Un débit d’air suffisant du système est également nécessaire pour évacuer l’air. Sans un flux constant d’air à travers le système, le dissipateur thermique du ventilateur fera recirculer de l’air chaud et ne refroidira donc pas le processeur adéquatement.

Comment gérer le flux d’air du système ?

Voici les facteurs qui déterminent la circulation de l’air du système :

  • Conception du châssis
  • Taille du châssis
  • Emplacement des orifices d’entrée et de sortie d’air du châssis
  • Capacité du ventilateur d’alimentation et ventilation
  • Emplacement du ou des emplacements du processeur
  • Emplacement des cartes d’extension et des câbles

Les intégrateurs de système doivent assurer une circulation d’air adéquate dans le système pour permettre au dissipateur thermique de fonctionner efficacement. Une attention particulière à la circulation de l’air lors de la sélection des sous-ensembles et des systèmes de bâtiment est importante pour une bonne gestion thermique et un fonctionnement fiable du système.

Les intégrateurs utilisent deux formats de base carte mère-châssis-alimentation pour les serveurs et les stations de travail : les variantes ATX et l’ancien facteur de forme Server AT. En raison de considérations de refroidissement et de tension, Intel recommande l’utilisation de cartes mères et de châssis au format ATX pour les processeurs évolutifs Intel® Xeon® conditionnés.

Les cartes mères au format Server AT ne sont pas recommandées car ces conceptions ne sont pas normalisées pour une gestion thermique efficace. Cependant, certains châssis conçus exclusivement pour les cartes mères au format Server AT peuvent offrir un refroidissement efficace.

Voici une liste de directives à utiliser lors de l’intégration d’un système :

  • Les orifices d’aération du châssis doivent être fonctionnels et ne pas être en quantité excessive : Les intégrateurs doivent veiller à ne pas choisir des châssis qui contiennent uniquement des évents cosmétiques. Les évents cosmétiques sont conçus pour donner l’impression qu’ils permettent la circulation de l’air, mais qu’il existe peu ou pas de flux d’air. Les châssis présentant des bouches d’aération excessives doivent également être évités. Dans ce cas, très peu d’air circule sur le processeur et les autres composants. Dans les châssis ATX, des blindages d’E/S doivent être présents. Sinon, l’ouverture des E/S peut entraîner une ventilation excessive.
  • Les évents doivent être correctement situés : Les systèmes doivent être munis d’évents d’entrée et d’évacuation bien situés. Les meilleurs emplacements pour les entrées d’air permettent à l’air de pénétrer dans le châssis et de circuler directement sur le processeur. Les orifices d’évacuation doivent être placés de manière à ce que l’air circule sur un chemin à travers le système, sur divers composants, avant de sortir. L’emplacement précis des évents dépend du châssis. Pour les systèmes ATX, les orifices d’échappement doivent être situés à la fois à l’avant et en bas à l’arrière du châssis. De plus, pour les systèmes ATX, des blindages d’E/S doivent être présents pour permettre au châssis d’évacuer l’air comme prévu. L’absence de blindage des E/S peut perturber la circulation de l’air dans le châssis.
  • Direction du flux d’air de l’alimentation : Il est important de choisir un bloc d’alimentation doté d’un ventilateur qui évacue l’air dans la bonne direction. Certaines alimentations possèdent des marquages indiquant la direction du flux d’air.
  • Puissance du ventilateur de l’alimentation : Les blocs d’alimentation des PC contiennent un ventilateur. Pour certains châssis dont le processeur est trop chaud, le remplacement par un bloc d’alimentation doté d’un ventilateur plus puissant peut grandement améliorer la circulation de l’air.
  • Ventilation de l’alimentation : Beaucoup d’air circule à travers le bloc d’alimentation, ce qui peut constituer une restriction importante s’il n’est pas bien ventilé. Choisissez un bloc d’alimentation doté de grandes bouches d’aération. Les protège-doigts en fil de fer pour le ventilateur de l’alimentation offrent beaucoup moins de résistance au flux d’air que les ouvertures estampées dans le boîtier en tôle du bloc d’alimentation.
  • Ventilateur du système - Doit-il être utilisé ? Certains châssis peuvent contenir un ventilateur de système (en plus du ventilateur du bloc d’alimentation) pour faciliter la circulation de l’air. Un ventilateur de système est généralement utilisé avec des dissipateurs thermiques passifs. Dans certaines situations, un ventilateur de système améliore le refroidissement du système. Les tests thermiques avec et sans ventilateur du système révéleront quelle configuration est la meilleure pour un châssis spécifique.
  • Direction du flux d’air du ventilateur du système : Lorsque vous utilisez un ventilateur système, veillez à ce qu’il aspire l’air dans la même direction que le flux d’air global du système. Par exemple, un ventilateur de système dans un système ATX doit agir comme un ventilateur d’extraction, aspirant l’air de l’intérieur du système par les évents arrière ou avant du châssis.
  • Protégez-vous contre les points chauds : Un système peut avoir un fort flux d’air, mais contenir des points chauds. Les points chauds sont des zones du châssis qui sont nettement plus chaudes que le reste de l’air du châssis. Un mauvais positionnement du ventilateur d’extraction, des cartes adaptateurs, des câbles ou des supports de châssis et des sous-ensembles bloquant la circulation d’air dans le système peut créer de telles zones. Pour éviter les points chauds, placez les ventilateurs d’extraction au besoin, replacez les cartes adaptatrices pleine longueur ou utilisez des cartes demi-longueur, redirigez et attachez les câbles, et veillez à ce qu’un espace soit prévu autour et au-dessus du processeur.
Comment effectuer des tests thermiques ?

Les différences au niveau des cartes mères, des blocs d’alimentation, des périphériques d’extension et du châssis affectent toutes la température de fonctionnement des systèmes et des processeurs qui les exécutent. Les tests thermiques sont fortement recommandés lors du choix d’un nouveau fournisseur de cartes mères ou de châssis, ou lorsque vous commencez à utiliser de nouveaux produits. Les tests thermiques peuvent déterminer si une configuration châssis-alimentation-carte mère spécifique fournit un flux d’air suffisant pour les processeurs en boîte Intel® Xeon® évolutifs. Pour commencer à déterminer la meilleure solution thermique pour vos systèmes Intel® Xeon® basés sur des processeurs évolutifs, contactez le fournisseur de votre carte mère pour obtenir des recommandations sur la configuration des châssis et des ventilateurs.

Capteur thermique et octet de référence thermique
Les processeurs Intel® Xeon® évolutifs possèdent des capacités de gestion de système uniques. L’une d’entre elles est la capacité de surveiller la température centrale du processeur par rapport à un réglage maximal connu. Le capteur thermique du processeur affiche la température actuelle du processeur et peut être traité via le bus de gestion système (SMBus). Un octet thermique (8 bits) d’informations peut être lu à partir du capteur thermique à tout moment. La granularité thermique des octets est de 1°C. La lecture du capteur thermique est ensuite comparée à l’octet de référence thermique.

L’octet de référence thermique est également disponible dans la ROM d’informations sur le processeur du SMBus. Ce nombre de 8 bits est enregistré lors de la fabrication du processeur. L’octet de référence thermique contient une valeur préprogrammée qui correspond à la lecture du capteur thermique lorsque le processeur est sollicité jusqu’à sa spécification thermique maximale. Par conséquent, si la lecture d’octets thermiques du capteur thermique dépasse l’octet de référence thermique, le processeur fonctionne plus chaud que ne le permettent les spécifications.

Solliciter chacun des processeurs d’un système entièrement configuré, lire le capteur thermique de chaque processeur et le comparer à l’octet de référence thermique de chaque processeur pour déterminer s’il fonctionne dans le respect des spécifications thermiques permet d’effectuer des tests thermiques. Un logiciel capable de lire les informations du SMBus est nécessaire pour lire à la fois le capteur thermique et l’octet de référence thermique.

Procédure d’essai thermique
La procédure d’essai thermique est la suivante :

Note Si vous testez un système avec un ventilateur de système à vitesse variable, vous devez exécuter le test à la température maximale de la salle de fonctionnement que vous avez spécifiée pour le système.
  1. Pour garantir une consommation électrique maximale pendant le test, vous devez désactiver les modes de mise hors tension automatique ou les fonctions vertes du système. Ces fonctionnalités sont contrôlées soit dans le BIOS système, soit par les pilotes du système d’exploitation.
  2. Configurez une méthode pour enregistrer la température ambiante, soit avec un thermomètre précis, soit une combinaison thermocouple et compteur thermique.
  3. Mettez le poste de travail ou le serveur sous tension. Si le système a été assemblé correctement et que le processeur est correctement installé et inséré, le système démarre dans le système d’exploitation (OS) prévu.
  4. Invoquez l’application thermiquement stressante.
  5. Laissez le programme fonctionner pendant 40 minutes. Cela permet à l’ensemble du système de chauffer et de se stabiliser. Enregistrez la lecture du capteur thermique de chaque processeur une fois toutes les 5 minutes pendant les 20 minutes suivantes. Notez la température ambiante à la fin de la période de 1 heure.
Après avoir enregistré la température ambiante, mettez le système hors tension. Retirez le couvercle du châssis. Laisser le système refroidir au moins 15 minutes.

En utilisant la plus élevée des quatre mesures prises à partir du capteur thermique, suivez la procédure de la section suivante pour vérifier la gestion thermique du système.

Calcul pour vérifier la solution de gestion thermique d’un système
Cette section explique comment déterminer si un système peut fonctionner à la température de fonctionnement maximale tout en maintenant le processeur dans sa plage de fonctionnement maximale. Le résultat de ce processus indique si le flux d’air du système doit être amélioré ou si la température de fonctionnement maximale du système doit être révisée afin de produire un système plus fiable.

La première étape consiste à sélectionner une température maximale dans la salle d’opération pour le système. Une valeur commune pour les systèmes où la climatisation n’est pas disponible est de 40 °C. Cette température dépasse la température externe maximale recommandée pour les plateformes basées sur les processeurs Intel® Xeon® évolutifs, mais elle peut être utilisée si le châssis utilisé ne dépasse pas la température d’entrée du ventilateur de 45 °C. Une valeur commune pour les systèmes où la climatisation est disponible est de 35 ° C. Choisissez la valeur qui convient à votre client. Écrivez cette valeur à la ligne A ci-dessous.

Notez la température ambiante enregistrée après le test sur la ligne B ci-dessous. Soustrayez la ligne B de la ligne A et écrivez le résultat sur la ligne C. Cette différence compense le fait que l’essai a probablement été effectué dans une pièce plus froide que la température maximale de fonctionnement du système.

A. _________ (température maximale de fonctionnement, généralement 35 °C ou 40 °C)

B. - _______ Température ambiante °C à la fin de l’essai

C. _________

Inscrivez la température la plus élevée enregistrée à partir du compteur thermique sur la ligne D ci-dessous. Copiez le numéro de la ligne C à la ligne E ci-dessous. Ajoutez la ligne D et la ligne E et écrivez la somme à la ligne F. Ce nombre représente la lecture la plus élevée du capteur thermique pour le cœur de processeur lorsque le système est utilisé à la température maximale spécifiée de la salle de fonctionnement et d’exécution d’une application présentant des contraintes thermiques similaires. Cette valeur doit rester inférieure à la valeur d’octet de référence thermique. Écrivez la lecture d’octets de référence thermique à la ligne G.

D. _________ Lecture maximale du capteur thermique

E. + _______ Réglage max. de la température de fonctionnement à partir de la ligne C ci-dessus

F. _________ Lecture max. du capteur thermique dans une pièce du pire des cas

G. _________ Lecture d’octets de référence thermique

Les processeurs ne doivent pas fonctionner à des températures supérieures à leur température de fonctionnement maximale spécifiée, sinon des défaillances peuvent survenir. Les processeurs en boîte resteront conformes aux spécifications thermiques si la lecture du capteur thermique est inférieure à l’octet de référence thermique à tout moment.

Si la ligne F révèle que le cœur du processeur a dépassé sa température maximale, une action est nécessaire. Soit le flux d’air du système doit être considérablement amélioré, soit la température maximale de la salle de fonctionnement du système doit être abaissée.

Si le nombre de la ligne F est inférieur ou égal à l’octet de référence thermique, le système maintient le processeur en boîte dans les limites des spécifications dans des conditions de contrainte thermique similaires, même si le système fonctionne dans son environnement le plus chaud.

Pour résumer :
Si la valeur de la ligne F est supérieure à l’octet de référence thermique, deux options s’offrent à vous :

  1. Améliorer la circulation de l’air du système pour abaisser la température d’entrée du ventilateur du processeur (suivez les recommandations faites précédemment). Testez ensuite à nouveau le système.
  2. Choisissez une température maximale de salle d’opération inférieure pour le système. Gardez à l’esprit le client et l’environnement typique du système.
Après avoir implémenté l’une ou l’autre option, vous devez recalculer le calcul thermique pour vérifier la solution.

Conseils de test
Utilisez les conseils suivants pour réduire le besoin de tests thermiques inutiles :

  1. Lorsque vous testez un système qui prend en charge plusieurs vitesses de processeur, testez en utilisant le ou les processeurs qui génèrent le plus d’énergie. Les processeurs qui dissipent le plus d’énergie produiront le plus de chaleur. En testant le processeur le plus chaud pris en charge par la carte mère, vous pouvez éviter des tests supplémentaires avec des processeurs qui génèrent moins de chaleur avec la même configuration de carte mère et de châssis.

    La dissipation de puissance varie en fonction de la vitesse du processeur et du pas du silicium. Afin de choisir le processeur approprié pour les tests thermiques de votre système, reportez-vous au Tableau 1 pour connaître les chiffres de dissipation de puissance des processeurs en boîte Intel® Xeon® évolutifs. Les processeurs en boîte Intel® Xeon® évolutifs portent un numéro de spécification de test à 5 chiffres, commençant généralement par la lettre S.
  2. Le retrait thermique avec une nouvelle carte mère n’est pas nécessaire si toutes les conditions suivantes sont remplies :
    • La nouvelle carte mère est utilisée avec un châssis précédemment testé qui fonctionnait avec une carte mère similaire
    • Le test précédent a montré la configuration pour fournir un débit d’air adéquat
    • Le processeur se trouve à peu près au même endroit sur les deux cartes mères
    • Un processeur avec une dissipation de puissance égale ou inférieure sera utilisé sur la nouvelle carte mère
  3. La plupart des systèmes sont mis à niveau (RAM supplémentaire, cartes adaptateurs, lecteurs, etc.) à un moment ou à un autre de leur vie. Les intégrateurs doivent tester des systèmes sur lesquels des cartes d’extension sont installées afin de simuler un système qui a été mis à niveau. Une solution de gestion thermique qui fonctionne bien dans un système fortement chargé n’a pas besoin d’être testée à nouveau pour les configurations faiblement chargées.

Spécifications de gestion thermique

Quelles sont les spécifications thermiques des processeurs Intel® Xeon® évolutifs ?

La fiche technique des processeurs Intel® Xeon® évolutifs (également répertoriée dans le tableau 1) répertorie la dissipation de puissance des processeurs évolutifs Intel® Xeon® à différentes fréquences de fonctionnement. Pour les processeurs Intel® Xeon® évolutifs, le processeur à la fréquence la plus élevée disponible dissipera plus d’énergie que les fréquences inférieures. Lors de la construction de systèmes qui présenteront de nombreuses fréquences de fonctionnement, les tests doivent être effectués en utilisant la fréquence la plus élevée prise en charge par le processeur, car il dissipe le plus de puissance. Les intégrateurs système peuvent effectuer des tests thermiques à l’aide de thermocouples pour déterminer la température du dissipateur de chaleur intégré du processeur (voir la fiche technique des processeurs évolutifs Intel® Xeon® pour plus de détails).

Note Étant donné que le PWT peut être configuré en mode vide ou en mode pression, la température d’entrée du conduit doit être prise de l’entrée dans le PWT, qui peut ne pas être du même côté que le ventilateur.

Une simple évaluation de la température de l’air entrant dans le dissipateur thermique du ventilateur peut donner confiance dans la gestion thermique du système. Pour les processeurs Intel® Xeon® évolutifs, le point de test se trouve au centre du concentrateur de ventilateur, à environ 0,3 pouce devant le ventilateur. L’évaluation des données de test permet de déterminer si un système dispose d’une gestion thermique suffisante pour le processeur en boîte. Les systèmes devraient avoir une température maximale prévue de 45 °C dans les conditions ambiantes externes maximales prévues (qui est généralement de 35 °C).

Tableau 1 : spécifications thermiques des processeurs Intel® Xeon® évolutifs 1,3

Fréquence du cœur du processeur (GHz) Température maximale du boîtier (°C) Température maximale recommandée d’entrée du ventilateur (°C) Puissance de dissipation thermique du processeur (W)
1.40 69 45 56.0
1.50 70 45 59.2
1.70 73 45 65.8
1,802 69 45 55.8
2 78 45 77.2
22 70 45 58
2.202 (étape B0) 72 45 61
2.202 (échelon C1) 75 45 61
2.402 (étape B0) 71 45 65
2.402 (échelon C1) 74 45 65
2,402,4(M0 step) 72 45 77
2,602 74 45 71
2.662 (échelon C1) 74 45 71
2.662 (échelon M0) 72 45 77
2.802 (échelon C1) 75 45 74
2,802,4 (échelon M0) 72 45 77
32 73 45 85
3.062 (échelon C1) 73 45 85
3.062 (étape MO) 70 45 87
3.22,4 (échelon M0) 71 45 92
Notes
  1. Ces spécifications sont tirées de la fiche technique du Intel® Xeon® processeurs évolutifs.
  2. Ce processeur est une matrice réduite à 0,13 micron.
  3. Les processeurs de bus frontal 400 MHz et de bus frontal de 533 MHz ont des caractéristiques thermiques identiques.
  4. Ces processeurs incluent ceux avec un cache iL3 de 1 Mo et 2 Mo (processeur de 3,2 GHz uniquement).
Quelles sont les recommandations concernant le châssis ?

Les intégrateurs système doivent utiliser un châssis ATX spécialement conçu pour prendre en charge les processeurs évolutifs Intel® Xeon®. Les châssis spécialement conçus pour prendre en charge les processeurs évolutifs Intel® Xeon® seront expédiés avec une prise en charge mécanique et électrique appropriée du processeur, en plus d’avoir des performances thermiques améliorées. Intel a testé l’utilisation de châssis avec des processeurs Intel® Xeon® évolutifs à l’aide de cartes mères tierces activées. Les châssis qui réussissent ce test thermique fournissent aux intégrateurs de systèmes un point de départ pour déterminer le châssis à évaluer.

Note Pour les démos sur le socket LGA3647, consultez :