Télémétrie du Cloud : faire progresser votre stratégie

Surveillez vos ressources plus efficacement afin d'optimiser les performances et le coût total de possession (TCO).

Présentation de la télémétrie du Cloud :

  • La télémétrie se rapporte à la surveillance et à l'analyse d'informations de systèmes informatiques visant à suivre les performances et à identifier les problèmes.

  • Les meilleures stratégies de télémétrie utilisent une approche holistique et multisystème pour identifier les mesures clés importantes pour l'entreprise et les opérations informatiques.

  • Les nouvelles frontières de la télémétrie comprennent l'intelligence artificielle (IA) et l'analytique prédictive permettant de détecter et, dans certains cas, de résoudre des problèmes sans intervention humaine.

author-image

Par

Qu'est-ce que la télémétrie du Cloud ?

La télémétrie du Cloud utilise des outils logiciels pour enregistrer et analyser des informations sur l'infrastructure informatique qui seraient autrement difficiles à regrouper.

Dans la gestion du Cloud, la télémétrie est extrêmement importante : pour un être humain, l'infrastructure informatique semble très similaire, que le matériel fonctionne de manière optimale ou non. La télémétrie offre aux professionnels de l'informatique la possibilité d'observer les composants et de surveiller les applications de manière plus approfondie, grâce à des mesures de performance, d'utilisation, de consommation électrique et plus encore.

En utilisant efficacement la télémétrie, les organisations peuvent améliorer des indicateurs de performance clés, notamment en matière de coût total de possession, de fiabilité, de performance et de consommation électrique. La télémétrie peut également fournir des renseignements qui aident les équipes informatiques à gérer les exigences de capacité changeantes et à déterminer si l'infrastructure est utilisée efficacement.

Grâce aux avancées récentes réalisées dans la télémétrie et l'orchestration du Cloud, les organisations peuvent progresser vers un centre de données véritablement moderne et autonome. L'IA et l'analytique prédictive de la télémétrie du Cloud peuvent prévoir les pannes et d'autres problèmes, et parfois même les résoudre sans intervention humaine.

Optimiser l'infrastructure grâce à la télémétrie

Les capacités télémétriques sont devenues plus robustes ces dernières années. Les nouvelles mesures et techniques, rendues disponibles grâce à un matériel avancé, permettent de surveiller et d'analyser le Cloud de manière plus approfondie que les technologies de générations précédentes. L'obtention de valeur et de performances de l'infrastructure nécessite une approche holistique et multisystème de la télémétrie.

Serveur
La protection des investissements en matériel nécessite une télémétrie de serveur permettant un examen approfondi de l'état du serveur. Les mesures liées à la consommation électrique et à la circulation volumétrique de l'air, ainsi qu'à la chaleur et au refroidissement, peuvent aider à identifier des problèmes qui pourraient compromettre l'état du matériel. La surveillance et l'équilibrage de la charge du serveur, ainsi que le suivi de la mémoire du serveur, sont également des considérations importantes.

Calcul
Grâce à une télémétrie efficace, les entreprises peuvent gérer les ressources de calcul plus efficacement. La télémétrie peut détecter l'utilisation par cœur et comparer les pourcentages d'utilisation du processeur aux caractéristiques des composants. Si un processeur ne fonctionne pas efficacement, le service informatique peut le dépanner ou le remplacer afin d'atteindre les niveaux de performance attendus.

Mémoire
La télémétrie des modules de mémoire à double rangée (DIMM) classiques se concentre sur la prévision des défaillances. Comme les problèmes d'un DIMM spécifique concernent souvent à un lot entier, la télémétrie peut aider à déterminer quels autres DIMM remplacer pour réduire les pannes. Les modules de mémoire persistante (PMM) modernes comme la mémoire persistante Intel® Optane™ autorisent une télémétrie plus robuste. En effet, les PMM possèdent un analyseur d'endurance utilisant une durée de vie prévue pour améliorer la maintenance prédictive.

Stockage
Les lecteurs SSD ont mené à des améliorations importantes des capacités télémétriques. Ces lecteurs, notamment les unités de stockage SSD Intel®, possèdent des outils d'analyse de l'état qui fournissent des renseignements concernant les performances et la durée de vie restante. Alors que l'état des lecteurs se détériore progressivement, la télémétrie permet de prévoir quand les lecteurs tomberont en panne.

Réseaux
La télémétrie d'infrastructure réseau a progressé ces dernières années. Alors que les pilotes existants permettaient uniquement d'examiner les E/S et les performances, les nouveaux pilotes peuvent offrir une vue plus complète de l'utilisation du réseau. Grâce aux cartes réseau intelligentes FPGA, l'équilibrage de la charge peut être géré étroitement afin de décharger les ressources de traitement centrales des charges de travail réseau.

Applications
La télémétrie, utilisée dans le cadre de la surveillance des applications, peut déterminer plus précisément si les applications répondent aux caractéristiques nominales. Les équipes informatiques peuvent analyser la latence et les délais d'expiration du chargement, ainsi que d'autres mesures liées à l'état général des applications.

En utilisant efficacement la télémétrie, les organisations peuvent améliorer des indicateurs de performance clés, notamment en matière de coût total de possession, de fiabilité, de performance et de consommation électrique.

Stratégie télémétrique : conseils utiles

Il n'y a pas de stratégie « taille unique » en télémétrie. Votre infrastructure existante, les considérations de coût à court et à long terme et les objectifs commerciaux détermineront l'orientation globale de votre stratégie.

Cependant, certains principes de base s'appliquent à toute organisation souhaitant se préparer pour l'avenir avec une stratégie télémétrique moderne :

  • Le moins est un plus : alors que la télémétrie se concentre sur la collecte d'informations concernant le matériel et les logiciels, les données ne sont pas toutes d'une importance égale. Les informations sont souvent surcollectées et sous-utilisées. Il est important d'identifier les mesures appropriées à suivre.
  • Avancez pas à pas : l'analyse des charges de travail est un processus en quatre étapes, commençant par une bonne connaissance de l'état de la plateforme et la validation du matériel. Ensuite, utilisez la caractérisation pour mieux comprendre le comportement du système. Équilibrez votre plateforme pour des charges de travail spécifiques grâce à la gestion de l'infrastructure matérielle. Une fois que l'infrastructure matérielle est en place, établissez le profil et optimisez les logiciels afin d'identifier les manques d'efficacité.
  • Devenez prédictif : les nouveaux matériels et outils permettent de voir les problèmes avant qu'ils se produisent. En passant à un matériel qui peut mesurer son propre état et sa durée de vie restante, vous pouvez élaborer une stratégie de maintenance prédictive, plutôt que réactive, qui réduit les pannes et les interruptions de service.
  • Automatiser les décisions : alors que la télémétrie progresse dans l'identification des problèmes, l'exploration des données peut vous aider à prendre de meilleures décisions sur l'optimisation de l'utilisation et des performances. En détectant comment les charges de travail ont été équilibrées et comment les composants ont été utilisés précédemment, l'exploration des données liées à l'infrastructure peut éclairer les décisions concernant l'avenir. Beaucoup de ces décisions peuvent même être prises automatiquement après avoir formé des modèles d'IA, afin que les performances et la consommation d'énergie puissent être optimisées sans intervention humaine.

Les capacités télémétriques évoluent souvent en parallèle avec les avancées de l'infrastructure, par exemple, alors que de nouveaux types de matériel permettent de réaliser de nouvelles mesures. Considérez chaque nouveau composant ajouté à votre configuration actuelle et déterminez s'il affecte votre stratégie et vos mesures clés.

Outils Intel de télémétrie du Cloud

Chez Intel, nous nous engageons à aider les entreprises à comprendre comment utiliser la télémétrie efficacement et à trouver les mesures importantes. De la télémétrie matérielle aux kits et structures de développement pour ingénieurs de performances, la technologie Intel® s'efforce d'améliorer la télémétrie du Cloud moderne.

Intel a porté la télémétrie jusqu'au silicium avec ses unités de surveillance des performances avancées (Intel® PMU). Ce matériel sophistiqué sur puce offre une télémétrie plus robuste grâce à des mesures et un diagnostic avancés. Nous continuons de faire évoluer les PMU parallèlement aux mises à jour de l'architecture.

Grâce à Intel® Telemetry Collector (ITC), les équipes informatiques peuvent analyser et voir rapidement des visualisations sur les performances de toute une gamme de systèmes. ITC vous permet d'accéder à la même collection d'outils que les propres ingénieurs de performances d'Intel utilisent dans un examen des performances.

À mesure que les capacités télémétriques évoluent, Intel poursuivra sa mission d'innovation et d'éducation dans toutes les phases d'analyse et d'optimisation des charges de travail. De l'analytique prédictive et augmentée aux avancées réalisées dans la télémétrie matérielle, nous sommes heureux d'offrir à nos clients la technologie de l'avenir, dès maintenant.