HPC et IA : une combinaison puissante

Le machine learning et le deep learning renforcent le calcul intensif pour obtenir de nouvelles informations plus rapidement.

Plus de données et des analyses plus approfondies avec l'IA HPC

  • Les implémentations d'IA ont une affinité avec l'architecture de calcul du HPC, et l'IA et le HPC bénéficient de configurations similaires basées sur du matériel haute performance Intel®.

  • Les chercheurs du CERN utilisent des réseaux neuronaux convolutifs reposant sur la technologie Intel® qui intègrent les lois de la physique dans des modèles d'IA afin d'obtenir des résultats plus précis pour des cas d'utilisation concrets.

  • Intel aide à réduire les compromis à faire entre les plateformes dédiées à l'IA et au HPC grâce à l'accélération matérielle de l'IA, à la programmation unifiée des plateformes avec oneAPI et aux solutions simplifiées Intel® Select qui permettent de réduire les problèmes de conception et de déploiement des systèmes.

author-image

Par

HPC enrichi par l'IA

L'architecture requise pour les implémentations HPC présente de nombreuses similitudes avec les implémentations IA. Tous deux utilisent de hauts niveaux de calcul et de stockage, une grande capacité de mémoire et de bande passante, et des infrastructures haut débit pour obtenir des résultats, généralement en traitant des ensemble de données massifs de plus en plus volumineux. Le deep learning est une excellente solution pour les problèmes traités par le calcul intensif qui impliquent de très grands ensembles de données multidimensionnels. Par exemple, Quantifi a utilisé l'IA reposant sur la technologie Intel® pour calculer 700 fois plus vite que les méthodes traditionnelles l'évaluation des produits dérivés sur les marchés financiers1, fournissant des résultats en temps quasi-réel pour les charges de travail d'évaluation courantes.

La promesse de l'IA dans le domaine du calcul intensif est que les modèles d'IA peuvent renforcer l'analyse des ensembles de données par les experts afin de produire des résultats plus rapidement avec le même niveau de précision. Les principaux cas d'utilisation du HPC bénéficient des capacités avancées de l'IA, comme par exemple dans les cas suivants :

  • Analytique pour les services financiers (FSI), notamment la détection des risques et des fraudes, la logistique et la fabrication.
  • Conception de produits industriels, dynamique des fluides computationnelle (CFD), ingénierie assistée par ordinateur (CAE) et conception assistée par ordinateur (CAD).
  • Visualisation et simulation scientifiques, notamment dans des domaines tels que la physique des hautes énergies.
  • Regroupement de motifs, sciences de la vie, séquençage génomique et recherche médicale.
  • Exploration des sciences de la terre et du secteur de l'énergie.
  • Météo, météorologie et sciences du climat.
  • Astronomie et astrophysique.

Évolution des charges de travail

Bon nombre des cas d'utilisation actuels de l'IA sont limités à des déploiements en périphérie ou dans des centres de données, comme par exemple les systèmes de transport intelligents qui s'appuient largement sur des caméras intelligentes pour la reconnaissance des objets par l'IA. Les algorithmes utilisés par les modèles d'IA sont devenus beaucoup plus complexes, offrant un plus grand potentiel mais exigeant également davantage de puissance de calcul pour la découverte scientifique, l'innovation et les applications industrielles et commerciales. Le défi consiste à faire passer l'inférence de l'IA à des niveaux de calcul intensif ou à passer de la reconnaissance de schémas de circulation à une intersection au séquençage d'un génome en quelques heures plutôt qu'en quelques semaines.

Heureusement, la communauté HPC dispose de dizaines d'années d'expérience sur la manière de relever les défis que pose l'IA à grande échelle, tels que le besoin de plus de parallélisme, d'E/S rapides pour des ensembles de données massifs et d'une navigation efficace dans les environnements informatiques distribués. De telles capacités HPC peuvent contribuer à accélérer l'IA pour obtenir des résultats utiles, comme l'application d'heuristiques spécialisées par inférence de deep learning à des milliers de transactions, de charges de travail ou de simulations par seconde.

Réseaux neuronaux basés sur la physique (PINN)

L'intégration des lois de la physique dans les modèles d'inférence dans le but de générer des résultats plus réalistes est un exemple de cas d'utilisation du calcul intensif enrichi par IA. Dans ces applications, les réseaux neuronaux doivent obéir à des lois connues, telles que la conservation de la masse, de l'énergie et de la vitesse, et sont appelés « réseaux neuronaux basés sur la physique » ou PINN. Les PINN peuvent être utilisés pour augmenter, ou remplacer, la modélisation et la simulation HPC pour des cas d'utilisation tels que l'analyse de l'écoulement des fluides, la dynamique moléculaire, la conception d'ailes et de moteurs à réaction, et la physique des hautes énergies.

Par exemple, les chercheurs du CERN ont utilisé Intel® Deep Learning Boost (Intel® DL Boost) sur les processeurs Intel® Xeon® Scalable pour remplacer les simulations de Monte Carlo pour les collisions de particules. La quantification int8 de basse précision a permis d'obtenir un traitement jusqu'à 68 000 fois plus rapide que les simulations logicielles2, avec une légère amélioration de la précision également.

L'IA dans le calcul intensif est poussée par la croissance des données

Les charges de travail du calcul intensif et de l'IA sont principalement motivées par la croissance constante des données et la nécessité de suivre le rythme de l'analyse à l'échelle du calcul intensif. Les algorithmes d'IA sont de plus en plus sophistiqués et peuvent traiter des ensembles de données beaucoup plus importants que dans les années passées, surtout depuis l'introduction des méthodologies de deep learning. Des disciplines comme le séquençage génomique génèrent une quantité phénoménale de données, et des institutions comme le Broad Institute du MIT et de Harvard créent environ 24 téraoctets de nouvelles données chaque jour3.

L'IA permet d'accélérer les charges de travail critiques, afin que la découverte ne prenne pas de retard. Par exemple, Intel s'est associé au Broad Institute pour développer une solution Intel® Select pour le Genomics Analytics Toolkit (GATK), qui intègre l'accélération matérielle de l'IA afin de gérer les charges de travail HPC pour les principaux outils de génomique. Grâce à la solution Select pour GATK, le Broad Institute a pu multiplier par 1,75 la vitesse de l'application Burrow-Wheeler Aligner (BWA) et par 2 celle de l'application HaplotypeCaller3.

Le San Diego Supercomputer Center (SDSC) héberge l'un des plus grands centres de données universitaires au monde et sa réputation de leader international en matière d'utilisation, de gestion, de stockage et de préservation des données n'est plus à faire. Ce système axé sur l'IA permet aux scientifiques de développer de nouvelles approches pour la formation et l'inférence accélérées. Étude de cas : Le SDSC construit le supercalculateur « Voyager » axé sur l'IA.

Surmonter les obstacles liés à l'adoption de l'IA dans le calcul intensif

Lorsqu'il s'agit de configurations de calcul intensif pour l'IA, il existe traditionnellement un compromis entre les exigences de l'IA et du calcul intensif dans l'architecture de processeur. Les charges de travail gourmandes en IA échangeront généralement un nombre de cœurs plus élevé contre de la vitesse, tandis que les charges de travail HPC préfèrent souvent des performances de calcul supérieures avec un nombre de cœurs élevé et un plus grand débit de cœur à cœur. Grâce à des améliorations générationnelles continues, Intel propose des solutions incluant l'accélération intégrée dans les processeurs Intel® Xeon® Scalable.

Les innovations clés suivantes, tant au niveau du matériel que des logiciels, facilitent la conception et la réalisation de solutions d'IA :

  • Les processeurs Intel® Xeon® Scalable offrent, grâce à l'accélération de l'IA intégrée, les niveaux élevés de performances requis en matière d'IA. Intel® AVX-512 avec Intel® DL Boost Vector Neural Network Instructions (VNNI), une exclusivité des processeurs Intel®, offre des performances d'IA optimisées pour des découvertes rapides en moins de temps.
  • Les bibliothèques d'optimisation de basse précision au sein de l'Intel® oneAPI AI analytics toolkit facilitent le codage pour les plateformes HPC et IA, tout en augmentant les performances et en maintenant les seuils de précision.
  • Les FGPA Intel® pour le machine learning prennent en charge une parallélisation élevée et permettent d'accélérer le délai d'obtention des résultats et des informations pour les charges de travail HPC et IA.
  • La plateforme Gaudi d'Habana Labs, l'équipe de centre de données d'Intel axée sur les technologies de processeur de deep learning, permet aux scientifiques des données et aux ingénieurs de machine learning d'accélérer la formation et de créer de nouveaux modèles ou de migrer des modèles existants en seulement quelques lignes de code pour gagner en productivité et réduire les coûts opérationnels. Les accélérateurs Habana sont spécialement conçus pour la formation et l'inférence de modèles d'IA à l'échelle.
  • Les solutions Intel® Select pour clusters IA HPC permettent de déployer des charges de travail d'IA sur des plateformes HPC convergées sans déployer de GPU.
  • Les développeurs spécialisés dans l'IA affinent leurs techniques et leur code pour qu'ils fonctionnent plus efficacement sur les clusters HPC. De nouvelles optimisations accélèrent les charges de travail de bout en bout, du chargement des données au prétraitement, à la formation et à l'inférence.

La complexité est également une source majeure de friction pour l'adoption du calcul intensif et de l'IA. Les compétences requises sont très spécifiques et les entreprises devront acquérir des talents formés au calcul intensif et à l'IA pour réussir. Le leadership d'Intel peut aider à ouvrir la voie, car Intel collabore étroitement avec des communautés du calcul intensif et de l'IA pour partager son expertise et ses idées.

Conclusion : l'IA au service du calcul intensif

L'IA est de plus en plus utilisée dans les applications de calcul intensif grâce à de nouvelles technologies et méthodologies qui augmentent le rythme et l'échelle de l'analyse de l'IA pour obtenir des découvertes et des informations plus rapidement. Grâce à ces innovations, les spécialistes des données et les chercheurs peuvent compter sur l'IA pour traiter davantage de données, créer des simulations plus réalistes et faire des prédictions plus précises, souvent en moins de temps.