IMS  : avancées dans le domaine des sciences moléculaires

L'Institute for Molecular Science a adopté un nouveau système HPC pour prendre en charge les opérations massivement parallèles et les calculs à grande vitesse.

Synthèse
L'Institute for Molecular Science (IMS) a considérablement étendu ses capacités de calcul avec un système à double vocation conçu pour servir les chercheurs qui ont besoin de calculs parallèles hautes performances et d'un traitement en série gourmand en mémoire. Le nouveau système se compose de processeurs Intel® Xeon® Gold 6148 et Intel® Xeon® Gold 6154 avec des unités de stockage SSD Intel® DC 3520 de 800 Go, tous interconnectés par l'Intel® Omni-Path Architecture (Intel® OPA).

Défi
L'Institute for Molecular Science (IMS) japonais est un centre de recherche avancée dans le domaine des sciences moléculaires théoriques et expérimentales. L'IMS accueille quatre départements de recherche : Sciences moléculaires théoriques et computationnelles, Sciences photomoléculaires, Sciences moléculaires des matériaux et Sciences moléculaires complexes (vie et coordination). Il offre un lieu commun de recherche pour la communauté scientifique spécialisée dans les sciences moléculaires et permet aux chercheurs d'échanger par le biais de relations nationales et internationales. Les scientifiques de l'IMS travaillent également en collaboration avec un large éventail de chercheurs au Japon et dans le monde entier, contribuant ainsi à des avancées importantes dans cette discipline. Les supercalculateurs de l'IMS ont été utilisés pour des travaux importants impliquant des calculs de chimie quantique, des calculs de bandes et des simulations de dynamique moléculaire. Des travaux récents ont été publiés dans des revues scientifiques, dont Nature (25 février 2016, vol. 530, p. 465-468).

« Si l'on souhaite réaliser de véritables avancées, le principal défi vient de l'énorme quantité de calculs empiriques que les chercheurs doivent exécuter sur nos supercalculateurs pour révéler de nouvelles structures et de nouveaux comportements. » - Shinji Saito, Directeur du Research Center for Computational Science (RCCS) à l'IMS

Alors que les simulations de dynamique moléculaire sont généralement hautement optimisées pour le calcul parallèle, de nombreux algorithmes de chimie quantique ont tendance à fonctionner en série. Dans les deux types de calcul, les problèmes importants que les scientifiques doivent étudier impliquent de longs temps d'exécution afin de recueillir les données dont ils ont besoin pour poursuivre leurs travaux. L'IMS offre suffisamment de temps CPU aux chercheurs pour relever ces défis, quel que soit le type de calcul dont ils ont besoin (en série ou parallèle).

« Nos précédents supercalculateurs ont été installés en 2011 », commente Saito. « Ils fonctionnaient avec des technologies vieilles de six ans. Le nombre de cœurs et la vitesse de calcul n'étaient pas suffisants pour nos utilisateurs actuels. »

Solution
Les calculs de dynamique moléculaire peuvent utiliser des milliers de cœurs à la fois. Un plus grand nombre de cœurs avec une interconnexion non bloquante permet aux chercheurs d'exécuter leurs tâches beaucoup plus rapidement ou d'exécuter des tâches nettement plus volumineuses qu'avec des systèmes comportant moins de cœurs. Les processus en série des calculs de chimie quantique nécessitent des quantités massives de mémoire avec les processeurs les plus rapides pour obtenir rapidement des résultats.

« Dans la mesure où l'IMS soutient la recherche dans les deux types de calculs et où la vitesse des cœurs des processeurs est généralement inférieure avec un plus grand nombre de cœurs, nous avions besoin d'une solution qui offre les deux configurations : un système avec des milliers de cœurs et un autre avec moins de cœurs plus rapides et une grande mémoire. » - Fumiyasu Mizutani, Chef de section au RCCS

L'IMS a travaillé avec NEC* pour installer deux clusters équipés de serveurs Supermicro* interconnectés par l'Intel® Omni-Path Architecture (Intel® OPA). La nouvelle machine (appelée Simulateur moléculaire hautes performances) s'est classée 70e sur la liste Top500 de novembre 2017 avec un LINPACK* de 1,8 pétaFLOPS et une performance théorique de pointe de 3,1 pétaFLOPS1. Elle est entrée en production à l'IMS le 1er octobre 2017.

Les deux systèmes du simulateur moléculaire fonctionnent avec des processeurs Intel® Xeon® Gold 6148 à 20 cœurs pour les calculs massivement parallèles de dynamique moléculaire, tandis que les processeurs Intel® Xeon® Gold 6154 à 18 cœurs cadencés entre 3,0 et 3,7 GHz (Turbo) offrent la vitesse nécessaire pour les opérations en série plus exigeantes de chimie quantique. Pour répondre aux exigences des différents types de charges de travail, les nœuds à 20 cœurs ont été configurés dans une topologie de bande passante bi-sectionnelle (FBB) complète, tandis que les nœuds plus rapides étaient sursouscrits à 1:3, considérant qu'ils ne communiqueraient pas autant pendant l'exécution de leurs tâches gourmandes en mémoire.

Le simulateur moléculaire utilise également des unités de stockage SSD Intel® DC 3520 de 800 Go.

Résultats
Depuis que le simulateur moléculaire est entré en production, il a effectué de nombreux benchmarks à l'aide de calculs de chimie quantique, de simulation de dynamique moléculaire, de transfert de mémoire et de programmes de performance des disques. Des utilisateurs ont également lancé des projets de recherche sur le nouveau système. Un banc d'essai d'un Test397 modifié, qui est l'optimisation de la géométrie et le calcul de la fréquence, avec Gaussian09 Rev.d01 sur le nouveau système est environ 2,1 fois plus rapide que sur l'ancien système2. Le nouveau système, avec 40 588 cœurs, fournit 7,3 fois la capacité de calcul de l'ancien système de l'IMS2.

« Bien que ces résultats de banc d'essai Gaussian pour cette charge de travail intensive en mémoire aient été calculés avant l'application de toutes les mesures d'atténuation logicielle « Spectre » et « Meltdown » et des mises à jour du micrologiciel », note Mizutani, « des tests supplémentaires du code n'ont indiqué aucun impact sur les performances après l'application des mises à jour de sécurité. »

Aujourd'hui, environ 1 000 tâches utilisant de un à 1 000 cœurs sont exécutées par 80 utilisateurs actifs sur le nouveau système de manière constante et efficace.

Synthèse de la solution
L'ISM soutient un large éventail de travaux de recherche en sciences moléculaires, dont la recherche computationnelle, avec son nouveau simulateur moléculaire hautes performances. Le nouveau système fournit des ressources de calcul intensif (HPC) pour les opérations massivement parallèles et les calculs en série à grande vitesse nécessitant beaucoup de mémoire. Il intègre 40 588 cœurs de processeurs Intel® Xeon® Gold 6154 et Intel® Xeon® Gold 6148 interconnectés grâce à l'Intel® Omni-Path Architecture (Intel® OPA). Le système a été classé 70e dans la liste Top500 de novembre 2017.

Configuration de la solution

  • 40 588 cœurs de processeurs Intel® Xeon® Gold 6148 et Intel® Xeon® Gold 6154
  • Fabric Intel® Omni-Path Architecture (Intel® OPA)
  • Unités de stockage SSD Intel® DC série 3520
  • 216 768 Go de mémoire

Produits Intel® associés

Processeurs Intel® Xeon® Scalable

Générez des données exploitables, faites confiance à la sécurité assistée par matériel et mettez en place des prestations de services dynamiques avec les processeurs Intel® Xeon® Scalable.

En savoir plus

Architecture Intel® Omni-Path (Intel® OPA)

L'architecture Intel® Omni-Path (Intel® OPA) diminue le TCO des systèmes tout en améliorant la fiabilité, en offrant des performances élevées et une évolutivité extrême.

En savoir plus

Unités de stockage SSD Intel® Optane™ DC

La technologie Intel® Optane™ est la première grande percée en matière de mémoire et de stockage depuis 25 ans.

En savoir plus

Avis et avertissements

Les fonctionnalités et avantages des technologies Intel® dépendent de la configuration du système et peuvent nécessiter du matériel et des logiciels compatibles et l'activation de certains services. Les performances varient d'une configuration à une autre. Aucun ordinateur ne saurait être totalement sécurisé. Consultez le constructeur ou le revendeur de votre ordinateur.vous pouvez consulter le site https://www.intel.fr pour en savoir plus. // Les logiciels et charges de travail utilisés dans les tests de performance ont peut-être été optimisés uniquement pour les microprocesseurs Intel®. Les tests de performance tels que SYSmark* et MobileMark* portent sur des configurations, composants, logiciels, opérations et fonctions spécifiques. Les résultats peuvent varier en fonction de ces facteurs. Pour l'évaluation d'un produit, il convient de consulter d'autres tests et d'autres sources d'information, notamment pour connaître le comportement de ce produit avec d'autres composants. Pour des informations plus complètes, visitez https://www.intel.fr/benchmarks. // Les résultats de performances s'appuient sur les tests réalisés aux dates indiquées dans les configurations et peuvent ne pas refléter toutes les mises à jour de sécurité disponibles. Pour obtenir plus de détails, veuillez lire les informations de configuration. Aucun produit ou composant ne saurait être totalement sécurisé. // Les scénarios de réduction de coûts décrits sont fournis à titre d'exemples montrant comment un produit de technologie Intel® donné, dans les circonstances et configurations spécifiées, peut affecter les coûts futurs et entraîner des économies de coûts. Les circonstances peuvent varier selon les cas. Intel ne garantit aucun coût ni réduction de coûts. // Intel ne maîtrise et ne vérifie pas les bancs d'essai cités ici ou sur les sites Web mentionnés en référence. Vous êtes invité à consulter vous-même ces sites Web et à vérifier l'exactitude des données. // Dans certains cas, les résultats ont été estimés ou simulés à l'aide d'une analyse, d'une simulation ou d'une modélisation d'architecture réalisée en interne par Intel et sont mentionnés à titre indicatif. Toute différence matérielle, logicielle ou de configuration du système peut avoir une incidence sur vos performances effectives.

Infos sur le produit et ses performances

1

Cluster NEC LX, processeur Intel® Xeon® Gold 6148/6154, architecture Intel® Omni-Path (Intel® OPA) avec 40 558 cœurs et une performance théorique maximale de 3,1 pétaflops.

2

Fujitsu PRIMERGY* CX250 & RX300, processeur Intel® Xeon® E5-2690/E5-2697v3 2,9 GHz/2,6 Ghz, InfiniBand FDR/QDR avec 12 992 cœurs et une performance théorique de 0,437427 pétaflops selon https://www.top500.org/site/48473. Les résultats de performance s'appuient sur des tests réalisés au 06 août 2018 et peuvent ne pas refléter toutes les mises à jour de sécurité disponibles.