L'Académie chinoise des sciences accélère la recherche

Une nouvelle plateforme basée sur la technologie de calcul à haut débit offre une plus grande efficacité dans la recherche du génome de nouveaux matériaux.

En bref :

  • L'Institut de physique de l'Académie chinoise des sciences (IOP-CAS) est l'un des meilleurs instituts de recherche et d'application des sciences des matériaux en Chine.

  • Le calcul à haut débit, un nouveau type de technologie de calcul haute performance avec enrichissement des données, est axé sur la capacité à effectuer « plus de calculs » plutôt que des « calculs plus rapides ». Pour soutenir cela, l'IOP-CAS, Intel et Dell ont travaillé ensemble pour construire une plateforme de calcul du génome et de traitement des données. La nouvelle plateforme a introduit plusieurs technologies clés de calcul et d'interconnexion à grande vitesse telles que les processeurs Intel® Xeon® Scalable de 2ᵉ génération, Cornelis Networks, ainsi que des serveurs, des appareils de stockage et des solutions Dell.

author-image

Par

Les méthodes de recherche sur les matériaux traditionnels deviennent progressivement un goulot d'étranglement majeur du développement de produits industriels innovants et d'améliorations de la qualité en raison du long cycle de R&D et de taux de réussite imprévisibles. Pour accélérer la recherche des nouvelles ressources et renforcer la compétitivité industrielle au niveau national, l'Institut de physique de l'Académie chinoise des sciences (IOP-CAS), commence à s'appuyer plus fortement sur le calcul à haut débit (HTC), une branche émergente du calcul intensif (HPC). Ils ont mis en place une plateforme de calcul du génome des matériaux et de traitement des données à haut débit pour soutenir les travaux du projet de l'Initiative pour le génome des matériaux (IGM), et ont fourni des services de partage de données à un plus grand nombre de chercheurs sur les matériaux dans tout le pays grâce à la base de données sur le génome des matériaux et à la plateforme de ressources du Cloud.

Différemment de la technologie de calcul intensif conventionnelle où la recherche d'un débit et d'une efficacité plus élevés des tâches de calcul individuelles a fait d'un « calcul plus rapide » la mesure clé, le calcul à haut débit, un nouveau type de technologie de calcul intensif enrichi en données, est centré sur la capacité à effectuer « plus de calculs ». Autrement dit, le calcul à haut débit se concentre sur l'amélioration du parallélisme des tâches et du débit pour le traitement massif des données. C'est pourquoi les plateformes HTC ont tendance à avoir des exigences plus élevées ou plus strictes en matière de performances de traitement parallèle, de temps de réponse moyen, d'évolutivité et de coût.

Pour répondre à ces exigences pratiques, l'IOP-CAS travaille avec Intel, un innovateur en matière de puissance de calcul de base, et Dell, un fournisseur de serveurs, d'appareils de stockage et de solutions, pour construire une plateforme de calcul du génome des matériaux et de traitement des données de la prochaine génération (la Nouvelle plateforme). La nouvelle plateforme a introduit plusieurs technologies clés de calcul et d'interconnexion à haut débit telles que les processeurs Intel® Xeon® Scalable de 2ᵉ génération, Cornelis Networks, ainsi que les serveurs PowerEdge de Dell EMC, les appareils de stockage et solutions d'exploitation PowerVault séries ME4 et Isilon de Dell EMC, qui intègrent les capacités et les fonctionnalités uniques de Dell. En plus d'une plus grande efficacité de calcul du génome des matériaux, la Nouvelle plateforme fournit également une base de données complète et partagée sur le génome des matériaux à une large communauté de chercheurs dans ce domaine.

L'une des principales options pour la recherche actuelle sur les matériaux est d'adopter les nouvelles technologies et tendances en matière de calcul intensif (HPC) et d'exploiter le calcul à haut débit (HTC) pour accélérer le calcul du génome des matériaux afin d'accroître l'efficacité de la R&D sur les nouveaux matériaux. Avec l'introduction de produits et de solutions avancés tels que les processeurs Intel Xeon Scalable de 2ᵉ génération et Cornelis Networks, les serveurs PowerEdge, PowerVault série ME4 et la série de stockage Isilon de Dell EMC, notre nouvelle plateforme a reçu les éloges des chercheurs de première ligne sur les matériaux pour ses performances, son accessibilité, sa fiabilité et sa facilité d'entretien qui leur donnent un élan supplémentaire dans la recherche sur les nouveaux matériaux. » - Miao Liu, chercheur distingué, Institut de physique de l'Académie chinoise des sciences

Avantages de l'application pour l'IOP-CAS :

  • Le déploiement de processeurs Intel® Xeon® Scalable de 2ᵉ génération a permis à l'IOP-CAS d'accéder à une puissance de calcul à haut débit du génome des matériaux exceptionnelle à un coût raisonnable et de traiter en toute confiance les dizaines de milliers de tâches de calcul des matériaux chaque année, accélérant considérablement la recherche de nouveaux matériaux en Chine.

  • Les produits de calcul/stockage éprouvés de Dell et les dispositifs hyperconvergents avancés, associés aux processeurs Intel® Xeon® Scalable de 2ᵉ génération et aux produits Cornelis Networks, permettent à la nouvelle plateforme d'offrir une boucle fermée de données haute performance pour le calcul à haut débit du génome des matériaux. Cela permet à l'IOP-CAS de constituer une base de données de classe mondiale sur le génome des matériaux et l'aide à évoluer vers une source d'énergie alimentant la recherche sur le génome des matériaux en Chine.

Si le pétrole brut est l'élément vital de l'industrie moderne, alors les matériaux sont ses os et ses muscles. Toute tentative de rendre les produits industriels plus compétitifs nécessite un processus continu de « transmutation ». Cela signifie que la R&D continue et l'introduction de nouveaux matériaux sont inévitables. Par le passé, les chercheurs en matériaux utilisaient principalement l'approche par essais et erreurs pour étudier la caractérisation structurelle de différents matériaux afin de découvrir la nature des nouveaux matériaux. Cependant, comme la composition des matériaux modernes devient de plus en plus complexe, notamment avec l'émergence des matériaux composites, les techniques expérimentales conventionnelles ne fonctionnent plus dans de nombreuses circonstances. Des problèmes tels que les longs cycles de R&D, les coûts élevés et les faibles taux de réussite sont de plus en plus prononcés.

Le lancement de l'Initiative pour le génome des matériaux (MGI)1 à l'échelle mondiale et la maturité croissante des méthodes de simulation théorique telles que la Théorie fonctionnelle de la densité (DFT) et les méthodes de Monte Carlo apportent aux chercheurs en matériaux des points de rupture. Ils tirent désormais plus souvent parti de la forte puissance de calcul parallèle des méthodes informatiques, en particulier du calcul à haut débit, pour passer au crible des matériaux dans le cadre de la simulation de calcul.

Par exemple, prenons la recherche sur les matériaux semi-conducteurs à grand profil ; l'application et les performances de chaque nouveau matériel, comme le comportement de croissance des films fins sur un substrat et qu'il y ait eu désactivation ou reconstruction de surface, tous avaient nécessité des tests et des vérifications répétés par le passé. Aujourd'hui, grâce à la DFT, les chercheurs peuvent utiliser des calculs fonctionnels de densité partiellement connus pour s'adapter à l'énergie totale du système et utiliser les méthodes de la mécanique quantique pour calculer précisément l'interaction électron-électron entre les atomes d'un matériau afin d'obtenir des données sur la structure électronique, le magnétisme et la stabilité structurelle d'un plus grand nombre de composés, ce qui permet de guider théoriquement la conception des matériaux et d'accélérer l'application d'un plus grand nombre de nouveaux matériaux aux semi-conducteurs.

En tant que l'un des meilleurs instituts de recherche et d'application de la science des matériaux en Chine, l'IOP-CAS se tient au courant des derniers développements et s'engage à appliquer le calcul à haut débit à la recherche de nouveaux matériaux. Les résultats ont été très encourageants, avec de nombreuses percées dans les domaines des matériaux supraconducteurs, des nanotechnologies et des batteries de puissance. L'IOP-CAS estime que l'une des missions clés pour accélérer la recherche sur les nouveaux matériaux en Chine est de continuer à intégrer les derniers développements des technologies de l'information dans la recherche sur les matériaux et de construire une plateforme complète de données sur le génome des matériaux avec une puissance de calcul plus importante et plus efficace. Cela aidera les chercheurs à se concentrer davantage sur la recherche sur les matériaux elle-même plutôt que de s'occuper de l'achat et de la construction d'un tel environnement informatique.

L'IOP-CAS a travaillé avec Intel et Dell pour mettre en place une infrastructure informatique solide pour la prochaine génération de plateforme de calcul et de traitement des données sur les matériaux à haut débit. En introduisant des technologies de calcul et d'interconnexion avancées, ainsi que des produits et solutions de traitement et de stockage de données matures, la plateforme est un puissant moteur pour le calcul et la recherche sur le génome des matériaux en Chine.

Décomposition de la solution de calcul à haut débit du génome des matériaux

Comme mentionné ci-dessus, la solution HTC joue un rôle clé dans la nouvelle plateforme de l'IOP-CAS. Pour faire simple, il s'agit d'un système de calcul capable de traiter en parallèle un grand nombre de tâches indépendantes. Les caractéristiques suivantes le distinguent des solutions HPC classiques :

  • Traitement : les tâches sont généralement traitées avec un parallélisme au niveau du thread et les charges de travail changent constamment en fonction des exigences de la tâche ;
  • Efficacité : elle est davantage axée sur l'intégration des données avec le calcul et les performances en lecture/écriture ont un impact direct sur l'efficacité du système ;
  • Performances : elle est davantage axée sur l'augmentation des demandes de calcul et de traitement de données simultanées dans une unité de temps ;
  • Coût : il existe une corrélation positive entre la capacité de traitement du système et le nombre de threads, et le fait de donner la priorité au coût d'un seul thread améliore les performances globales de traitement.

En général, les systèmes HTC capables de traiter de gros volumes de charges de travail sont bien adaptés aux scénarios qui impliquent le criblage de nombreux échantillons (par exemple, le processus de R&D en biologie et en pharmacie, etc.) Le HTC peut également être utilisé pour simuler le calcul et le criblage de génomes de matériaux massifs lors de la recherche sur le génome des matériaux.

Comme le montre la Figure 1, le calcul du génome des matériaux peut souvent être simplement divisé en plusieurs étapes :

  1. Le système sélectionne les données d'une base de données externe sur le génome des matériaux et génère un fichier qui peut être appelé par un logiciel de simulation spécifique (tel que VASP2) ;
  2. Ensuite, grâce au calcul intensif parallèle, il obtient des données sur les propriétés correspondantes des matériaux, telles que la densité énergétique, la structure électronique et l'augmentation ou la diminution de l'énergie de synthèse ;
  3. Les résultats des calculs sont conservés dans le système de stockage interne pour une analyse plus approfondie. Un système de fichiers distribués parallèles à haute performance est généralement nécessaire ;
  4. Une fois les données post-traitées et intégrées, une analyse plus approfondie peut être effectuée, les résultats étant utilisés pour le criblage des matériaux. Les résultats de l'analyse peuvent également être importés dans la base de données sur le génome des matériaux. Ainsi, un processus de calcul procédural complet est formé.

Figure 1. Flux de travail du calcul du génome des matériaux.3

La génération de fichiers de structure, la simulation et le calcul théoriques et l'analyse des résultats de calcul dans les processus ci-dessus peuvent être convertis en un ensemble d'instructions et de tâches indépendantes d'une certaine manière. Ces instructions et tâches peuvent être exécutées par des logiciels spécifiques, ce qui constitue le scénario parfait pour les applications HTC.

En plus d'exécuter des tâches de calcul à haut débit du génome des matériaux, l'IOP-CAS prévoit de construire un centre de données pour la Nouvelle plateforme afin de stocker les données calculées pour une analyse ultérieure. Il va également fournir une plateforme de données partagée dans un Cloud privé pour partager les données, les codes et les outils informatiques utilisés lors du calcul du génome des matériaux. Cela permettra à un plus grand nombre de chercheurs en matériaux à travers le pays de se concentrer sur leurs recherches au lieu de devoir consacrer du temps, des efforts et de l'argent à l'acquisition du même type d'équipement et à la mise en place d'un environnement similaire.

Avec toutes ces idées, l'IOP-CAS prévoit de déployer sa solution de calcul à haut débit du génome des matériaux par le biais de quatre logiciels clés : le premier est le logiciel de répartition à haut débit basé sur l'utilitaire Linux simple pour la gestion des ressources (Slurm). Il assurera des performances d'exécution optimales grâce à l'envoi et au suivi de toutes les tâches de calcul et d'analyse ; le deuxième est le progiciel d'archivage des données qui peut effectuer un archivage à grande vitesse des résultats de calcul dans le système de fichiers distribués parallèles Lustre ; le troisième est le progiciel de post-traitement qui effectue l'inférence et l'intégration des résultats de calcul bruts pour l'analyse ultérieure des données ou pour les affichages/interrogations graphiques ; et le quatrième est le grand progiciel d'analyse des données qui aide les chercheurs à utiliser l'intelligence artificielle (IA) et d'autres technologies pour passer au crible de nouveaux matériaux et prévoir les résultats de synthèse plus efficacement avec un volume massif de données calculées et de résultats d'analyse.

Les excellentes idées de conception nécessitent le soutien d'une infrastructure matérielle appropriée. Cela ne représente pas un petit défi pour l'IOP-CAS qui se concentre davantage sur la recherche sur les matériaux et qui manque d'expertise et d'expérience en matière de technologies de l'information. Pour mieux exploiter le potentiel de la Nouvelle plateforme et maximiser ses performances dans les futures tâches de calcul, l'IOP-CAS a décidé de « laisser aux experts » le soin de faire appel à Intel et à Dell comme partenaires d'innovation. Ils se sont associés pour développer une architecture matérielle de calcul et de stockage à haute performance et haute disponibilité adaptée à ses besoins, basée sur le cadre logiciel complet ci-dessus. L'OIP-CAS a soulevé plusieurs exigences concernant l'infrastructure de la Nouvelle plateforme avant que les trois parties ne commencent leurs travaux :

  • Technologie avancée : l'architecture matérielle de calcul et de stockage de la Nouvelle plateforme doit pouvoir accompagner l'augmentation continue des tâches de calcul à haut débit du génome des matériaux au cours des prochaines années tout en conservant un avantage en matière de performances.
  • Stabilité opérationnelle : une fois la Nouvelle plateforme construite, elle devra s'occuper de tâches massives de calcul à haut débit du génome des matériaux. Toute défaillance du système entraînera des pertes imprévisibles, ce qui rend la fiabilité et la stabilité de l'architecture incroyablement importantes.
  • Opérations et maintenance simples (O&M) : le manque relatif de ressources humaines de l'IOP-CAS signifie qu'aucun expert O&M dédié ne peut être affecté à la plateforme, de sorte que l'O&M de l'architecture matérielle de calcul et de stockage doit être agile et facile.

Les processeurs Intel® Xeon® offrent plus de puissance de calcul et un parallélisme optimal au même coût

L'intégration d'une technologie informatique avancée dans la Nouvelle plateforme était la principale exigence de l'IOP-CAS. Ses exigences en matière de puissance ou de performances de calcul doivent donc être satisfaites.

La puissance de calcul de la Nouvelle plateforme provient principalement des processeurs, de sorte que le choix d'un processeur primaire approprié qui pourrait satisfaire les exigences de calcul à haut débit du génome des matériaux de l'IOP-CAS était une priorité absolue dans la construction de la plateforme. Elle doit être examinée de manière approfondie et équilibrée dans de multiples dimensions. Pour être précis, comme le calcul à haut débit est davantage axé sur le traitement parallèle qui exige que le système de calcul traite simultanément autant de tâches que possible qu'il et présente une corrélation positive avec le nombre de threads, le nombre de cœurs et de threads dans le processeur a été la principale considération. Deuxièmement, la mémoire cache L3 (cache de dernier niveau) est partagé par tous les cœurs et les threads d'un processeur. Il fallait donc envisager une plus grande taille de la la mémoire cache L3 pour s'assurer que davantage de caches étaient alloués à chaque tâche parallèle, ce qui augmentait le taux de réussite de la mémoire cache. Troisièmement, une fréquence d'horloge plus élevée du processeur est essentielle pour augmenter la vitesse de traitement des tâches individuelles. Enfin, il fallait aussi tenir compte des prix ou des coûts. Les processeurs avec des configurations plus élevées peuvent mieux répondre aux spécifications et aux mesures ci-dessus, mais ils augmentent également le coût. Un choix plus approprié serait de maximiser le rendement des dépenses d'investissement (CapEx) sans compromettre les performances du traitement parallèle. En tant que tel, le principe de la priorité accordée au coût d'un seul thread doit être suivi.

Pour aider l'IOP-CAS à choisir un processeur plus abordable, Intel a travaillé avec des experts de l'institut pour effectuer des tests et des évaluations approfondis sur plusieurs processeurs Intel®. Le processeur Intel® Xeon® Gold 6230 a été la première considération de l'IOP-CAS. Cependant, de nouveaux plans qui exigeaient de la Nouvelle plateforme d'entreprendre beaucoup plus de calculs à l'avenir ont conduit l'IOP-SAC à passer au processeur Intel® Xeon® Gold 6248 dont la fréquence d'horloge est plus élevée. Mais après avoir aidé l'IOP-CAS à effectuer des tests approfondis, Intel a fait la suggestion suivante : bien que la fréquence d'horloge plus élevée du processeur Intel® Xeon® Gold 6248 puisse améliorer les performances dans certains domaines, il avait le même nombre de cœurs et de threads que le processeur Intel® Xeon® Gold 6230. Ainsi, cette amélioration n'a pas représenté d'avancée en matière de performances. Après une évaluation minutieuse des modèles mis à jour de la famille de processeurs Intel® Xeon® Scalable de 2ᵉ génération au début de l'année 2020, Intel a suggéré à l'IOP-CAS de choisir le processeur Intel® Xeon® Gold 6230R.

Les modèles mis à jour en 2020 sont tous améliorés en matière de Turbo, de nombre de threads et de taille de la mémoire cache par rapport aux processeurs Intel® Xeon® Scalable de 2ᵉ génération sortis en 2019. Prenons l'exemple du processeur Intel® Xeon® Gold 6230R : le nombre de cœurs, le nombre de threads et la taille de la mémoire cache sont tous supérieurs de 30 % par rapport à ceux du modèle précédent (le processeur Intel® Xeon® Gold 6230) et la fréquence du Turbo est passée de 3,9 GHz à 4,0 GHz, comme le montre le Tableau 1, alors que le coût reste à peu près le même.4 Cela signifie que ce choix améliorerait considérablement les rendements CapEx de la Nouvelle plateforme.

Tableau 1 Comparaison du processeur Intel® Xeon® Gold 6230R (2020) et du processeur Intel® Xeon® Gold 6230 (2019) en matière de principales caractéristiques techniques des produits.

Entre temps, comme l'IOP-CAS peut exiger des performances de calcul encore plus élevées dans certains scénarios, Intel a également recommandé le processeur Intel® Xeon® Platinum 9242. Avec 48 cœurs et 96 threads pour une simultanéité élevée et la prise en charge de la mémoire DDR4 à 12 canaux, le processeur Intel® Xeon® Platinum 9242 offre encore plus de puissance de calcul pour permettre à l'IOP-CAS de poursuivre son exploration dans des applications telles que l'optimisation des algorithmes du génome des matériaux et la prédiction des propriétés des matériaux basée sur l'apprentissage automatique et l'apprentissage approfondi.

Combinaison des produits de stockage Dell avec Cornelis Networks pour un calcul et une intégration de données sans faille

Après avoir examiné les besoins informatiques de la Nouvelle plateforme, Intel, Dell et l'IOP-CAS ont commencé à étudier comment améliorer l'intégration des calculs et des données. C'est exactement ce que la technologie HTC entend par « enrichi en données ». Elle ne se limite pas à la puissance de calcul parallèle. Elle a des exigences plus strictes en matière de débit, de latence et de largeur de bande des modules de stockage.

C'est pourquoi Intel et Dell ont choisi d'introduire dans la nouvelle plateforme des produits et technologies logiciels/matériels avancés tels que le stockage PowerVault série ME4 de Dell EMC, le stockage NAS évolutif série Isilon de Dell EMC, l'infrastructure hyperconvergente VxRail de Dell EMC et les produits Cornelis Networks.

Comme le montre la Figure 2, pour répondre aux exigences de l'IOP-SAC en matière de calcul du génome des matériaux, de stockage des données, d'analyse des données et de visualisation, l'architecture matérielle de la Nouvelle plateforme est divisée en deux plateformes : l'une pour le calcul à haut débit du génome des matériaux et l'autre pour le traitement des données du génome des matériaux. Le premier est principalement responsable des tâches HTC et du stockage de fichiers à haut débit dans le processus de calcul, tandis que le second assure le stockage, l'analyse et le partage des données dans le Cloud. Un réseau de production de 10 Gbit/s est utilisé pour relier les deux plateformes.

Figure 2. L'architecture matérielle principale de la plateforme de calcul à haut débit et de traitement des données du génome des matériaux de l'IOP-CAS5.

Dans le processus de calcul à haut débit du génome des matériaux, des centaines de milliers de tâches de calcul parallèles et indépendantes génèrent de grandes quantités de fichiers de processus. Ces fichiers doivent être stockés à un débit élevé pour permettre l'inférence et l'intégration ultérieures des données. À cette fin, la Nouvelle plateforme utilise Lustre, le système de fichiers parallèles à haute performance basé sur deux appareils de stockage à haute densité PowerVault ME4084 de Dell EMC (2*84*8 To, pour une capacité totale de 1 344 To), basé sur une architecture de processeur Intel. Le système de fichiers Lustre prend en charge le stockage de données dans des centaines de PB et la bande passante simultanée dans des TB. Il offre une grande évolutivité, de sorte que l'IOP-CAS peut mettre à niveau les appareils de stockage de la série ME4 de manière souple et facile au besoin.

Le calcul du génome des matériaux produit de grandes quantités de données non structurées. Prenez la structure électronique (densité électronique) comme exemple : le fichier de densité électronique d'un seul matériau pourrait être une seule image, d'une taille pouvant atteindre jusqu'à 10 Go. La Nouvelle plateforme doit donc fournir un système de stockage performant et évolutif pour les données de résultats massives. La solution de Dell a été les appareils de stockage NAS évolutif série Isilon de Dell EMC, connus pour leur efficacité exceptionnelle et leur excellente évolutivité. Quatre Isilon H400, un système NAS hybride extensible et huit Isilon A2000, un système NAS extensible pour le stockage de données d'archives, ont été utilisés pour développer un pool de ressources de stockage multi-niveaux unifié pour l'analyse des données et le stockage sécurisé des données respectivement. Les deux produits offrent une excellente capacité d'extensibilité et peuvent aider la plateforme à étendre sa capacité de stockage de manière flexible. Leur système d'exploitation OneFS intégré permet d'utiliser jusqu'à 80 % de la capacité de stockage et offre diverses mesures de protection et de sécurité des données pour garantir la sécurité et la fiabilité des données de la plateforme.6Ceci répond également aux exigences de l'IOP-CAS en matière de stabilité et de fiabilité de l'infrastructure de la Nouvelle plateforme.

Parallèlement, Dell a également fourni à la Nouvelle plateforme six appareils hyperconvergents VxRail de Dell EMC afin de développer un pool de ressources basé sur le Cloud pour le partage des ressources. Comme mentionné ci-dessus, l'un des objectifs de la Nouvelle plateforme est de partager les données de résultats, les codes et les outils de calcul utilisés lors du calcul du génome des matériaux afin d'aider à améliorer l'efficacité d'un plus grand nombre de chercheurs dans le domaine des matériaux. L'infrastructure hyperconvergente VxRail peut être entièrement intégrée au système logiciel du centre de données défini par logiciel (SDDC) de Dell. Ainsi, la plateforme peut facilement déployer un environnement sur Cloud basé sur VMware Cloud Foundation en utilisant les appareils hyperconvergents VxRail. L'avantage d'une telle plateforme entièrement intégrée est qu'elle simplifie considérablement le processus complexe de mise en place d'un Cloud privé, de la planification à la construction et au déploiement. La complexité de l'exploitation et de l'entretien ultérieurs est également considérablement réduite, ce qui permet à l'IOP-CAS de disposer d'une solution de Cloud tout-en-un.

Afin de garantir une meilleure collaboration entre les périphériques de stockage et les nœuds de calcul, la nouvelle plateforme a été équipée de produits Cornelis Networks pour améliorer l'efficacité et l'évolutivité des interconnexions. Les produits Cornelis Networks optimisent la gestion des flux de données et renforcent la protection de l'intégrité des paquets afin de réduire davantage la latence grâce à des innovations technologiques au niveau de la couche de liaison. Plus important encore, la puce de commutation basée sur les produits Cornelis Networks supporte jusqu'à 48 ports, ce qui permet à la nouvelle plateforme de supporter jusqu'à 1 152 ports avec un seul commutateur. Cette évolutivité exceptionnelle répond aux exigences de l'IOP-CAS pour les futures mises à niveau et extensions de la Nouvelle plateforme.

Résultats et perspectives

Grâce à son partenariat triangulaire avec Intel et Dell, l'IOP-CAS a maintenant déployé 160 nœuds de processeurs Intel® Xeon® Gold 6230R et 20 nœuds de processeurs Intel® Xeon® Platinum 9242 à haute performance sur sa nouvelle plateforme de calcul à haut débit du génome des matériaux. Un pool de ressources de stockage complet, unifié et à plusieurs niveaux, ainsi qu'une plateforme de données sur le Cloud pour le partage des ressources ont également été mis en place dans le centre de données où se trouve la plateforme de traitement des données du génome des matériaux.

Une fois que tous les nœuds ci-dessus seront mis en service, environ 3 000 tâches basées sur la DFT pourront être exécutées et 100 à 700 calculs (selon la complexité des matériaux) pour les génomes des matériaux cristallins inorganiques seront effectués quotidiennement. Tous les matériaux cristallins inorganiques connus de l'humanité (environ 100 000 après déduplication) pourraient être analysés en un an. Au cours des trois à cinq prochaines années, l'IOP-CAS utilisera la puissance de calcul de la Nouvelle plateforme pour continuer à explorer des matériaux encore inconnus de l'humanité et incorporera les données de prévision de 500 000 matériaux inconnus dans la base de données des matériaux de la plateforme.7 Cela permet de transformer l'approche de la recherche sur les matériaux, qui passe de la méthode classique « découvrir-calculer » à la méthode « calculer-découvrir », en faisant des technologies de l'information un moteur de la recherche sur les nouveaux matériaux.

Outre l'accélération de la recherche sur les matériaux, la Nouvelle plateforme apportera un soutien à l'intégration de l'industrie, des universités et des instituts de recherche scientifique. Le pool de ressources partagées basé sur le Cloud permettra aux étudiants, aux enseignants et aux chercheurs des universités, des instituts de recherche scientifique ou des entreprises d'utiliser les données du génome des matériaux existantes sur la plateforme de données pour effectuer rapidement la synthèse de nouveaux matériaux, en évitant le gaspillage de ressources causé par le double calcul. De plus, grâce aux données riches accumulées sur la plateforme de données, l'IOP-CAS est en mesure de visualiser les structures internes de divers matériaux cristallins inorganiques à l'intention des enseignants et des étudiants de diverses manières. La technologie de la réalité virtuelle (RV) pourrait même être introduite pour rendre « tangible » l'étude et la recherche des matériaux.

Pour l'avenir, l'IOP-CAS prévoit également de travailler avec ses partenaires informatiques tels qu'Intel et Dell sur l'optimisation et l'expansion de la plateforme de calcul du génome des matériaux, de sorte que le nombre de nœuds HTC soit porté à environ 500 et que la puissance de calcul soit doublée,7 faisant de la plateforme de données du génome des matériaux de l'IOP-CAS l'une des meilleures au monde. Le centre de calcul de la Nouvelle plateforme sera également élargi pour passer des matériaux cristallins inorganiques aux matériaux moléculaires. Le champ d'application de la recherche sur les nouveaux matériaux continuera à s'élargir. Intel et Dell tireront parti de leurs propres forces et aideront l'IOP-CAS à faire davantage de progrès dans le domaine du calcul du génome des matériaux grâce à l'évolution de leurs produits, technologies et solutions.

Points forts de la solution Dell

Salué comme le « fondement du centre de données moderne », le serveur PowerEdge de Dell EMC est un élément essentiel qui alimente la puissance de calcul de la plateforme de calcul à haut débit et de traitement des données de matériaux de niveau supérieur. Doté d'une architecture système hautement évolutive et d'un stockage interne flexible, il peut offrir des performances encore plus élevées pour une grande variété d'applications grâce aux processeurs Intel® Xeon® Scalable de 2ᵉ génération. Ses caractéristiques telles que « le logiciel de virtualisation VMware préconfiguré avec l'ADN du Cloud », « l'architecture commerciale hautement évolutive » et « l'automatisation intelligente et facile pour l'exploitation et la maintenance à distance » sont inestimables pour les entreprises qui cherchent à accélérer la transformation informatique et l'innovation commerciale.8

L'architecture avancée de Dell basée sur le stockage PowerVault série ME4 de Dell EMC est équipée de processeurs Intel® Xeon® et optimisée pour les SAN/DAS afin de permettre aux utilisateurs en entreprise de construire et d'intégrer rapidement des systèmes de stockage souples, particulièrement performants et économiques. La série ME4, dotée de capacités étendues, prend en charge tous les types de pilotes, une multitude de protocoles et des fonctionnalités logicielles clés en main. Elle offre de nombreuses options de modules de stockage évolutifs et convient pour accélérer les applications d'entreprise telles que le calcul intensif, la sauvegarde et les VDI.9

Le stockage NAS évolutif série Isilon de Dell EMC basé sur le système d'exploitation OneFS est une matrice NAS hybride aux capacités variées. Elle offre un meilleur équilibre entre performances, capacité et rapport qualité-prix. Grâce à ses multiples protocoles intégrés, elle offre aux utilisateurs une interopérabilité plus agile et plus souple et aide les entreprises à supporter des charges de travail impliquant un large éventail de données non structurées sur une seule plateforme pour la consolidation des fichiers/données, l'élimination des coûteux silos de stockage et une gestion rationalisée.6

L'appareil hyperconvergent VxRail de Dell EMC, une plateforme hyperconvergente conçue conjointement avec VMware, offre aux utilisateurs des capacités de déploiement et de mise à niveau en un seul clic, ainsi qu'une plateforme Cloud prête à l'emploi. Il permet la gestion du cycle de vie complet, du matériel au logiciel et à la plateforme Cloud. Cela simplifie l'O&M et la gestion de la plateforme Cloud, permettant aux utilisateurs d'évoluer à la demande et d'allouer les ressources de manière flexible à mesure que leur taille augmente.10

Télécharger le PDF ›