Astera Labs : Un traitement HPC basé sur le Cloud pour de meilleurs conceptions

L'accès rapide aux derniers processeurs Intel® Xeon® Scalable personnalisés dans les instances Amazon EC2 z1d* s'avère inestimable.

En bref :

  • Astera Labs, une société de semi-conducteurs sans usine, développe des solutions de connectivité spécialement conçues pour les systèmes axés sur les données.

  • Astera Labs a rapidement tiré parti du processeur Intel® Xeon® Scalable personnalisé dans les instances EC2 z1d d'Amazon Web Services. En utilisant le Cloud pour ses besoins en traitement en calcul intensif (HPC), la société Astera Labs estime qu'elle a réduit la durée de développement de son offre de semi-conducteur initiale de 30 à 40 % tout en assurant un produit de haute qualité répondant aux exigences des ses clients.

author-image

Par

Synthèse

Astera Labs, Inc., une société de semi-conducteurs sans usine dont le siège se trouve dans la Silicon Valley de Californie, développe des solutions de connectivité spécialement conçues pour les systèmes axés sur les données. Le portefeuille de produits de la société comprend des cartes de circuits intégrés de semi-conducteurs conscients du système et des services autorisant une connectivité PCIe* robuste. La société a démarré comme une toute nouvelle start-up et possède maintenant un chipset PCIe 5.0 de nouvelle génération entièrement conçu en moins d'un an à l'aide d'un nouveau modèle d'entreprise utilisant uniquement le Cloud et s'exécutant sur Amazon Web Services (AWS). En tant qu'utilisateur d'AWS, Astera Labs a été parmi les premières sociétés de semi-conducteurs à tirer parti du processeur Inte® Xeon® Scalable dans les instances Amazon EC2 z1d*. En s'appuyant sur le Cloud dans tous ses besoins de traitement HPC, Astera Labs estime qu'elle a réduit la durée de développement de sa puce à semi-conducteurs initiale de 30 à 40 % par rapport à un modèle traditionnel tout en assurant un produit de haute qualité répondant aux besoins rigoureux de ses clients exigeants.

Défi

Astera Labs, qui vise passionnément à devenir « le partenaire de confiance de la distribution de données dans les systèmes intelligents », a commencé avec une table entièrement rase fin 2017. Fondée par des vétérans du secteur, la société avait de robustes antécédents en matière de conception de puces, mais elle manquait d'expertise dans l'utilisation des systèmes informatiques et la gestion de la conception électronique assistée par ordinateur (EDA). Après avoir évalué soigneusement les compromis associés aux systèmes sur site, hybrides ou basés sur le Cloud, Astera Labs a opté pour une approche 100 % Cloud public en s'appuyant, entre autres, sur les options d'externalisation de l'assistance et sur des priorités liées à la souplesse opérationnelle et à l'élasticité du traitement.

D'après Jitendra Mohan, directeur général d'Astera Labs, bien que son équipe ait eu hâte d'adopter l'approche Cloud, elle ne savait pas comment s'y prendre. « Astera a contacté AWS, qui à son tour nous a mis en contact avec Six Nines IT, un partenaire consultant AWS Premier », déclare Mohan. « Six Nines nous a expliqué les différents options sur AWS et, en suivant leur conseil, nous avons réalisé notre propre étude et défini l'approche que nous préférions. Nous ne faisions initialement aucun effort pour configurer le serveur de fichiers le plus efficace possible ou quelque chose comme ça. Nous voulions simplement réaliser des simulations comme nous en avions l'habitude et nous pencher sur nos conceptions. Nous sommes partis de rien, litéralement, autres que nos portables, et en une quinzaine de jours, nous avons pu réaliser des simulations. »

Solution

Jason Cutrer, fondateur et président de Six Nines IT, indique que Six Nines a aidé Astera Labs à élaborer l'architecture, à configurer et à maintenir son environnement de conception de puces de bout en bout, qui se trouve entièrement sur AWS. « L'un des avantages d'un partenariat avec Six Nines est que nous possédont beaucoup d'expérience dans l'industrie, avec les charges de travail spécifiques EDA et HPC, et nous avons donc pu accélérer considérablement leur configuration et les délais de mise sur le marché avec une infrastructure qui soutient sont travail de conception et de simulation », explique Cutrer. « Lorsque nous nous sommes engagés, nous avons recommandé l'utilisation de divers types d'instances AWS de technologie Intel, qui ont contribué à accélérer le calendrier d'Astera. »

Dans le cadre de ses efforts initiaux dans le Cloud, Astera Labs a travaillé sur la conception d'une nouvelle puce à semi-conducteurs. « Dans les simulations, nous avons utilisé principalement les instances Amazon EC2 C5 et R5 parallèlement aux instances EC2 z1d, lorsqu'elles sont devenues disponibles. Pour le backend, nous utilisons différents types de machines, notamment les instances z1d, R5 et R4. Nous utilisons également d'autres types d'instances dans les tâches d'usage général », déclare Mohan.

Lorsque nous avons mis en place notre architecture initiale, les instances z1d n'étaient même pas encore sorties. Lorsqu'elles sont devenues disponibles, nous les avons fortement utilisées pour les simulations comme pour le backend. » — Jitendra Mohan, directeur général d'Astera Labs

Selon la taille, les instances C5 comprennent des processeurs Intel Xeon Scalable personnalisés de 2e génération, des processeurs Intel Xeon Scalable de 2e génération ou des processeurs Intel Xeon Platinum série 8000 de 1ère génération. Les instances utilisant les processeurs Intel Xeon Scalable de 2e génération ont une fréquence turbo soutenue sur tous les cœurs de 3,6 GHz et une fréquence turbo maximum par cœur de 3,9 GHz, ce qui en fait des bourreaux de travail parfaits pour la simulation. Les autres peuvent atteindre une fréquence turbo soutenue pouvant atteindre 3,4 GHz sur tous les cœurs et 3,5 GHz sur un même cœur à l'aide de la Technologie Intel® Turbo Boost.

Avec les processeurs Intel Xeon Scalable personnalisés, les instances z1d sont parmi les plus rapides du Cloud. Ils offrent de hautes performances sur un même thread et une fréquence soutenue par cœur pouvant atteindre 4,0 GHz. Des performances encore plus élevées sont possibles à l'aide de la Technologie Intel® Turbo Boost, qui accélère les performances en crête du processeur et des graphiques lorsque les seuils supérieurs liés à l'alimentation, au courant et à la température des cœurs de sont pas atteints. « Lorsque nous avons élaboré notre architecture initiale, les instances z1d n'étaient même pas encore disponibles. Lorsqu'elles sont devenues disponibles, nous les avons fortement utilisées pour les simulations comme pour le backend. », déclare Mohan.

Jitendra Mohan, directeur général d'Astera Labs, explique que la société utilise les dernières instances HPC sur AWS afin de bénéficier d'une grande vitesse et d'une grande fiabilité d'exécution.

Résultat

Les instances z1d sont spécialement conçues pour l'industrie EDA, et la possibilité de commencer à les utiliser dès qu'elles sont devenues disponibles dans le Cloud public a constitué un énorme avantage. « Comme on dit, "le temps, c'est de l'argent", et nous avons commencé à utiliser les instances z1d en raison de leur vitesse de traitement. La disponibilité des instances z1d et la possibilité d'exécuter de nombreuses tâches en parallèle nous ont permis d'exécuter les tâches beaucoup plus rapidement qu'avec les anciennes instances, ce qui a contribué directement à notre réussite », explique Mohan.

Mohan remarque que les performances et la fiabilité des processeurs Intel® dans les différentes instances AWS ont répondu et même dépassé les attentes depuis leur début dans le Cloud : « Avec les processeurs, la vitesse d'exécution est très importante et c'est pourquoi nous avons opté pour les instances C5 et z1d, mais la fiabilité est tout aussi critique. Il est évident qu'un pépin qui survient en plein milieu d'une tâche de trois ou quatre jours devient vraiment problématique. Dans l'année de notre premier projet de conception, nous avons fait l'expérience de milliers de machines extrêmement robustes au niveau de l'infrastructure, et pratiquement aucun plantage. »

Dans l'ensemble, les avantages de l'approche Cloud comprenaient des délais d'exécution plus rapides et des itérations plus rapides sur les conceptions et les simulations. « Nous avons pu créer une puce de haute qualité beaucoup plus vite qu'avec nos propres ressources. Il aurait été extrêmement coûteux et probablement impossible de faire sur site ce que nous avons fait dans le Cloud.

Synthèse de la solution

En travaillant exclusivement dans le Cloud, la société Astera Labs jouit d'un haut niveau de flexibilité opérationnelle. Elle peut non seulement mettre à l'échelle les ressources informatiques AWS selon les besoins pour que les processus de conception avancent à bonne allure et pour contrôler les coûts, mais elle peut également employer les ressources les mieux adaptées à une charge de travail donnée. AWS offre des instances de calcul qui comprennent plusieurs générations de processeurs et de technologies Intel, notamment les processeurs Intel Xeon Scalable personnalisés et les processeurs Intel Xeon Scalable de 2e génération. La capacité de tirer immédiatement parti de la dernière technologie Intel à mesure que de nouvelles instances de calcul AWS deviennent disponibles constituera un avantage à l'avenir pour Astera Labs.

Points saillants de la technologie

  • Instances Amazon EC2 z1d – Processeur Intel® Xeon® Scalable personnalisé
  • Instances Amazon EC2 C5 – Processeur Intel® Xeon® Scalable de 2e génération
  • Instances Amazon EC2 R5 – Processeur Intel® Xeon® Platinum série 8000

Télécharger le PDF ›