Inférence d’IA générative avec les serveurs lames Cisco UCS série X M7 / processeurs Intel Xeon de 5e génération
819855
2024-04-02
Public
La prévisualisation n'est pas disponible pour ce fichier. Veuillez télécharger le fichier.
Descriptif
Une solution basée sur Cisco UCS® avec des processeurs Intel® Xeon® Scalable et Cisco Nexus® offre une base convaincante et évolutive pour le déploiement de l’IA générative à grande échelle. Cette architecture offre une combinaison de :
- Performances optimales : Cisco UCS avec processeurs Intel Xeon Scalable avec accélérateurs d’IA spécialisés et infrastructures logicielles optimisées améliore considérablement les performances et l’évolutivité de l’inférence. Les commutateurs Cisco Nexus 9000 offrent une bande passante élevée, une faible latence, des mécanismes de gestion de la congestion et une télémétrie pour répondre aux exigences réseau élevées des applications d’IA/ML.
- Architecture équilibrée : Cisco UCS excelle à la fois dans le calcul deep learning et non deep learning, essentiel pour l’ensemble du pipeline d’inférence. Cette approche équilibrée conduit à une meilleure performance globale et à une meilleure utilisation des ressources.
- Évolutivité à la demande : Cisco UCS s’adapte de manière transparente à vos besoins en matière d’inférence d’IA générative. Ajoutez ou supprimez des serveurs, ajustez les capacités de mémoire et configurez les ressources de manière automatisée à mesure que vos modèles évoluent et que vos charges de travail augmentent à l’aide de Cisco Intersight®.
Le système modulaire Cisco UCS série X et les serveurs en rack C240 et C220 prennent en charge les processeurs Intel Xeon évolutifs de 5e génération, ce qui vous permet d’exécuter l’inférence dans le centre de données ou à la périphérie, à l’aide d’un format modulaire ou en rack.
Instructions d’utilisation
Actifs connexes
Titre et description
Format
Langue
Action
Cisco UCS M7 and Pure Storage FlashArray: FlashStack VSI with VMware vSphere 8.0 — Design Guide
Cisco 7th generation of UCS C-Series and UCS X-Series Servers, powered using 4th Gen Intel Xeon Scalable processors., and Pure Storage FlashArray FlashStack on VMware vSphere 8 solution.
Cisco UCS M7 IMM FlexPod Datacenter with VMware vSphere 8.0, and NetApp ONTAP 9.12 Powered by Intel — Design Guide
Cisco UCS M7 IMM FlexPod Datacenter with VMware vSphere 8.0, and NetApp ONTAP 9.12 powered by Intel design guide
Generative AI Inference Operations with Cisco UCS / 5th Gen and 4th Gen Intel Xeon Processors
Cisco UCS, powered by 5th Gen Intel® Xeon® processors and Cisco Nexus, is a scalable foundation for deploying Generative AI at scale.
GenAI Inferencing Powered by Cisco UCS X-Series / 5th Gen Intel Xeon Processors on Red Hat OpenShift AI — Cisco Validated Design
Cisco, Red Hat, and Intel provide a proven AI infrastructure to enable VMware-based Red Hat® OpenShift® AI.
Microsoft SQL Server 2022 on Cisco UCS X210c M6/M7 on 4th Gen Intel® Xeon® Scalable Processors — White Paper
This white paper contains a reference architecture that illustrates the benefits of Microsoft SQL Server 2022 on Cisco UCS X210c M6/M7 on 4th Gen Intel® Xeon® Scalable Processors for bare-metal and hybrid cloud deployments.