Opérations d’inférence d’IA générative avec Cisco UCS / processeurs Intel Xeon de 5e et 4e générations
Intel® QuickAssist Technology (Intel® QAT) Intel® QuickAssist Technology (Intel® QAT) HPC Library Intel® Xeon® Scalable Processors Intel® Xeon® Scalable Processors
812502
2023-12-29
Public
La prévisualisation n'est pas disponible pour ce fichier. Veuillez télécharger le fichier.
Descriptif
Cisco UCS, alimenté par des processeurs Intel® Xeon® de 5e génération et Cisco Nexus, est une base évolutive pour le déploiement de l’IA générative à grande échelle. Cette architecture offre les avantages suivants :
- Performances optimales : Cisco UCS avec processeurs Intel Xeon Scalable avec accélérateurs d’IA spécialisés et infrastructures logicielles optimisées améliore considérablement les performances et l’évolutivité de l’inférence.
- Architecture équilibrée : Cisco UCS excelle à la fois dans le calcul Deep Learning et non Deep Learning, essentiel pour l’ensemble du pipeline d’inférence. Cette approche équilibrée conduit à une meilleure performance globale et à une meilleure utilisation des ressources.
- Évolutivité à la demande : Cisco UCS s’adapte de manière transparente à vos besoins en matière d’inférence d’IA générative. Ajoutez ou supprimez des serveurs, ajustez les capacités de mémoire et configurez les ressources de manière automatisée à mesure que vos modèles évoluent et que vos charges de travail augmentent à l’aide de Cisco Intersight.
Vous avez la possibilité d’exécuter l’inférence dans le centre de données ou à la périphérie, en utilisant un format modulaire ou en rack.
Instructions d’utilisation
Actifs connexes
Titre et description
Format
Langue
Action
Cisco UCS M7 and Pure Storage FlashArray: FlashStack VSI with VMware vSphere 8.0 — Design Guide
Cisco 7th generation of UCS C-Series and UCS X-Series Servers, powered using 4th Gen Intel Xeon Scalable processors., and Pure Storage FlashArray FlashStack on VMware vSphere 8 solution.
Cisco UCS M7 IMM FlexPod Datacenter with VMware vSphere 8.0, and NetApp ONTAP 9.12 Powered by Intel — Design Guide
Cisco UCS M7 IMM FlexPod Datacenter with VMware vSphere 8.0, and NetApp ONTAP 9.12 powered by Intel design guide
FlashStack Cisco UCS X-Series and Pure Storage FlashArray//X R3 for VMware Horizon 8 — Design Guide
FlashStack Virtual Desktop Infrastructure for VMware Horizon 8 VMware vSphere 8.0 U1 and 4th Gen Intel® Xeon® Scalable processors Design Guide
Cisco UCS with 5th Gen and 4th Gen Intel Xeon Processors for Generative AI
Cisco UCS, powered by 5th Gen Intel® Xeon® processors, delivers a compelling solution for maximizing Generative AI performance.
Generative AI Inferencing with Cisco UCS X-Series M7 Blade Servers / 5th Gen Intel Xeon Processors
Cisco UCS® with Intel® Xeon® Scalable processors and Cisco Nexus® offers a compelling and scalable foundation for deploying generative AI at scale.
GenAI Inferencing Powered by Cisco UCS X-Series / 5th Gen Intel Xeon Processors on Red Hat OpenShift AI — Cisco Validated Design
Cisco, Red Hat, and Intel provide a proven AI infrastructure to enable VMware-based Red Hat® OpenShift® AI.
Microsoft SQL Server 2022 on Cisco UCS X210c M6/M7 on 4th Gen Intel® Xeon® Scalable Processors — White Paper
This white paper contains a reference architecture that illustrates the benefits of Microsoft SQL Server 2022 on Cisco UCS X210c M6/M7 on 4th Gen Intel® Xeon® Scalable Processors for bare-metal and hybrid cloud deployments.