iFLYTEK : Améliorer la reconnaissance vocale grâce à l'IA

iFLYTEK optimise son Cloud pour l'intelligence artificielle en s'appuyant sur les processeurs Intel® Xeon® Scalable de 2e génération.

Synthèse

En tant que leader chinois et mondial dans le domaine de la parole intelligente et de l'intelligence artificielle (IA), iFLYTEK Co., Ltd. (iFLYTEK), fondée en 1999, a établi sa position de leader international dans des technologies comme la reconnaissance vocale et le traitement du langage naturel et a capté plus de 70 % du marché chinois de la technologie vocale.1 À l'avenir, iFLYTEK prévoit d'explorer de nouvelles applications d'IA dans les domaines cognitifs en s'appuyant sur le Cloud iFLYTEK. Le moteur principal de cette plate-forme s'appuie sur la technologie d'IA iFLYTEK, incorpore des données et l'expertise de différents secteurs, et permettra de créer un écosystème de l'IA plus efficace.

Défi

iFLYTEK est particulièrement conscient de l'importance des plates-formes de Cloud computing pour atteindre ses objectifs stratégiques. Elle sait également que le développement de technologies d'IA comme l'apprentissage en profondeur nécessite non seulement d'améliorer les applications de couche supérieure, mais également la prise en charge des plates-formes sous-jacentes sous la forme de l'optimisation du calcul, du traitement des données et des algorithmes. Pour réaliser cette stratégie, iFLYTEK devra établir une relation gagnante à long terme avec un partenaire possédant des capacités d'intégration exhaustives des technologies mentionnées. Un autre besoin est de trouver une plate-forme matérielle plus diversifiée et optimisée à coupler avec le Cloud pour l'intelligence artificielle d'iFLYTEK (appelé ci-après « Cloud IA » et ses applications.

« Intel est non seulement un fournisseur de matériel exceptionnel, mais également un fournisseur de solutions logicielles complètes dans le domaine de l'intelligence artificielle. C'est un partenaire digne de confiance et fiable pour notre stratégie d'intelligence artificielle, qui nous aide à explorer efficacement les voies d'innovation futures dans le domaine de l'intelligence artificielle. » — M. Zhijiang Zhang, vice-président de l'Institut de recherche sur le Cloud computing d'iFLYTEK

Solution

Compte tenu de ces deux considérations, iFLYTEK et Intel ont établi une étroite collaboration. Le portefeuille technologique d'Intel en matière d'IA comprend des plates-formes matérielles polyvalentes, spécialisées et personnalisables, prend en compte à la fois la prise en charge matérielle et l'optimisation des logiciels, et couvre les solutions sur site et dans le Cloud. Intel a non seulement fourni à iFLYTEK des produits matériels avancés comme des processeurs Intel® Xeon® Scalable pour le « cœur » du Cloud IA d'iFLYTEK, mais s'est également efforcée d'accélérer la migration et l'optimisation du code et des modèles pertinents, des processeurs graphiques (GPGPU) à la plate-forme de processeur Intel Xeon Scalable.

Les deux parties ont obtenu des résultats extrêmement positifs jusqu'ici. Pour commencer, iFLYTEK exécute déjà sont Cloud IA sur des processeurs Intel Xeon Scalable. De plus, iFLYTEK a fait passer un grand nombre d'applications d'IA existantes basées sur processeurs graphiques d'utilité générale (GPGPU) sur des plates-formes équipées de processeurs Intel Xeon Scalable et a constaté d'excellentes performances suite à cette optimisation. Cela souligne les premières étapes atteintes par les deux parties dans l'exploration et l'orientation des voies de progression du développement futur de l'IA.

L'acquisition des données, le développement d'algorithmes et la puissance de calcul affectent tous les performances des charges de travail d'IA. Jusqu'à présent, iFLYTEK a rempli les deux premières conditions avec satisfaction. Cependant, il reste toujours d'énormes difficultés à surmonter concernant la puissance de calcul.

Pour améliorer les performances de l'apprentissage en profondeur, le projet « Super Brain » d'iFLYTEK cherche à émuler les neurones du cerveau humain afin de fournir aux appareils vocaux intelligents de la société des capacités de pensée humaine rudimentaires. Pour atteindre cet objectif, iFLYTEK doit surmonter l'énorme difficulté que représente le traitement de vastes quantités de données de formation et de paramètres de modèle. La réalisation de cette profonde simulation nécessite un cluster de superordinateurs d'encore plus grande échelle, de meilleurs algorithmes d'apprentissage en profondeur, ainsi que des systèmes de puces de réseau neuronique personnalisés et dédiés.

iFLYTEK se concentre donc sur Intel, un autre leader de l'industrie de l'IA. M. Zhijiang, vice-président de l'Institut de recherche sur le Cloud computing d'iFLYTEK, décrit la coopération entre les deux parties comme suit : « Nous avons formé un partenariat avec Intel dans le but d'explorer les voies et les orientations du développement à venir dans le domaine de l'intelligence artificielle. Nous ne cherchons pas simplement un partenaire matériel dans le sens habituel. »

Coopération stratégique : commencer par « trouver une solution de remplacement »

Permettre aux ordinateurs de « comprendre » la parole humaine est la principale tâche de la reconnaissance intelligente. Après avoir reçu de nombreuses louanges pour ses réalisations dans le domaine de la reconnaissance vocale au cours des dernières années, iFLYTEK a non seulement établi de robustes capacités de reconnaissance vocale avec des systèmes de reconnaissance vocale s'appuyant sur des algorithmes DNN (Deep Neural Networks), RNN (Recurrent Neural Network) et RNN-CTC (RNN with Connectionist Temporal Classifica­tion), mais a également développé plusieurs structures de reconnaissance vocale intelligente novatrices, comme les réseaux neuroniques FSMN (Feedforward Sequential Memory Neural Networks) et DFCNN (Deep Fully Convolutional Neural Network), qui sont à la pointe des avancées dans le domaine de la technologie de reconnaissance vocale.

« La 2e génération de processeurs Intel Xeon Scalable avec technologie Intel Deep Learning Boost (VNNI) intégrée va accélérer considérablement le traitement de notre IA. Elle améliorera également le TCO de notre Cloud IA en nous permettant de supprimer la carte GPU précédente. Lors de tests réalisés sur des charges de travail réelles dans notre Cloud IA sur des processeurs Intel Xeon Scalable de 2e génération, nous pouvons obtenir des performances semblables ou supérieures en utilisant VNNI qu'avec la solution GPU. » — M. Zhijiang Zhang

Pour affiner davantage la reconnaissance vocale, une formation massive doit être réalisée sur ces structures avec les données qui, à son tour, entraîne le traitement d'énormes charges de travail. L'infrastructure d'apprentissage en profondeur adoptée pour la reconnaissance vocale consiste à relier des ressources de traitement à un système de fichiers parallèles sur un réseau haut débit, sur lequel le moteur de traitement, le cœur du système de reconnaissance vocale, est développé et utilisé dans divers types de modèles de formation et de traitement. Il est évident que la puissance de traitement en parallèle et les capacités de transmission du réseau haut débit affectent directement les performances opérationnelles de cette infrastructure.

Bien qu'iFLYTEK ait précédemment utilisé des solutions GPGPU conventionnelles, le potentiel impressionnant des processeurs Intel Xeon Scalable de 2e génération dans ce type d'application a rendu les ingénieurs d'iFLYTEK impatients de l'utiliser. Les ingénieurs prévoient de tester les performances du processeur dans des systèmes d'apprentissage en profondeur.

« La 2e génération de processeurs Intel Xeon Scalable avec technologie Intel Deep Learning Boost (VNNI) intégrée va accélérer considérablement le traitement de notre IA », explique Zhang. « Elle améliorera également le TCO de notre Cloud IA en nous permettant de supprimer la carte GPU précédente. Lors de tests réalisés sur des charges de travail réelles dans notre Cloud IA sur des processeurs Intel Xeon Scalable de 2e génération, nous pouvons obtenir des performances semblables ou supérieures en utilisant VNNI qu'avec la solution GPU. »

« Nous avons construit un cache de données à chaud avec des SSD Intel® Optane™ dans le Cloud IA afin de fournir un accès rapide aux modèles lors du traitement, ce qui améliore considérablement le temps de réponse moyen du Cloud IA », continue Zhang. « Et nous avons optimisé l'architecture du Cloud IA pour utiliser une combinaison de processeurs Intel Xeon Scalable de 2e génération et de SSD Intel Optane, ce qui nous permet non seulement de tirer les meilleures performances de chacun d'eux, mais équilibre également les performances au niveau du système ».

Résultat

Les performances obtenues du processeur Intel Xeon Scalable de 2e génération et des SSD Intel Optane n'ont pas déçu les experts d'iFLYTEK : en termes de performances, le processeur Intel Xeon Scalable peut compter jusqu'à 28 cœurs hautes performances et la largeur vectorielle supérieure obtenue avec la technologie Intel® Advanced Extensions 512 (Intel® AVX-512) le rend particulièrement bien adapté au traitement en parallèle de grosses charges de travail. Ce processeur offre également des possibilités d'évolution importantes et une fiabilité élevée sous des charges de travail hautes performances, et il est donc adapté aux raisonnement rapide des réseaux neuronaux complexes dans le cadre de l'apprentissage en profondeur.

« Le processeur Intel® Xeon® Scalable de 2e génération avec technologie Intel® Deep Learning Boost (Intel® DL Boost) (VNNI) intégrée va grandement accélérer le traitement de l'IA. » — M. Zhijiang Zhang

Récapitulatif

La combinaison de processeurs Intel Xeon Scalable de 2e génération et de SSD Intel Optane peut répondre encore mieux aux besoins du Cloud IA d'iFLYTEK pour accélérer différentes applications. Le Cloud IA exécute généralement plusieurs programmes applicatifs et ces programmes possèdent différentes exigences matérielles. Alors qu'un réseau neuronal profond nécessite des capacités de traitement en virgule flottante hautement parallélisé, de nombreuses autres applications n'ont pas ces besoins et peuvent utiliser fréquemment des processeurs adaptés à un usage général.

En conséquence, pour s'adapter aux différentes applications, le Cloud IA devait être configuré avec un matériel différent. Cependant, l'accroissement de la diversité des plates-formes matérielles augmenterait la complexité des achats, du déploiement, des opérations et de la maintenance, ce qui entraînerait à son tour des coûts beaucoup plus élevés. En conséquence, pour répondre aux besoins complexes des applications, la solution idéale consiste à sélectionner une plate-forme matérielle intégrée capable de réaliser simultanément l'accélération des tâches générales et des applications d'IA. Le processeur Intel Xeon Scalable de 2e génération est le choix évident, car il peut s'adapter à différentes charges applicatives, contribue à accroître la flexibilité de la configuration du Cloud IA, et offre des possibilités d'évolution supérieures tout en réduisant la complexité de la plate-forme et les coûts. De plus, lorsque les applications exécutées initialement sur des GPGPU sont transférées sur un processeur Intel Xeon Scalable de 2e génération et optimisées, il est également possible de réduire le coût total de possession (TCO) tout en assurant un calcul intensif (HPC) hautement performant.

Migration des applications : coopération étroite entre les équipes d'ingénierie des deux parties

La collaboration entre les deux parties a permis à Intel et à iFLYTEK de réaliser que pour bénéficier d'une coopération plus étroite et d'une meilleure migration et optimisation des applications, les deux parties devaient étendre leur coopération au niveau du code. C'est le seul moyen d'atteindre le plus haut niveau d'optimisation.

Alors que les contacts et les communications entre les deux parties s'accroissent, les experts techniques des deux parties ont établi des mécanismes de communication, d'échange et de coopération très efficaces dans des domaines comme la migration et l'optimisation du code et l'optimisation du matériel.

Tout d'abord, dans le domaine de la migration et de l'optimisation du code, les deux parties ont entrepris les tâches suivantes :

  • Clarifier les rôles et les responsabilités. Pour respecter et protéger les droits de propriété intellectuelle d'iFLYTEK, iFLYTEK a réalisé un sommaire abstrait de son modèle de réseau neuronal profond et de l'échelle matricielle, etc., puis a fourni un code de programme et des données à Intel ; ensuite, Intel a migré les codes et les a profondément optimisés en fonction des caractéristiques du processeur Intel Xeon Scalable, comme ses cœurs à haut rendement, l'utilisation de la mémoire et une très grande largeur vectorielle. Cela garantit à son tour que les performances des applications basées sur un processeur Intel Xeon Scalable répondent aux attentes d'iFLYTEK. Ensuite, les résultats de l'optimisation, notamment les paramètres de code et de performance, seront transmis à iFLYTEK, ce qui permettra à iFLYTEK de réaliser la solution optimisée dans son environnement réel, de la déboguer et de la tester, de vérifier la précision et l'efficacité de l'optimisation et finalement d'accélérer les performances des applications dans des environnements de production réels. En outre, iFLYTEK peut appliquer ses méthodes d'optimisation et son expérience de la migration et de l'optimisation à d'autres applications d'IA.
  • Échanger des idées et les expériences de travail régulièrement. Les experts techniques des deux parties tiennent des conférences téléphoniques régulières deux fois par semaine. Dans ces conférences, les deux parties discutent de la progression de leur travail, échangent des informations et parlent de questions techniques importantes, résolvent les problèmes rencontrés, déterminent l'orientation de l'optimisaiton et planifient les étapes suivantes. De plus, les deux parties ont également organisé des visites et des réunions mutuelles de personnel de haut niveau et ont arrangé des contacts en face à face entre leurs experts techniques en vue de mettre à niveau et de maintenir l'environnement de test d'iFLYTEK.

Concernant l'optimisation du matériel, afin d'améliorer les performances de stockage du Cloud IA, iFLYTEK a également adopté les SSD Intel Optane, qui possèdent la technologie Intel® Optane™ et offrent une combinaison de haut débit, de faible latence, de haute qualité de service (QoS) et de haute endurance. L'équipe de la technologie SSD Intel® a aidé iFLYTEK à optimiser pleinement les performances du SSD Intel Optane dans son Cloud IA, ce qui permet d'éliminer les goulots d'étranglement de stockage existants et de bénéficier de tout le potentiel du processeur Intel Xeon Scalable.

Intel a également fourni de nombreuses suggestions de référence concernant l'architecture de la plate-forme Cloud d'iFLYTEK. Des échanges approfondis ont été arrangés entre l'équipe technique d'iFLYTEK et les équipes de Cloud computing et de technologie du Big Data d'Intel Pour le Cloud IA d'iFLYTEK, Intel a fourni des services de consultation complets et a fourni des suggestions concernant certains aspects comme la conception de l'architecture sous-jacente de la plate-forme, l'optimisation des logiciels Cloud et du Big Data, et la maintenance et la gestion opérationnelle du Cloud, etc., aidant ainsi iFLYTEK à lancer avec succès le Cloud IA.

Grâce à cette collaboration étroite et complète, Intel et iFLYTEK ont obtenu des résultats très satisfaisants. iFLYTEK avait pleinement conscience de la richesse des solutions Intel dans les domaines de l'IA et du Cloud computing. En particulier, iFLYTEK a fait passer le traitement de ses applications d'IA, précédemment réalisé sur des GPGPU, sur le processeur Intel Xeon Scalable, a utilisé pleinement les capacités de traitement obtenues grâce à l'optimisation et à la simplification du déploiement et de la maintenance du Cloud IA, tout en réduisant le TCO. Tout au long de ce processus, Intel a bénéficié d'une compréhension approfondie de l'expérience, de la perspective et des besoins essentiels d'iFLYTEK, leader de l'IA, dans le domaine de l'optimisation des applications. De nombreux outils et bibliothèques de logiciels d'Intel, comme Intel® Parallel Studio et Intel® Math Kernel Library pour réseaux neuronaux profonds (Intel® MKL-DNN), ont été considérablement améliorés grâce à cette collaboration, ce qui a permis aux deux parties de profiter d'un partenariat gagnant.

À l'avenir : Collaborer à l'avant-garde de l'intelligence artificielle

La collaboration étroite décrite précédemment a permis à Intel et à iFLYTEK de mieux comprendre les capacités et la perspective de l'autre en matière d'IA. Les deux parties étaient également conscientes de la nécessité de repenser leur relation et de la faire passer d'une coopération matérielle conventionnelle à une collaboration étroite, tant au niveau commercial qu'au niveau stratégique. C'est une excellente occasion pour les deux entreprises de s'ouvrir vers l'avenir et de surfer sur la vague de l'IA. Dans ce contexte, iFLYTEK a déjà commencé à tester et à utiliser davantage de produits et de technologies fournis par Intel. Dans le Cloud IA iFLYTEK fourni aux utilisateurs et aux développeurs dans divers domaines et secteurs, iFLYTEK a déjà commencé à adopter le tout nouveau processeur Intel Xeon Scalable de 2e génération, les SSD Intel Optane et Intel® FPGA, qui peut être personnalisé et offre une prise en charge sans faille des applications.

À l'avenir, Intel et iFLYTEK continueront d'approfondir leur collaboration technologique dans le cadre spécifié dans le protocole d'entente stratégique des deux parties et de faire des efforts communs dans les domaines de l'étude de marché et de la formulation des stratégies de marché.

Explorer les produits Intel® associés

Processeurs Intel® Xeon® Scalable

Générez des données exploitables, faites confiance à la sécurité assistée par matériel et mettez en place des prestations de services dynamiques avec les processeurs Intel® Xeon® Scalable.

En savoir plus

Intel® Deep Learning Boost

Les processeurs Intel® Xeon® Scalable font franchir un nouveau seuil de performances aux applications d'IA grâce à Intel® Deep Learning Boost (Intel® DL Boost).

En savoir plus

Unités de stockage SSD Intel® Optane™ DC

La technologie Intel® Optane™ est la première grande percée en matière de mémoire et de stockage depuis 25 ans.

En savoir plus

Avis et avertissements

Les fonctionnalités et avantages des technologies Intel® dépendent de la configuration du système et peuvent nécessiter du matériel et des logiciels compatibles et l'activation de certains services. Les performances varient d'une configuration à une autre. Aucun ordinateur ne saurait être totalement sécurisé. Consultez le constructeur ou le revendeur de votre ordinateur.vous pouvez consulter le site https://www.intel.fr pour en savoir plus. // Les logiciels et charges de travail utilisés dans les tests de performance ont peut-être été optimisés uniquement pour les microprocesseurs Intel®. Les tests de performance tels que SYSmark* et MobileMark* portent sur des configurations, composants, logiciels, opérations et fonctions spécifiques. Les résultats peuvent varier en fonction de ces facteurs. Pour l'évaluation d'un produit, il convient de consulter d'autres tests et d'autres sources d'information, notamment pour connaître le comportement de ce produit avec d'autres composants. Pour des informations plus complètes, visitez https://www.intel.fr/benchmarks. // Les résultats de performances s'appuient sur les tests réalisés aux dates indiquées dans les configurations et peuvent ne pas refléter toutes les mises à jour de sécurité disponibles. Pour obtenir plus de détails, veuillez lire les informations de configuration. Aucun produit ou composant ne saurait être totalement sécurisé. // Les scénarios de réduction de coûts décrits sont fournis à titre d'exemples montrant comment un produit de technologie Intel® donné, dans les circonstances et configurations spécifiées, peut affecter les coûts futurs et entraîner des économies de coûts. Les circonstances peuvent varier selon les cas. Intel ne garantit aucun coût ni réduction de coûts. // Intel ne maîtrise et ne vérifie pas les bancs d'essai cités ici ou sur les sites Web mentionnés en référence. Vous êtes invité à consulter vous-même ces sites Web et à vérifier l'exactitude des données. // Dans certains cas, les résultats ont été estimés ou simulés à l'aide d'une analyse, d'une simulation ou d'une modélisation d'architecture réalisée en interne par Intel et sont mentionnés à titre indicatif. Toute différence matérielle, logicielle ou de configuration du système peut avoir une incidence sur vos performances effectives.

Infos sur le produit et ses performances