ID de l'article: 000057525 Type de contenu: Maintenance et performances Dernière révision: 31/01/2023

Pourquoi le temps de chargement du modèle vers le GPU est-il plus long que celui du processeur ?

Environnement

kit d’outils OpenVINO™ Plugin GPU Plugin CPU

BUILT IN - ARTICLE INTRO SECOND COMPONENT
En bref

Étape rapide pour améliorer le temps de chargement du modèle sur le GPU

Descriptif

Le chargement d’un modèle de représentation intermédiaire (IR) d’un modèle d’entrée sur le GPU prend plus de temps que le chargement du même modèle sur un processeur.

Résolution

Créez manuellement cl_cache répertoire dans le répertoire de travail de votre application.

Le pilote utilisera ce répertoire pour stocker les représentations binaires des noyaux compilés. Cela fonctionnera sur toutes les OS prises en charge.

Informations complémentaires

Reportez-vous à cet article pour plus d’informations sur la gestion des cl_cache.

Le chargement de votre modèle d’entrée au format de représentation intermédiaire (IR) sur le GPU prend plus de temps que le chargement du même modèle sur un processeur car la pile du GPU est basée sur OpenCL*. Le temps de chargement dépend du temps de compilation des noyaux OpenCL*.

Lorsque vous activez le cl_cache, la première fois que vous chargez le modèle, cela prend toujours du temps car le noyau OpenCL* compile. Cependant, chaque charge ultérieure du même modèle sera beaucoup plus rapide.

Produits associés

Cet article concerne 2 produits

Le contenu de cette page est une combinaison de traduction humaine et informatique du contenu original en anglais. Ce contenu vous est fourni pour votre commodité et à titre informatif seulement et ne saurait être totalement exact ou complet. En cas de contradiction entre la version anglaise de cette page et la traduction, c'est la version anglaise qui prévaut. Afficher la version anglaise de cette page.