Étape rapide pour améliorer le temps de chargement du modèle sur le GPU
Le chargement d’un modèle de représentation intermédiaire (IR) d’un modèle d’entrée sur le GPU prend plus de temps que le chargement du même modèle sur un processeur.
Créez manuellement cl_cache répertoire dans le répertoire de travail de votre application.
Le pilote utilisera ce répertoire pour stocker les représentations binaires des noyaux compilés. Cela fonctionnera sur toutes les OS prises en charge.
Reportez-vous à cet article pour plus d’informations sur la gestion des cl_cache.
Le chargement de votre modèle d’entrée au format de représentation intermédiaire (IR) sur le GPU prend plus de temps que le chargement du même modèle sur un processeur car la pile du GPU est basée sur OpenCL*. Le temps de chargement dépend du temps de compilation des noyaux OpenCL*.
Lorsque vous activez le cl_cache, la première fois que vous chargez le modèle, cela prend toujours du temps car le noyau OpenCL* compile. Cependant, chaque charge ultérieure du même modèle sera beaucoup plus rapide.