Passer au Contenu principal
Base de connaissances pour l'assistance

Pourquoi la latence et le débit sont-ils plus élevés lorsque le modèle d’inférence avec OpenVINO™ banc d’essai sur le GPU est plus élevé que le processeur ?

Type de contenu: Information et documentation de produit   |   ID de l'article: 000093152   |   Dernière révision: 09/02/2023

Descriptif

  • Même modèle déduit avec OpenVINO™ Benchmark sur le processeur et le processeur graphique :
    benchmark_app.exe -m model.xml -d CPU
    benchmark_app.exe -m model.xml -d CPU
  • La latence et le débit résultants sur le GPU sont plus élevés que sur le processeur.
  • Impossible de déterminer pourquoi la latence et le débit d’inférence sur le GPU sont plus élevés que le processeur car une faible latence entraîne un débit élevé.

Résolution

La latence mesure le temps d’inférence nécessaire pour traiter une seule entrée si l’inférence est synchrone.

Lors de l’exécution d’OpenVINO™ Banc d’essai avec des paramètres par défaut, elle est inférence en mode asynchrone. Par conséquent, la latence résultante mesure le temps d’inférence total nécessaire pour traiter le nombre de demandes d’inférence.

En outre, lors de l’exécution de Benchmark App sur un processeur avec des paramètres par défaut, 4 demandes d’inférence sont créées alors que 16 demandes d’inférence sont créées si l’application de banc d’essai est exécutée sur un GPU avec des paramètres par défaut. Par conséquent, la latence résultante de l’inférence sur le GPU est plus élevée que sur le processeur.

Spécifiez le même nombre de demandes d’inférence lors de l’exécution de Benchmark App sur une CPU et une GPU pour une comparaison équitable :
benchmark_app.exe -m model.xml -d CPU -nireq 4
benchmark_app.exe -m model.xml -d CPU -nireq 4

Produits associés

Cet article s'applique aux produits 3.
Logiciels pour processeurs Intel® Xeon Phi™ OpenVINO™ toolkit Bibliothèques de performances

Avis de non-responsabilité

Le contenu de cette page est une combinaison de traduction humaine et informatique du contenu original en anglais. Ce contenu vous est fourni pour votre commodité et à titre informatif seulement et ne saurait être totalement exact ou complet. En cas de contradiction entre la version anglaise de cette page et la traduction, c'est la version anglaise qui prévaut. Afficher la version anglaise de cette page.