Passer au Contenu principal
Base de connaissances pour l'assistance

Quelle est la relation entre la complexité d’un modèle et son débit d’inférence ?

Type de contenu: Information et documentation produit   |   ID de l'article: 000059690   |   Dernière révision: 09/03/2026

Environnement

NCS2

Description

Impossible de déterminer pourquoi l’outil de banc d’essai rapporte des FPS d’inférence similaires pour deux modèles de complexités très différentes, ce qui est défini par les opérations en virgule flottante giga (GFLOPs).

Résolution

  • Un nombre plus élevé de FLOP est directement proportionnel à un nombre réduit de FPS. Cependant, il n’y a pas de comparaison équitable entre le FPS et les FLOP.
  • Facteurs pouvant affecter le FPS obtenu à partir de Benchmark Tool :
    • Exécution en mode synchrone et asynchrone
    • Nombre de flux
    • Nombre de demandes d’inférence

Produits connexes

Cet article s'applique à 1 produits.

Avis de non-responsabilité

Le contenu de cette page est une combinaison de traduction humaine et informatique du contenu original en anglais. Ce contenu vous est fourni pour votre commodité et à titre informatif seulement et ne saurait être totalement exact ou complet. En cas de contradiction entre la version anglaise de cette page et la traduction, c'est la version anglaise qui prévaut. Afficher la version anglaise de cette page.