Vous trouverez des informations sur les FLOPS par cycle dans les manuels en ligne, le Guide d’optimisation des GPU oneAPI et Wikipedia.
Besoin de chiffres de performances de débit Peak Tensor pour les éléments suivants :
- FP32 FLOP
- FP16 FLOP
- BF16 FLOPS
Pour Intel® Arc™ graphiques, consultez les manuels en ligne. Consultez Volume 4 - Configurations et téléchargez le fichier PDF. Ce volume fournit les attributs de périphérique, y compris FLOPS/Clk pour la demi-précision et la précision simple à la page 7. À partir de là, le TFLOPS peut être calculé.
Une autre source d’informations publiques est la section oneAPI GPU Optimization Guide. Il existe un tableau des configurations Xe, avec FLOPs/clk pour la simple précision et la demi-précision, y compris pour le Intel® Arc™ Graphics et le Data Center GPU Flex 170. À partir de là, les TFLOPS peuvent être calculés.