Une vue rapprochée d'un robot de cueillette tenant une tomate en main à côté d'un plant de tomate ayant des fruits mûrs. Des cases jaunes portant les mots « tomate mûre » et une valeur en pourcentage de maturité sont affichées autour de chacune d'entre elles, ce qui démontre l'utilisation de la vision par ordinateur

Qu'est-ce que la vision par ordinateur ?

La vision par ordinateur utilise l'intelligence artificielle (IA) pour voir et interpréter des données visuelles afin d'améliorer les processus, de prendre plus rapidement des réponses proactives et d'offrir une valeur métier et client accrue.

La vision par ordinateur en quelques mots

  • La vision par ordinateur est un type d'IA qui permet aux ordinateurs et aux systèmes d'agir sur des informations obtenues à partir d'images et de vidéos.

  • La vision par ordinateur combine l'Edge Computing, le Cloud Computing, les logiciels et les modèles de Deep Learning IA afin de reconnaître, de classer, d'analyser et d'agir sur les données visuelles collectées.

  • Les entreprises appliquent la vision par ordinateur à divers domaines afin d'améliorer l'automatisation, l'efficacité et la valeur.

author-image

Par

Qu'est-ce que la vision par ordinateur ?

La vision par ordinateur est un type d'IA qui entraîne les ordinateurs à imiter la façon dont les humains voient, à donner un sens à ce qu'ils voient et à agir sur ces informations traitées et analysées. Elle offre divers avantages aux entreprises, notamment : processus rationalisés, performances en hausse, expériences client améliorées et différenciation concurrentielle sur le marché.

La vision par ordinateur est souvent utilisée pour des tâches qui prennent du temps, sont sujettes à des erreurs ou presque impossibles à accomplir par les humains, notamment l'identification et la classification des défauts et des anomalies, le suivi de l'état des machines, l'analyse automatisée des images médicales et la détection des maladies. Ces types de tâches nécessitent la surveillance des opérations, des processus ou d'autres parties de l'activité à partir de plusieurs points de contact, créant ainsi une énorme quantité de données visuelles collectées, à partir desquelles des informations doivent être extraites (souvent en temps quasi-réel) et des décisions doivent être prises.

Utilisations de la vision par ordinateur

La vision par ordinateur utilise des modèles de Machine Learning et de Deep Learning pour entraîner le système à reconnaître des aspects d'une image ou d'une vidéo et à faire des prédictions à leur sujet. Les types de modèles de vision par ordinateur comprennent:

 

  • La classification d'images pour inspecter une image et lui attribuer une étiquette de classe basée sur le contenu. Un tel modèle peut par exemple servir à prévoir les images qui contiennent un chien, un chat ou un client en colère.
  • La segmentation d'images pour identifier des objets et les extraire de leur arrière-plan, par exemple pour isoler une tumeur du tissu cérébral environnant sur une radiographie.
  • La détection d'objets pour numériser des images ou des vidéos et rechercher des objets cibles. Ces modèles mettent généralement en évidence plusieurs objets simultanément et peuvent être utilisés pour des tâches telles que l'identification d'articles en rayon, favorisant une meilleure gestion des stocks, ou d'articles défectueux sur une ligne de production.
  • Le suivi d'objets pour suivre les mouvements des objets détectés lorsqu'ils se déplacent dans un environnement, par exemple dans une voiture autonome afin de suivre les piétons sur les trottoirs ou lorsqu'ils traversent la route.
  • L'extraction de fonctionnalités pour isoler des caractéristiques utiles capturées dans une image ou une vidéo et les partager avec un deuxième algorithme d'IA, qui peut rechercher et récupérer des images correspondantes. Par exemple, l'extraction de fonctionnalités peut être utilisée pour automatiser la surveillance du trafic et la détection d'incidents.
  • La reconnaissance optique de caractères pour extraire et convertir le texte d'une image dans un format lisible par une machine. Ce modèle est souvent utilisé dans les services bancaires et la santé pour traiter des documents importants et les dossiers des patients.

Applications de la vision par ordinateur dans différents secteurs

La vision par ordinateur favorise un éventail de nouveaux cas d'utilisation. Elle aide les entreprises de tous les secteurs à résoudre des problèmes concrets comme la réduction des coûts d'exploitation, l'automatisation des tâches et la création de nouveaux services ou de nouvelles sources de revenus. Voici les principaux secteurs d'activité qui ont recours à la vision par ordinateur et les applications prometteuses de cette technologie.

Automatisation industrielle et fabrication

Les fabricants utilisent la vision par ordinateur pour renforcer l'automatisation, ce qui permet d'améliorer l'efficacité des processus de production, de réduire les erreurs humaines, de renforcer la sécurité des travailleurs et d'augmenter les rendements de production à des coûts inférieurs. Voici quelques applications courantes de la vision par ordinateur dans l'industrie manufacturière:

 

  • Inspection automatisée des produits : l'inspection visuelle des produits est essentielle au contrôle qualité. En automatisant les inspections optiques à l'aide de caméras sur les chaînes de production, de modèles d'IA pour la classification des défauts et la détection des anomalies et de l'edge computing, les fabricants peuvent améliorer la précision et la vitesse du contrôle qualité.
  • Contrôle de la sécurité : la vision par ordinateur peut être utilisée pour surveiller les usines afin d'assurer la sécurité des employés. Par exemple, l'analyse des vidéos en temps réel peut aider à identifier et à alerter le personnel en cas d'accidents ou de déversements ou à détecter l'accès à des zones interdites et dangereuses.

Santé

Des soins préventifs à la planification du traitement du cancer, la vision par ordinateur est utilisée par les établissements de santé de diverses façons pour améliorer la qualité des résultats pour les patients, améliorer la précision, accélérer la détection des maladies, et bien plus encore. Voici des exemples d'application de la vision par ordinateur dans la santé:

 

  • Imagerie médicale : équiper les scanners de tomodensitométrie, les systèmes de radiographie, les caméras d'endoscopie et d'autres technologies d'imagerie médicale avec des systèmes de vision par ordinateur peut favoriser le traitement rapide de quantités massives de données, des flux de travail rationalisés et une évaluation précise et efficace des images. La technologie Deep Learning facilite la pathologie numérique.
  • Surveillance des patients à distance : les caméras et les capteurs équipés d'applications de vision par ordinateur peuvent servir à collecter et analyser des données sur les mouvements du patient (par exemple, localisation des portes ou du corps), afin d'identifier les déviations par rapport aux normes établies et d'alerter les membres de l'équipe de soins sur les besoins urgents éventuels.

Grande distribution

De l'emplacement idéal des produits au moment optimal pour un réapprovisionnement du stock en passant par le suivi du comportement des clients en magasin, la vision par ordinateur peut aider les détaillants à découvrir des informations puissantes sur leurs opérations pour une prise de décision plus éclairée. Voici quelques applications courantes de la vision par ordinateur dans la grande distribution:

 

  • Prévention des pertes : les modèles de vision par ordinateur peuvent analyser les données des caméras en magasin ou des bornes d'auto-vérification pour identifier les comportements suspicieux et envoyer des alertes en temps réel aux responsables afin qu'ils puissent intervenir et mettre fin à la fraude.
  • Terminaux de paiement en libre-service sans contact : les détaillants qui cherchent à accroître l'efficacité et à améliorer l'expérience client peuvent tirer parti de la technologie SmartScan 3D et des modèles de vision par ordinateur pour capturer, détecter et reconnaître des produits alimentaires sans code-barres, ce qui permet d'effectuer des commandes rapides et pratiques avec un minimum d'intervention du personnel.

Villes intelligentes

Les technologies des villes intelligentes permettent de recueillir des flux vidéo à partir des caméras dans les rues afin que la municipalité puisse prendre des décisions opérationnelles plus éclairées pour améliorer la sécurité, la mobilité et la qualité de vie des citoyens. Voici quelques cas d'application de la vision par ordinateur dans les villes intelligentes:

 

  • Gestion du trafic : les administrations municipales peuvent mettre en œuvre des systèmes de vision par ordinateur pour surveiller et analyser les intersections et les modèles de trafic, détecter et suivre les véhicules et les piétons afin d'optimiser le flux de trafic et d'améliorer la sécurité au niveau des intersections.
  • Maintenance des infrastructures : les modèles de vision par ordinateur peuvent être entraînés pour reconnaître les problèmes de route et de pont, tels que les nids de poule ou les trottoirs fissurés dans une ville et informer les équipes des endroits nécessitant un entretien.

Fonctionnement de la vision par ordinateur

La vision par ordinateur combine des composants tels que l'Edge Computing, le Cloud Computing, les logiciels et les modèles de Deep Learning IA pour permettre aux ordinateurs de « voir » les données collectées à partir de caméras et de vidéos ; de reconnaître rapidement des objets, des personnes et des modèles spécifiques ; d'en tirer des prédictions et d'agir si nécessaire.

Rôle des réseaux neuronaux convolutifs

Les systèmes de vision par ordinateur utilisent des modèles de Deep Learning issus d'une famille d'algorithmes appelés réseaux neuronaux convolutifs (CNN) permettant de guider le traitement et l'analyse des images. Ces modèles de Deep Learning analysent les valeurs RGB intégrées dans les pixels des images numériques pour détecter des modèles identifiables. Les CNN peuvent être développés pour évaluer les pixels en fonction d'un large éventail de fonctionnalités, notamment la distribution des couleurs, la forme, la texture et la profondeur, et reconnaître et classifier les objets avec précision.

Entraînement des modèles de vision par ordinateur

Avant qu'un système de vision par ordinateur puisse être opérationnel, les scientifiques et les développeurs de données doivent entraîner le modèle de Deep Learning du système pour son cas d'utilisation spécifique. Cela implique la saisie de grandes quantités de données spécifiques à l'application, qui aident le modèle à reconnaître ce qui a été développé pour favoriser l'identification. Par exemple, pour une application de vision par ordinateur conçue pour reconnaître un chien, le modèle doit d'abord savoir à quoi ressemble un chien. Pour ce faire, il est entraîné sur des milliers, voire des millions, d'images de chiens de races, de tailles, de couleurs et de caractéristiques différentes.

La plupart du temps, l'entraînement a lieu dans des centres de données ou des environnements Cloud. Pour les initiatives d'entraînement complexes, des GPU et des accélérateurs d'IA peuvent accélérer le processus et mieux gérer l'augmentation du nombre de paramètres impliqués. Une fois la phase d'entraînement terminée, le modèle dispose des connaissances nécessaires pour interpréter et inférer des informations à partir d'images numériques. Le modèle peut également être ajusté ou réentraîné au fil du temps.

Il est également important de savoir que des modèles de base prêts à l'emploi peuvent servir de points de départ pour développer des solutions de vision par ordinateur. L'ajustement (fine-tuning) de ces modèles accélèrent le développement et évite de partir de zéro.

Déploiement des modèles de vision par ordinateur

Une fois entraînés, les modèles de vision par ordinateur peuvent être déployés sur des systèmes informatiques pour réaliser l'inférence et interpréter certaines conditions sur le terrain, en évaluant en continu les données d'images et de vidéos pour en extraire des informations. Bien que les solutions de vision par ordinateur puissent exécuter des charges de travail d'inférence dans le Cloud ou les centres de données, de nombreuses entreprises explorent aujourd'hui des applications d'IA à l'edge, où les modèles de vision par ordinateur sont plus proches de l'emplacement où les données sont générées sur du matériel léger et optimisé à l'edge ou sur des appareils embarqués.
Les capacités d'inférence IA plus proches de l'edge peuvent offrir plusieurs avantages clés, notamment:

 

  • Vitesse accrue et latence plus faible : le déplacement du traitement et de l'analyse des données là où elles sont générées permet d'accélérer la réponse du système, accélérant les transactions et améliorant les expériences indispensables dans de nombreuses applications de vision par ordinateur.
  • Gestion améliorée du trafic réseau : en réduisant au minimum la quantité de données envoyées vers le Cloud via un réseau, la bande passante, les coûts de transmission et de stockage de grands volumes de données sont ainsi inférieurs.
  • Fiabilité supérieure : la quantité de données que les réseaux peuvent transmettre simultanément est limitée. Pour les sites où la connexion Internet est de mauvaise qualité, le stockage et le traitement des données à l'edge améliore la fiabilité.
  • Sécurité renforcée : avec un déploiement approprié, une solution d'edge computing peut renforcer la sécurité des données en limitant la transmission des données via Internet.
  • Conformité en matière de confidentialité : certains États, clients ou secteurs d'activité exigent que les données utilisées pour les applications de vision par ordinateur restent dans la juridiction où elles ont été créées. L'edge computing peut aider les entreprises à respecter ces règles et réglementations.

Se lancer dans la vision par ordinateur

La vision par ordinateur, tout comme d'autres formes d'IA, a une incidence sur tous les aspects de l'activité. Elle aide les entreprises à réduire les coûts opérationnels, à automatiser des tâches et à identifier de nouveaux services ou de nouvelles sources de revenus potentiels dans divers secteurs d'activité. La puissance de cette technologie concrétise de nouveaux cas d'utilisation, de nouvelles capacités et des innovations qui confèrent une avantage concurrentiel.
Intel accompagne votre entreprise à chaque étape de vos initiatives de vision par ordinateur et d'IA.

Trouvez des solutions d'IA évolutives, prêtes à être déployées, optimisées grâce au matériel et aux logiciels Intel®

FAQ

Foire aux questions

La vision par ordinateur est un type d'IA qui permet aux ordinateurs de « voir » les données collectées à partir d'images et de vidéos. Les systèmes de vision par ordinateur sont utilisés dans un large éventail d'environnements et de secteurs, tels que la robotique, les villes intelligentes, l'industrie manufacturière, la santé et les magasins physiques.

La vision par ordinateur associe les caméras, l'Edge Computing, le Cloud Computing, les logiciels et les modèles d'IA pour aider les systèmes à « voir » et à identifier les objets. Elle utilise le Deep Learning pour former les réseaux neuronaux qui guident le traitement et l'analyse des images du système, ce qui permet d'apprendre à un ordinateur à reconnaître les aspects d'une image ou d'une vidéo et à en faire des prédictions.

Les techniques de réseaux neuronaux convolutifs (CNN) favorisent l'inférence Deep Learning dans la classification d'images et la détection d'objets. Une fois qu'ils sont totalement entraînés, les modèles de vision par ordinateur sont capables de reconnaître des objets, de détecter et de reconnaître des personnes, des choses, ou des détails visuels et même de suivre leurs mouvements.

La vision par ordinateur est utilisée dans de nombreux secteurs, notamment dans l'industrie manufacturière, la vente au détail, la santé et les villes intelligentes afin d'aider les entreprises à réagir et à répondre à des situations en temps quasi-réel. Son utilisation permet d'améliorer les processus et de les automatiser, de détecter rapidement les problèmes potentiels, de répondre rapidement aux situations critiques et d'améliorer l'expérience client.