Suivez-nous

Technologies

Des algorithmes pour lire le contenu des images

Arnaud

Publié le

 

Par

Capture_daEUR_TM_A_c_cran_2014-11-18_A_16-05-55.jpg

Les ordinateurs seront-ils, un jour, capable de lire et interpréter une image ? Jusqu’à présent, les progrès dans ce domaine restent relativement limités : la reconnaissance de visages déjà identifiés fonctionne plutôt correctement, et quelques avancées se sont fait jour pour essayer, également, de caractériser les images. Ainsi, l’équipe du défunt EverPix, des français installés en Californie, avait-elle réussit à catégoriser des genres d’images : coucher de soleil, immeubles, paysage etc…

On reste cependant loin des possibilités humaines de lecture des images. La recherche, pourtant, progresse. Coup sur coup, deux équipes indépendantes, l’une de Stanford, l’autre travaillant sur le projet Google Brain, dévoilent les résultats de leurs recherches, qui visent à permettre à un logiciel d’identifier, et décrire des images, ou des vidéos.

Les deux équipes travaillent sur les mêmes postulats, et dans les mêmes directions. L’algorithme se base sur le système des réseaux de neurones, qui tente de reproduire certains fonctionnements du cerveau humain. Le logiciel essaye d’identifier des motifs, et puise, ensuite, dans son dictionnaire, pour caractériser ce qu’il a vu. Deux réseaux de neurones différents sont sollicités : l’un pour caractériser l’image, l’autre pour la décrire en langage courant.



Les exemples sont surprenant d’acuité, même si certaines erreurs assez manifestes émaillent encore le processus. Ainsi, avec l’algorithme de Google, un Cerf-volant décoré d’un visage pourra être confondu avec un humain. On reste loin, cependant, de la capacité humaine à reconnaitre et analyser des images. Mais, à partir des principes mis en œuvres, et en multipliant les images analysées, les chercheurs semblent pouvoir améliorer encore considérablement l’efficacité de leurs dispositifs.

Source
Les travaux de l’équipe de Stanford