La nouvelle IA de ChatGPT peut vous retrouver en quelques minutes
Un panneau, une façade ou un lampadaire : tout est un indice pour le modèle o3.
Un mois après avoir sorti GPT-4.5, qui, comme l’affirmait le PDG d’OpenAI, donne « l’impression de parler à un humain », l’entreprise vient à présent de déployer de nouveaux modèles. Les capacités de l’un d’entre eux sont particulièrement impressionnantes, puisqu’il peut localiser n’importe qui à partir d’une simple photo.
Peut-être avez-vous récemment entendu parler de GeoGuessr ? Il s’agit d’un jeu très populaire qui vous met au défi de deviner où se trouve un endroit sur Terre, uniquement à partir d’une capture d’écran Google Street View. Il semble que le nouveau modèle o3 d’OpenAI excelle en la matière.
Une précision géographique troublante
La puissance du modèle o3 réside dans sa capacité à analyser une image sans aucune métadonnée. Contrairement aux photos traditionnelles qui peuvent contenir des informations GPS, il lui suffit d’observer les indices visuels comme l’architecture, la végétation ou même la lumière. Le système décompose l’image, zoome sur des détails spécifiques et explique son raisonnement pas à pas.
Dans un test réalisé avec ce modèle, o3 a identifié avec précision un lieu à Manhattan en seulement 56 secondes. Il a repéré des détails comme un panneau du restaurant Cipriani, la façade du 120 Park Avenue, et même un conteneur d’expédition vert utilisé comme barrière de construction. Sa réponse incluait les coordonnées exactes : 40,751 8 N, 73,977 5 O.
Ici, o3 a pu localiser l’endroit de manière précise, en fournissant les coordonnées GPS exactes. Cela a été rendu possible grâce au panneau du restaurant, mais même sans un indice aussi évident, il peut localiser une zone en utilisant par exemple uniquement la végétation. Si vous êtes abonné à ChatGPT Plus ou Pro, vous pouvez faire le test avec n’importe quelle photo en extérieur. Bien sûr, plus il y a d’indices, plus c’est facile.
Cette situation pourrait exposer votre localisation à des personnes malintentionnées, mais également à votre employeur ou aux autorités. Si vous publiez régulièrement des photos de vos déplacements, sachez que même sans données GPS, ces images peuvent révéler votre position. Le modèle peut certes se tromper, mais sa précision reste suffisamment élevée pour être préoccupante.
Une vague d’innovations chez OpenAI
Le modèle o3 s’inscrit dans une stratégie plus large d’OpenAI face à la concurrence. Rappelez-vous qu’en février, l’entreprise avait lancé o3-mini et o3-mini-high pour contrer l’arrivée du modèle chinois DeepSeek. La firme poursuit cette dynamique en déployant à présent o3, o4-mini et o4-mini-high qui peuvent « penser avec les images » et résoudre des problèmes visuels complexes.
OpenAI vient également de dévoiler GPT-4.1, GPT-4.1 mini et GPT-4.1 nano. Ces modèles sont proposés via l’API d’OpenAI, avec des tarifs allant de 0,10 $ à 2 $ par million de tokens. Les performances en codage sont particulièrement impressionnantes, avec un score de 54,6 % sur un test de performance (SWE-bench Verified) contre 33,2 % pour GPT-4o.