Google dévoile un aperçu d’une nouvelle fonctionnalité AI pour la caméra

Cette fonctionnalité semble être une version de Google Lens améliorée grâce à l'intelligence artificielle.
Tl;dr
- Google présente une nouvelle fonctionnalité IA avant sa conférence I/O.
- La fonctionnalité utilise la reconnaissance d’images et fonctionne en temps réel.
- Elle ressemblerait à Google Lens et répondrait aux commandes vocales.
- La démo a été réalisée sur un appareil Pixel, souvent premier à recevoir ces fonctionnalités.
Une avancée de l’IA à l’avant-garde pour Google
À la veille de la conférence I/O pour les développeurs, Google laisse entrevoir les contours d’une mystérieuse fonctionnalité IA. L’entreprise a diffusé une courte vidéo qui semble montrer une innovation reposant sur l’utilisation de la caméra pour décrire ce qui se passe en temps réel.
Une technologie mêlant reconnaissance d’images et interactions vocales
Le “prototype” montré dans la vidéo présente ce qui semble être un appareil Pixel avec la caméra ouverte regardant vers la scène de la conférence I/O. L’utilisateur, caméra en main, demande : “Hé, que penses-tu qu’il se passe ici ?”. Une voix répond “on dirait que des gens préparent un grand événement, peut-être une conférence ou une présentation”. L’IA identifie aussi les lettres “IO” comme étant liées à la conférence de Google, et évoque de “nouvelles avancées en intelligence artificielle”. Alors que les voix échangent, leur conversation est retranscrite en direct à l’écran.
One more day until #GoogleIO! We’re feeling 🤩. See you tomorrow for the latest news about AI, Search and more. pic.twitter.com/QiS1G8GBf9
— Google (@Google) May 13, 2024
Quand Google Lens rencontre les commandes vocales
La nature précise de cette fonctionnalité n’est pas clairement définie, mais elle semble rassembler des similitudes avec Google Lens, le moteur de recherche par caméra de Google. Bien que présentée comme une simple ébauche fonctionnelle, elle semble être capable de fonctionner en temps réel et de répondre à des commandes vocales, dans la lignée de l’IA multimodale intégrée aux lunettes intelligentes de Meta.
Une technologie à découvrir très bientôt
Le fait que la démonstration ait été réalisée sur un appareil Pixel est intéressant, car Google propose souvent en avant-première ses nouvelles fonctionnalités d’IA sur cette gamme de produits. Rendez-vous demain, le 14 mai, pour l’ouverture de la conférence Google I/O, où seront dévoilés tous les détails de cette nouvelle technologie.