logo 24matins

ChatGPT maintenant capable de parler et interpréter les images

ChatGPT maintenant capable de parler et interpréter les images
Publié le , mis à jour le

Lundi, OpenAI a annoncé avoir doté son programme d’intelligence artificielle de la parole et de la vision.

Ce sont les abonnés de ChatGPT Plus qui vont bientôt pouvoir en profiter, tout comme les organisations clientes du service, des nouvelles capacités de parole et de vision. Dans deux semaines, plus précisément.

La version payante de ChatGPT se dirige vers une version plus intuitive, assure la société qui développe l’intelligence artificielle, OpenAI.

“Une conversation avec ChatGPT” sur une photo

La nouvelle interface de l’IA générative sera prochainement en capacité de traiter des requêtes contenant des images et aussi discuter de façon vocale avec ses utilisateurs.

Ils pourront ainsi prendre en photo un bâtiment et “avoir une conversation avec ChatGPT” relative à l’histoire du monument, ou encore montrer au logiciel ce qu’il y a dans leur frigo pour une suggestion de recette.

Un envol technologique partiellement inquiétant

Bien sûr, OpenAI n’est pas seule sur le secteur. Google, Microsoft pour ne citer que ces géants sont aussi sur les rangs de l’intelligence artificielle générative.

Seulement, la vitesse à laquelle la technologie prend son envol inquiète, et surtout sa capacité à générer des réponses éloignées de la réalité (les “hallucinations”).

La régulation en question

Dans communiqué, OpenAI reconnaissait ainsi en début de semaine :

Les modèles dotés de la vision présentent de nouveaux défis, des hallucinations au fait que des personnes puissent se fonder sur l’interprétation des images par le programme dans des domaines à enjeux élevés.

La société assure avoir avoir “testé le modèle” sur des sujets relatifs à l’extrémisme et aux connaissances scientifiques. Elle s’en remet également aux usages dans la vie réelle et les retours des utilisateurs en vue d’amélioration.

Une interface “pas toujours précise”

OpenAI a aussi réduit les capacités de ChatGPT à “analyser les personnes”, avançant le fait que l’interface “n’est pas toujours précise et [que ses] systèmes doivent respecter la confidentialité des individus”.

Lundi également, la plate-forme de streaming Spotify a annoncé un partenariat avec OpenAI en vue de traduire les podcasts directement avec l’IA. Dans son communiqué, Spotify précise que des podcasts enregistrées en anglais seront disponibles dans d’autres langues “tout en conservant les caractéristiques vocales distinctives du locuteur”.

Publicité

À lire aussi sur 24matins:

Accessibilité : partiellement conforme