Le mois de septembre est bien riche en nouveautés chez OpenAI. Après avoir annoncé l’intégration de Dall-E 3 à ChatGPT la semaine dernière, elle a annoncé l’arrivée de la nouvelle mise à jour du chatbot. Cette dernière mise à jour inclut deux nouvelles fonctionnalités majeures. Retour sur cette avancée technologique de l’intelligence artificielle avec Guide entreprise.

Intelligence artificielle : la reconnaissance d’image et vocale débarquent sur ChatGPT

Ceci est une première dans l’histoire des IA conversationnelles. Avec sa nouvelle mise à jour, le chatbot d’OpenAI pourra dorénavant voir, entendre et parler avec les fonctionnalités de reconnaissance vocale et la recherche multimodale. Des fonctionnalités plus pratiques afin de rendre le chatbot plus interactif.

Des réponses vocales de ChatGPT

La première amélioration majeure dans la nouvelle mise à jour du chatbot est l’introduction des conversations vocales. Auparavant, seule la recherche vocale était possible avec ChatGPT. Désormais, l’IA conversationnelle exprimera aussi ses réponses oralement. Un moyen plus pratique pour comprendre les enjeux d’un sujet ou pour se faire raconter une histoire. Il est même possible de discuter avec ChatGPT pendant un déplacement. Pour avoir une voix qui sonne le plus naturellement possible et éviter les voix synthétiques trop convaincantes, OpenAI a travaillé avec acteurs vocaux. Ainsi, les utilisateurs pourront choisir entre cinq voix différentes, des voix d’homme comme des voix de femmes : Sky, Juniper, Cove, Embeer, Breeze. Pour engager une conversation vocale, il suffit d’appuyer sur le bouton du casque qui se situe dans le coin supérieur droit de l’écran d’accueil.

Intelligence artificielle : des images dans les prompts

La conversation vocale n’est pas seulement l’amélioration majeure dans cette nouvelle mise à jour de ChatGPT. En effet, OpenAI y a également introduit la reconnaissance d’image. ChatGPT pourra donc aussi interagir avec des images et des photos. Par exemple, en prenant une photo du contenu de votre réfrigérateur et de votre garde-manger, ChatGPT identifiera les ingrédients disponibles et vous donnera différentes recettes selon ce contenu. Cette fonctionnalité est également très utile dans le domaine de l’éduction. En prenant un problème de maths en photo, ChatGPT vous donnera des indices pour vous aider à résoudre le problème. En prenant un repère en photo lors d’un voyage, ChatGPT vous donnera des informations à son sujet. Bref, cette capacité à interagir avec des contenus multimédias offre des milliers de possibilités en termes d’informations.

Qui sont les concernés par cette nouvelle mise à jour ?

Les utilisateurs auront un aperçu de ces nouvelles fonctionnalités dans les deux prochaines semaines. Celles-ci seront disponibles pour l’ensemble des abonnés de ChatGPT Plus et Enterprise. Toutefois, pour le moment, l’option vocale n’est accessible que sur les smartphones (Android et iOS) ainsi que sur les iPads. La reconnaissance d’image quant à elle est disponible pour toutes les interfaces. Ces nouvelles fonctionnalités ont pour but de rendre l’expérience utilisateur plus intuitive et de rapprocher le plus possible l’intelligence artificielle d’une interaction humaine. Par ailleurs, avec ces nouvelles fonctionnalités, OpenAi souhaite conserver son avance mais l’entreprise compte également rattraper son retard face à ses concurrents. En effet, la fonctionnalité reconnaissance d’image est déjà intégrée à Bing Chat et à Google Bard.