OpenAI, l'éditeur de ChatGPT, a présenté lundi son nouveau modèle d'intelligence artificielle (IA) générative, GPT-4o, qui permet au chatbot d'interagir avec ses utilisateurs comme un assistant vocal ultra-perfectionné. «Vous avez la transcription, l'intelligence et la capacité à parler, réunies ensemble pour vous apporter le mode vocal», a résumé Mira Murati, directrice technologique de la start-up californienne, lors d'une présentation vidéo diffusée en direct lundi matin.
Avec deux de ses collègues, elle a démontré comment les utilisateurs vont pouvoir interagir avec ChatGPT, lors de conversations fluides, reproduisant de façon bluffante des discussions entre humains. La présentation de l'entreprise qui a lancé la révolution de l'intelligence artificielle générative était très attendue, alors que les géants de la tech multiplient les annonces de nouveaux outils d'IA, toujours plus performants et personnalisés.
Capable de lire les émotions
L'assistant d'IA d'OpenAI, que les utilisateurs peuvent facilement interrompre, est capable de lire les émotions sur leurs visages via la caméra de leur smartphone, de les guider pour faire des exercices de respiration, de leur raconter une histoire ou encore de les aider à résoudre un problème mathématique.
«Tu as l'air joyeux, avec une pointe d'excitation. (...) Tu veux me dire quelle est la source de toute cette bonne humeur?», a ainsi demandé la machine à un ingénieur d'OpenAI. Quand il lui a répondu qu'il était en train de montrer au public à quel point elle est «utile et fabuleuse», elle s'est exclamée en retour «Oh arrête, tu me fais rougir».
Mira Murati a insisté sur le fait que le nouveau modèle GPT-4o est censé apporter à tous ses utilisateurs ses capacités les plus avancées, en production et compréhension de texte, d'images et de sons et voix, via ChatGPT. «Nous sommes vraiment ravis d'apporter GPT-4o à tous nos utilisateurs gratuits. Les utilisateurs payants continueront à bénéficier de limites en termes d'utilisation cinq fois plus élevées que les utilisateurs gratuits», a-t-elle détaillé.
«Comme de la magie»
Depuis le lancement de ChatGPT fin 2022 – son modèle de langage capable de générer du texte sur simple requête en langage courant – Microsoft, principal investisseur d'OpenAI, Google et toute la Silicon Valley sont lancés dans une course aux outils et assistants d'IA. Google doit présenter ses dernières innovations mardi, tandis que Microsoft a un événement pour la presse et les développeurs la semaine prochaine.
Vendredi, Sam Altman avait démenti les rumeurs au sujet des annonces que préparait son entreprise: «Pas GPT-5, pas un moteur de recherche», avait-il déclaré sur X (ex-Twitter). «Mais (...) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer, avait-il ajouté. Pour moi, c'est comme de la magie.» Le trentenaire milliardaire promeut régulièrement sa vision d'une IA qui sera un jour «générale», c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.
OpenAI a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annuels sont de l'ordre de 2 milliards de dollars depuis décembre 2023, soit un niveau de croissance exceptionnel comparable à une poignée d'autres start-up de la région, dont Google et Meta (Facebook).
(AFP)