Le créateur de ChatGPT, OpenAI, a présenté Sora, une nouvelle interface capable de créer des séquences vidéo sur la base de texte (image prétexte).

Photo: Michael Dwyer

La start-up de San Francisco n'est pas la première à proposer un logiciel vidéo qui s'appuie sur l'IA générative. Une autre jeune société, Runway, a lancé Gen-2 en juin, avec des séquences de quelques secondes, tandis que Google prépare Lumiere et Meta, Emu, qui ne sont pas encore accessibles à des utilisateurs tiers.

Plus d'infos sur ChatGPT

Quels sont les (rares) métiers qui ne seront pas remplacés par l'IA?

Un expert confronte ChatGPT

Voici les (rares) métiers qui ne seront jamais remplacés par l'IA!

Elle buzze en ce moment

Comment utiliser ChatGPT, la nouvelle intelligence artificielle?

ChatGPT trouve la mystérieuse maladie d'un enfant

Les médecins ne trouvaient pas

ChatGPT découvre la mystérieuse maladie d'un enfant

A en croire la description du logiciel et des exemples présentés sur le site d'OpenAI, Sora apparaît comme l'interface disponible la plus aboutie à ce jour. A partir d'une requête simple, demandant «des images de la Californie durant la ruée vers l'or», Sora a livré un film d'une ville typique du XIXe siècle, comme tourné au drone, qui ressemble à des images d'archives.

Un autre montre une femme japonaise marchant dans une rue de Tokyo, avec des changements d'angles de caméra. Elle est longue d'une minute, la durée maximum que permet Sora en l'état. Seuls ont, pour l'heure, accès à l'interface des «experts de domaine comme la désinformation, les contenus à caractère haineux et les biais».

Contenu tiers

Pour afficher les contenus de prestataires tiers (Twitter, Instagram), vous devez autoriser tous les cookies et le partage de données avec ces prestataires externes.

Être utile aux métiers de la création

Ils vont tester le modèle de façon «adversariale», c'est-à-dire en lui demandant de créer des contenus qui sont théoriquement jugés inacceptables. OpenAI souhaite ainsi se servir de ce retour d'expérience pour fixer des garde-fous à Sora, afin qu'il «rejette des demandes qui sont contraires à nos règlements, notamment celles qui comprennent de l'extrême violence, du sexe, des images haineuses, des célébrités ou du contenu protégé par le droit de la propriété intellectuelle».

Le créateur de ChatGPT a également donné accès à des artistes visuels, des designers et des réalisateurs pour mieux comprendre «comment travailler à ce que le modèle soit le plus utile pour les professionnels de la création». A même de générer une vidéo grâce à une demande écrite, Sora peut aussi le faire à partir d'une image. L'interface est, de même, en mesure de produire une séquence qui va prolonger la durée d'un film existant ou de reconstituer d'éventuels passages manquants d'une vidéo.

(ATS)

Baptisée Sora OpenAI lance une interface capable de générer des séquences vidéo

Être utile aux métiers de la création

Baptisée Sora
OpenAI lance une interface capable de générer des séquences vidéo