1/12

Von Simpsons bis Lego: Der neue Bildgenerator von ChatGPT kann den Stil eines Fotos drastisch verändern.

Foto: ChatGPT / Tobias Bolzern

Darum gehts

OpenAI integriert neuen Bildgenerator in ChatGPT, übertrifft Dall-E deutlich
Nutzer verwandeln Fotos in Cartoons, Ghibli-Stil-Zeichnungen werden populär
GPT-4o verarbeitet bis zu 20 Elemente korrekt, Bilderzeugung dauert bis zu einer Minute

Die künstliche Intelligenz von Blick lernt noch und macht vielleicht Fehler.

Mehr erfahrenFeedback senden

Tobias BolzernRedaktor Digital

OpenAI hat am 25. März seinen neuen Bildgenerator in ChatGPT integriert. Die auf GPT-4o basierende Funktion übertrifft den bisherigen Dall-E-Generator gleich um Welten: Es ist quasi Dall-E auf Steroiden. Plus-, Pro- und Team-Nutzer können mit ChatGPT bereits fotorealistische Bilder erstellen, während Gratis-Nutzer laut CEO Sam Altman «noch warten müssen» – die Funktion sei «beliebter als erwartet».

Das Internet quillt zurzeit über mit den von ChatGPT-generierten Bildern. Nutzer verwandeln bekannte Fotos in Cartoons oder umgekehrt. Viele beschreiben die Funktion schlicht als «total verrückt». Auf X (ehemals Twitter) hat sich bereits ein Trend entwickelt: Nutzer verwandeln Bilder in Ghibli-Stil-Zeichnungen. Studio Ghibli ist ein weltberühmtes japanisches Animationsstudio, bekannt für seine Zeichentrickfilme («Mein Nachbar Totoro»). Auch der OpenAI-CEO Sam Altman und Tech-Milliardär Elon Musk beteiligen sich. Letzterer postete ein Bild von sich als Rafiki aus «Der König der Löwen». Auch Boxer Mike Tyson – der einst böse Junge – posiert plötzlich mit Friedenstäubchen.

Externe Inhalte

Möchtest du diesen ergänzenden Inhalt (Tweet, Instagram etc.) sehen? Falls du damit einverstanden bist, dass Cookies gesetzt und dadurch Daten an externe Anbieter übermittelt werden, kannst du alle Cookies zulassen und externe Inhalte direkt anzeigen lassen.

ChatGPT 4o: Das kann der Bildgenerator

Präzise Textwiedergabe: Anders als frühere Modelle kann GPT-4o lesbaren Text in Bilder integrieren – es ist noch nicht perfekt, aber ein gewaltiger Schritt vom Kauderwelsch der Vorgänger.
Objektbindung: Während bisherige KI-Modelle bei fünf bis acht Objekten an ihre Grenzen stossen, verarbeitet GPT-4o bis zu 20 Elemente korrekt – mit richtigen Farben, Formen und Positionen.
Änderungswünsche: Nutzer können Bilder durch natürliche Konversation verfeinern. «Mach das Bild blauer» oder «Füge einen Hut hinzu» wird sofort umgesetzt.
Fotorealismus und Stilvielfalt: Das System erzeugt sowohl fotorealistische als auch stilisierte Bilder – von Studio-Ghibli-Ästhetik bis zu trockenen Diagrammen liegt alles drin.

Ideen zum Ausprobieren

Besonders spassig ist es, bestehende Bilder zu ändern. Man kann sich damit etwa in eine Legofigur verwandeln, in «Simpsons»- oder «South Park»-Charaktere, in Sticker oder Kunstwerke im Stil des Dadaismus, Surrealismus oder Minimalismus. Wichtig: OpenAI nutzt von Free- und Plus-Nutzern hochgeladene Bilder zur Modellverbesserung. Nur Enterprise-Konten sind davon ausgenommen.

Externe Inhalte

So funktioniert es

Die Bilderzeugung läuft direkt in ChatGPT. Man beschreibt das gewünschte Bild und definiert Seitenverhältnis, Farbschema und Eigenschaften. Dann generiert das System das Bild sequenziell von oben nach unten – wie ein alter Matrixdrucker. Dabei braucht man Geduld: Eine Bilderstellung kann mehrere Minuten dauern.

Externe Inhalte

Kein sichtbares Wasserzeichen

OpenAI betont zwar strenge Schutzmechanismen, im Alltag merkt man allerdings wenig davon. Bilder von Prominenten erzeugt das System problemlos – etwa Elon Musk und Donald Trump beim Fondue im Oval Office. Es blockt jedoch bei Waffen, expliziten Inhalten und manchen urheberrechtlich geschützten Figuren wie Nintendo-Charakteren. Zwar enthalten die Bilder Metadaten zur KI-Herkunft, aber kein sichtbares Wasserzeichen – ein Risiko für Fake-News. «Kein System ist perfekt», sagt Produktleiterin Jackie Shannon gegenüber der Tech-Plattform theverge.com. «Es ist ein Ausgangspunkt.»

Kritik von Studio Ghibli

Hayao Miyazaki, Regisseur beim Studio Ghibli ist alles andere als begeister von KI. Fürden 84-jährigen dürfte der aktuelle Trend ein Schlag ins Gesicht sein. Denn er nannte KI-Animationen bereits 2016 «eine Beleidigung des Lebens selbst». Als ihm damals eine KI-Demo gezeigt wurde, reagierte er angewidert: «Wer sowas erschafft, hat keine Ahnung, was Schmerz bedeutet.» Und weiter: «Ich fühle, dass wir uns dem Ende der Zeit nähern. Wir Menschen verlieren den Glauben an uns selbst.» Auch rechtlich ist die Lage heikel. Rechtsanwalt Josh Weigensberg wirft gegenüber euronoews.com die Frage auf: Wurde das KI-Modell mit Miyazakis Werken trainiert? «Falls ohne Erlaubnis trainiert wurde, ist das problematisch», sagt der Jurist.

Hilferuf wegen «schmelzender GPUs»

Am Donnerstagabend meldet sich OpenAI-Chef Sam Altman dann nochmals zu Wort – denn der Bild-Hype bringt die Prozessoren an den Anschlag. «Es macht super viel Spass zu sehen, wie die Leute Bilder in ChatGPT lieben. Aber unsere GPUs schmelzen», schreibt Altman auf X. «Wir werden vorübergehend einige Ratenbegrenzungen einführen, während wir daran arbeiten, es effizienter zu gestalten. Hoffentlich dauert es nicht lange!» Laut Altman erhalten Gratis-ChatGPT-Kunden nur noch drei Bildgenerierungen pro Tag. Wer mehr will, muss zahlen.

Externe Inhalte

Generelle Debatte um Rechte

Über 400 Prominente – darunter Ben Stiller, Cate Blanchett und Paul McCartney – haben jüngst bei der US-Regierung gegen OpenAI und Google protestiert. Ihr Vorwurf: KI-Unternehmen nutzen urheberrechtlich geschützte Werke ohne Vergütung. Die Unterzeichner betonen die Millionen Arbeitsplätze in der Kreativbranche. OpenAI kontert, flexiblere Urheberrechte würden Amerikas KI-Vorsprung gegenüber China stärken – ein Argument, das die Künstler vehement zurückweisen.

Mehr KI-News