Darum gehts
- OpenAI integriert neuen Bildgenerator in ChatGPT, übertrifft Dall-E deutlich
- Nutzer verwandeln Fotos in Cartoons, Ghibli-Stil-Zeichnungen werden populär
- GPT-4o verarbeitet bis zu 20 Elemente korrekt, Bilderzeugung dauert bis zu einer Minute
OpenAI hat am 25. März seinen neuen Bildgenerator in ChatGPT integriert. Die auf GPT-4o basierende Funktion übertrifft den bisherigen Dall-E-Generator gleich um Welten: Es ist quasi Dall-E auf Steroiden. Plus-, Pro- und Team-Nutzer können mit ChatGPT bereits fotorealistische Bilder erstellen, während Gratis-Nutzer laut CEO Sam Altman «noch warten müssen» – die Funktion sei «beliebter als erwartet».
Das Internet quillt zurzeit über mit den von ChatGPT-generierten Bildern. Nutzer verwandeln bekannte Fotos in Cartoons oder umgekehrt. Viele beschreiben die Funktion schlicht als «total verrückt». Auf X (ehemals Twitter) hat sich bereits ein Trend entwickelt: Nutzer verwandeln Bilder in Ghibli-Stil-Zeichnungen. Studio Ghibli ist ein weltberühmtes japanisches Animationsstudio, bekannt für seine Zeichentrickfilme («Mein Nachbar Totoro»). Auch der OpenAI-CEO Sam Altman und Tech-Milliardär Elon Musk beteiligen sich. Letzterer postete ein Bild von sich als Rafiki aus «Der König der Löwen». Auch Boxer Mike Tyson – der einst böse Junge – posiert plötzlich mit Friedenstäubchen.
ChatGPT 4o: Das kann der Bildgenerator
- Präzise Textwiedergabe: Anders als frühere Modelle kann GPT-4o lesbaren Text in Bilder integrieren – es ist noch nicht perfekt, aber ein gewaltiger Schritt vom Kauderwelsch der Vorgänger.
- Objektbindung: Während bisherige KI-Modelle bei fünf bis acht Objekten an ihre Grenzen stossen, verarbeitet GPT-4o bis zu 20 Elemente korrekt – mit richtigen Farben, Formen und Positionen.
- Änderungswünsche: Nutzer können Bilder durch natürliche Konversation verfeinern. «Mach das Bild blauer» oder «Füge einen Hut hinzu» wird sofort umgesetzt.
- Fotorealismus und Stilvielfalt: Das System erzeugt sowohl fotorealistische als auch stilisierte Bilder – von Studio-Ghibli-Ästhetik bis zu trockenen Diagrammen liegt alles drin.
Ideen zum Ausprobieren
Besonders spassig ist es, bestehende Bilder zu ändern. Man kann sich damit etwa in eine Legofigur verwandeln, in «Simpsons»- oder «South Park»-Charaktere, in Sticker oder Kunstwerke im Stil des Dadaismus, Surrealismus oder Minimalismus. Wichtig: OpenAI nutzt von Free- und Plus-Nutzern hochgeladene Bilder zur Modellverbesserung. Nur Enterprise-Konten sind davon ausgenommen.
So funktioniert es
Die Bilderzeugung läuft direkt in ChatGPT. Man beschreibt das gewünschte Bild und definiert Seitenverhältnis, Farbschema und Eigenschaften. Dann generiert das System das Bild sequenziell von oben nach unten – wie ein alter Matrixdrucker. Dabei braucht man Geduld: Eine Bilderstellung kann mehrere Minuten dauern.
Kein sichtbares Wasserzeichen
OpenAI betont zwar strenge Schutzmechanismen, im Alltag merkt man allerdings wenig davon. Bilder von Prominenten erzeugt das System problemlos – etwa Elon Musk und Donald Trump beim Fondue im Oval Office. Es blockt jedoch bei Waffen, expliziten Inhalten und manchen urheberrechtlich geschützten Figuren wie Nintendo-Charakteren. Zwar enthalten die Bilder Metadaten zur KI-Herkunft, aber kein sichtbares Wasserzeichen – ein Risiko für Fake-News. «Kein System ist perfekt», sagt Produktleiterin Jackie Shannon gegenüber der Tech-Plattform theverge.com. «Es ist ein Ausgangspunkt.»
Hilferuf wegen «schmelzender GPUs»
Am Donnerstagabend meldet sich OpenAI-Chef Sam Altman dann nochmals zu Wort – denn der Bild-Hype bringt die Prozessoren an den Anschlag. «Es macht super viel Spass zu sehen, wie die Leute Bilder in ChatGPT lieben. Aber unsere GPUs schmelzen», schreibt Altman auf X. «Wir werden vorübergehend einige Ratenbegrenzungen einführen, während wir daran arbeiten, es effizienter zu gestalten. Hoffentlich dauert es nicht lange!» Laut Altman erhalten Gratis-ChatGPT-Kunden nur noch drei Bildgenerierungen pro Tag. Wer mehr will, muss zahlen.
Debatte um Urheberrechte
Über 400 Prominente – darunter Ben Stiller, Cate Blanchett und Paul McCartney – haben bei der US-Regierung gegen OpenAI und Google protestiert. Ihr Vorwurf: KI-Unternehmen nutzen urheberrechtlich geschützte Werke ohne Vergütung. Die Unterzeichner betonen die Millionen Arbeitsplätze in der Kreativbranche. OpenAI kontert, flexiblere Urheberrechte würden Amerikas KI-Vorsprung gegenüber China stärken – ein Argument, das die Künstler vehement zurückweisen.