Darum gehts
- Google erweitert Gemini mit Canvas für kreative KI-Anwendungen ohne Programmierkenntnisse
- Canvas ermöglicht interaktive Zusammenarbeit zwischen Mensch und KI für Dokumente und Code
- Neue Audio-Overview-Funktion wandelt Dokumente in podcastähnliche Diskussionen zwischen zwei KI-Moderatoren um
Google lässt seine KI Gemini kreativer werden. Mit der neuen Canvas-Funktion können Nutzer ohne Programmierkenntnisse funktionsfähige Web-Anwendungen erstellen – auch ein voll funktionsfähiges Pac-Man-Spiel entsteht in Sekunden.
«Mach mir bitte ein Pac-Man-Spiel in HTML, das im Browser mit den Pfeiltasten spielbar ist.» An dieser Aufgabe, die ich in der Vergangenheit zig Sprachmodellen von OpenAI, Claude und Mistral gestellt habe, bissen sich viele die Zähne aus. Googles KI-Tool (Gemini 2.0 Flash) mit Canvas generierte nicht nur innerhalb von 15 Sekunden den ganzen Code, sondern macht das Game auch sofort spielbar, in einem Vorschaufenster. Ganz perfekt ist das Spiel nicht: So ist das Leveldesign etwas schräg und die Geister lassen sich nicht fressen, aber abgesehen davon kommt das Spiel dem Original sehr nahe. Kurz: Canvas kann was.
Canvas für Zusammenarbeit
Die Idee hinter Canvas ist schnell erklärt: «Es geht um Zusammenarbeit», sagt Dave Citron, Senior Director of Product bei Google. Allerdings nicht untereinander, sondern zwischen Mensch und der KI. Canvas ermöglicht es, direkt mit der KI zu kollaborieren und so auch komplexe Inhalte mit mehreren Prompts zu erstellen. Der interaktive Bereich bei Gemini ist ab sofort weltweit für alle Nutzer verfügbar, auch in der kostenlosen Version.
Canvas deckt zwei Hauptbereiche ab: Dokumente und Code. Bei Dokumenten können Nutzer umfangreiche Texte generieren und sie anschliessend direkt bearbeiten. Die KI versteht Änderungen und passt ihre Vorschläge entsprechend an. Fertige Dokumente lassen sich wiederum direkt in Google Docs exportieren.
Der spannendere Teil ist die Code-Funktion. So kann Gemini mit Canvas zum Beispiel ein Quiz generieren, wenn man gerade das Periodensystem lernt. Das Besondere: Änderungswünsche werden sofort umgesetzt. «Mach die Knöpfe rot», genügt und die Anwendung wird im Hintergrund aktualisiert – ohne eine einzgie Zeile Code selber schreiben zu müssen.
Ergänzend führt Google die Audio-Overview-Funktion ein, die Dokumente in podcastähnliche Diskussionen zwischen zwei KI-Moderatoren umwandelt. Diese Funktion ist zunächst nur auf Englisch verfügbar, weitere Sprachen folgen.