So funktionieren die drei neuen KI-Agenten
1:52
Gemini 2.0:So funktionieren die drei neuen KI-Agenten

Jetzt kommen die KI-Agenten
Gemini 2.0: Googles KI macht sich selbstständig

Googles neue KI-Agenten machen sich auf den Weg ins Internet. Sie surfen, shoppen und programmieren – fast wie Menschen. Gemini 2.0 markiert damit den Beginn einer neuen Ära.
Publiziert: 11.12.2024 um 16:39 Uhr
|
Aktualisiert: 11.12.2024 um 16:40 Uhr
1/6
Google verbessert seinen KI-Assistenten Gemini.
Foto: Tobias Bolzern

Auf einen Blick

  • Google führt Gemini 2.0 ein: KI navigiert selbstständig im Web
  • Neue KI-Agenten: Astra, Mariner und Jules für verschiedene Anwendungsbereiche
  • Gemini 2.0 Flash arbeitet doppelt so schnell wie Gemini 1.5 Pro
Die künstliche Intelligenz von Blick lernt noch und macht vielleicht Fehler.
nnnnnnn.jpg
Tobias BolzernRedaktor Digital

«Let Google do the googling for you» (lass Google für dich googeln). Diesen Satz hat die Chefin der Google-Suche, Liz Reid im Mai gesagt. Jetzt macht Google das Szenario zur Realität. Die Firma führt mit Gemini 2.0 eine neue Generation seines KI-Assistenten ein, der erstmals eigenständig im Web navigieren und Aufgaben ausführen kann.

Das gab der Technologiekonzern mit Sitz in Mountain View im US-Bundesstaat Kalifornien am Mittwochmorgen (Lokalzeit) bekannt. Google stellt die neue Version der Technologie ab sofort Entwicklern und ausgewählten Testern zur Verfügung.

Gemini: KI-Agenten sind da

Auf Basis von Gemini 2.0 hat Google drei neue KI-Agenten entwickelt, die die neuen Fähigkeiten demonstrieren:

  • Project Astra ist ein universeller Assistent, der Gespräche in mehreren Sprachen führt und sich dabei auch an wichtige Informationen aus vergangenen Konversationen erinnert. Der KI-Agent kann nicht nur verschiedene Sprachen verstehen und mischen, sondern arbeitet auch mit Akzenten. Er greift aktiv auf Google-Dienste wie Suche, Lens und Maps zu, um Fragen zu beantworten oder Orte mit der Handykamera zu identifizieren. In einem Video zeigt Google, wie Astra Türcodes speichert, Kunstwerke erkennt, Wetterdaten abruft oder sagt, wohin eine Buslinie führt. Der Agent läuft auf dem Smartphone, später auch auf speziellen Datenbrillen.
  • Project Mariner kann als Chrome-Erweiterung eigenständig durch Webseiten navigieren. Der Agent arbeitet ausschliesslich im aktiven Browser-Tab und kann dort Text, Bilder und Formulare verarbeiten. Er führt komplexe Mehrschritt-Aufgaben aus, sucht selbstständig nach Informationen und extrahiert relevante Daten. Bei sensiblen Aktionen wie Käufen muss der Nutzer zustimmen. Eine seitliche Anzeige macht seine Denkprozesse sichtbar. In einer Demo konnte Mariner eigenständig Websites durchsuchen und Kontakt-E-Mails extrahieren. In einer weiteren Demo suchte Mariner erst nach Farbpaletten in Bildern von Impressionisten und fügte anschliessend die passenden Ölfarben in den Warenkorb der Shopping-Plattform Etsy.
  • Code-Agent Jules unterstützt Entwickler bei der Fehlersuche und Programmierung, wobei er Änderungen vor der Übernahme zur Prüfung vorlegt.

«Gemini 2.0 markiert den Übergang in eine Ära, in der KI-Assistenten aktiv Aufgaben übernehmen können», sagt Tulsee Doshi, Produktmanagerin bei Google. Gemini 2.0 bildet die technische Grundlage für die neuen KI-Funktionen.

Mensch gegen Maschine

Ab heute können Nutzer eine Chat-optimierte Version von Gemini 2.0 Flash innerhalb der Gemini-App testen. Flash ist Googles Basis-Modell für alltägliche Anwendungen, das auf eine gute Balance zwischen Geschwindigkeit und Leistung ausgelegt ist. Google verspricht: Die neue Version arbeitet doppelt so schnell wie Gemini 1.5 Pro und liefert dabei bessere Ergebnisse und als erste Flash-Version auch mehrsprachige Audioinhalte und Bilder.

Eine zentrale Neuerung ist die Fähigkeit, Tools wie die Google-Suche oder Code-Ausführung zu nutzen. Entwickler können die Flash-Version ab sofort über die Gemini-API testen, die vollständige Version soll im Januar folgen.

Google betont, dass die neuen Fähigkeiten von Gemini schrittweise und unter strengen Sicherheitsvorkehrungen eingeführt werden. Die KI-Agenten sind laut Google noch in der Entwicklungsphase und arbeiten zurzeit langsamer als ein Mensch. Sie sind zudem einer kleinen Testgruppe vorbehalten: Project Astra startet heute mit einem Testprogramm für ausgewählte Nutzer, einige davon testen laut Google den Dienst auch auf einem Prototyp einer Datenbrille. Mehr Details zur Brille will die Firma in Kürze bekannt geben. 

Project Mariner wird ab heute als experimentelle Chrome-Erweiterung von einer begrenzten Gruppe getestet. Der Code-Agent Jules ist zunächst ebenfalls nur für ausgewählte Tester verfügbar, soll aber Anfang 2025 für interessierte Entwickler freigegeben werden.

Externe Inhalte
Möchtest du diesen ergänzenden Inhalt (Tweet, Instagram etc.) sehen? Falls du damit einverstanden bist, dass Cookies gesetzt und dadurch Daten an externe Anbieter übermittelt werden, kannst du alle Cookies zulassen und externe Inhalte direkt anzeigen lassen.
Fehler gefunden? Jetzt melden
Was sagst du dazu?