Auf einen Blick
- Chinesisches KI-Modell Deepseek ist US-Lösungen ebenbürtig
- Deepseek wird KI-Modelle billiger und besser machen
- Schweizer Experten sehen Chancen für die Schweiz
Das Timing war perfekt. Zwei Tage nach seiner Amtseinführung kündigte US-Präsident Donald Trump (78) das Projekt «Stargate» an. Gemeinsam mit OpenAI-Gründer Sam Altman (39) versprach er der Weltöffentlichkeit, man werde 500 Milliarden Dollar in die Hand nehmen, um bahnbrechende Entwicklungen im Bereich der künstlichen Intelligenz (KI) voranzutreiben.
Das war am 22. Januar. Am selben Tag veröffentlichten mehr als 150 chinesische Computerwissenschaftler ein Forschungspapier unter der sperrigen Überschrift: «DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning». Auf 22 Seiten wird darin für technisch Interessierte halbwegs nachvollziehbar erklärt, wie das bislang ausgefeilteste KI-Modell von Deepseek funktioniert und wie es im Vergleich zu bekannten US-Lösungen abschneidet – etwa denen von Altmans Unternehmen.
Deepseek braucht weniger Rechenleistung
Die Zündschnur war in Brand gesetzt, diesen Montag explodierte die Bombe: Die Aktienkurse der amerikanischen Tech-Giganten rauschten in die Tiefe. Der Börsenwert des US-Chipherstellers Nvidia verlor 600 Milliarden Dollar – das entspricht dem sechsfachen Börsenwert der UBS. Auch viele Energieunternehmen mussten massive Verluste hinnehmen. Europäische Konzerne wie Siemens und ABB gerieten mit in den Abwärtssog. Der Grund für die Panik an der Börse: Das neue Deepseek-Modell kommt mit deutlich weniger Rechenleistung und damit deutlich weniger Strom aus als vergleichbare amerikanische Modelle wie ChatGPT oder Claude von Anthropic, die bisher die Krone des KI-Fortschritts darstellten.
Deepseek ist die Sensation, die Beobachter erwarteten, nachdem die Amerikaner begonnen hatten, China die schnellsten und leistungsfähigsten KI-Chips vorzuenthalten. Die Exportbeschränkungen machten die chinesische Forschung aber offenbar nicht schwächer, sondern innovativer. Dass die chinesischen Forscher in der Lage sein würden, mit weniger Rechenleistung ein gleichwertiges Modell zu entwickeln, war für KI-Experten seit mindestens einem Jahr absehbar. Nachrichten über diese Fortschritte wurden in der akademischen Welt geteilt. Jeder, der sich dafür interessierte, konnte sie verfolgen.
Die Weltöffentlichkeit jedoch nahm kaum Notiz davon. Auch nicht die Tech-Szene in den USA, die sich lieber von der allgemeinen Euphorie und irrwitzigen Börsenkursen blenden liess. Eric Schmidt (69), ehemaliger Google-Chef und KI-Investor, sagte noch im Mai, die Chinesen hinkten den Amerikanern zwei bis drei Jahre hinterher. Das Gegenteil war der Fall: Sie waren ihnen dicht auf den Fersen.
Deepseek ist kein Bluff
Jetzt beugen sich die Entwickler in den grossen US-Forschungslabors über das Deepseek-Papier und versuchen zu verstehen, wie sie ihr Modell anpassen und verbessern können. Denn der Quellcode von Deepseek – und das ist ein weiterer Unterschied zu den US-Modellen – liegt offen. Er ist Open Source, wie es in der Fachwelt heisst. Meta-Chef Mark Zuckerberg (40) soll bereits einen «War Room» eingerichtet haben, in dem Software-Ingenieure versuchen, das elektronische Superhirn der Chinesen nachzubauen.
Keine Frage: Der Westen hat die chinesische KI-Forschung unterschätzt. Schon werden Vergleiche mit dem «Sputnik-Schock» von 1957 gezogen, als vermeintlich unterlegene sowjetische Forscher einen Satelliten in die Erdumlaufbahn schossen – früher als die Amerikaner! Heute hat China den Westen bereits in einigen Bereichen überholt: Die erfolgsverwöhnte deutsche Automobilindustrie kapituliert inzwischen vor Chinas E-Auto-Konzernen. Den Kampf um die Solarindustrie hat der Westen bereits vor einiger Zeit verloren.
Doch der Deepseek-Schock geht tiefer: Er zerstört die Überzeugung, dass bahnbrechende Ideen nur in einer freien, liberalen Welt gedeihen können, dass nur dort der Nährboden zu finden sei, auf dem brillante Köpfe ihre kreativen Ideen ausbrüten können. Kein Wunder also, dass sofort Gerüchte aufkamen, bei Deepseek gehe nicht alles mit rechten Dingen zu. OpenAI-Chef Altman zum Beipiel beschwerte sich, Deepseek habe bei seinen Modellen abgekupfert; Italien hat den Zugang zu Deepseek kurzerhand gesperrt.
Doch die Befürchtungen scheinen unbegründet. Imanol Schlag (34), der am ETH AI Center forscht und technischer Leiter des Bereichs Sprachmodelle der Swiss AI Initiative ist, spricht von ersten Überprüfungen, die zeigen, dass «die Arbeit solide und reproduzierbar ist». Der junge KI-Wissenschaftler spricht von einer Chance für die Schweiz und alle anderen Länder, die «nicht von US-Tech-Unternehmen abhängig sein wollen».
Man könne das KI-Modell von Deepseek herunterladen und auf dem eigenen Laptop anwenden. «Ich halte die Wahrscheinlichkeit für gross, dass Open-Source-Modelle bereits in einem halben Jahr so leistungsfähig sein werden wie die besten Modelle von OpenAI heute.»
Billiger und besser
Das chinesische Modell elektrisiert die KI-Szene in der Schweiz auch aus anderen Gründen. «Deepseek ist ein fantastischer Fortschritt», sagt etwa Philipp Aeby (56), CEO des Schweizer Technologieunternehmens RepRisk, das mit künstlicher Intelligenz die Reputationsrisiken von Unternehmen analysiert. Aeby, der sich in der Vergangenheit intensiv mit neuronalen Netzen beschäftigte, ist überzeugt: «Deepseek wird KI-Modelle nicht nur billiger, sondern auch besser machen.»
Aeby geht zudem davon aus, dass die Preise von OpenAI und anderen US-Anbietern wie Meta sinken. «Deepseek trägt zur Demokratisierung von KI-Modellen bei, indem es deren Funktionsweise transparent und für alle zugänglich macht», sagt der RepRisk-Chef. Für die Schweiz eröffne sich die Chance, auf Basis der Erkenntnisse von Deepseek kostengünstige KI-Modelle zu entwickeln. «Hochschulen wie die ETH oder kommerzielle Anwender können nun mit überschaubarem Aufwand eigene KI-Lösungen nachbilden, die den besten Modellen von OpenAI ebenbürtig sind. Ich bin gespannt, ob diese Chance genutzt wird.»