...
Veröffentlicht von Stephan Heibel am 28.01.2025 um 13:40 Uhr

DeepSeek-R1 Gründer Liang Wenfeng im Interview im Sommer 2024

Interview mit dem Gründer von Deepseek: Wir folgen nicht mehr – jetzt führen wir

DeepSeek-R1 erschüttert Silicon Valley. Gründer Liang Wenfeng: „Wir folgen nicht mehr. Jetzt führen wir.“

27. Januar 2025

Aus dem Englischen übersetzt von https://thechinaacademy.org/interview-with-deepseek-founder-were-done-following-its-time-to-lead/# durch ChatGPT - daher beachten Sie bitte, dass die Übersetzung teilweise nicht wörtlich ist.

Anmerkung der Redaktion von The China Academy:

Silicon Valley gerät ins Wanken. Eine tektonische Verschiebung in der Dominanz der Künstlichen Intelligenz (KI) ist im Gange, und alle Augen richten sich auf China. Im Januar 2025 sorgte DeepSeek-R1 – ein Open-Source-Inferenzmodell des chinesischen KI-Unternehmens DeepSeek – weltweit für Aufsehen. Es erreichte die Leistungsfähigkeit von OpenAI auf Top-Niveau, bei einem API-Preis von nur 1/30 und mit voller Offenheit.

Mit nur 6 Millionen Dollar entwickelte China eines der weltweit besten KI-Modelle und ließ damit die Milliarden-Investitionen von Meta, Google und Microsoft verblassen. Bereits jetzt strömen Nutzer weltweit – vor allem Einzelpersonen und kleine bis mittelständische Unternehmen (KMU) – zu DeepSeek-R1 und nutzen es als Basis für ihre Anwendungen.

Diese ostgeführte Revolution zwingt zu einem globalen Umdenken: Was, wenn die Zukunft der KI nicht in Silicon Valley geschmiedet wird?

Im Folgenden ein übersetztes Interview aus dem Juli 2024 mit dem DeepSeek-Gründer Liang Wenfeng, das kurz nach dem Erfolg des Open-Source-Modells V2 geführt wurde. Dieses seltene Gespräch zeigt, wie ein chinesisches Startup die Giganten überholte und die Regeln der Innovation neu definierte.

Dieser Unternehmer der Nach-85er-Generation trat als Gründer des KI-Startups DeepSeek in Xinwen Lianbo (CCTV News) auf, nahm an einem hochrangigen nationalen Symposium teil und hielt eine Rede.

Wie wurde der erste Schuss im Preiskrieg abgefeuert?

An Yong (Interviewer): Nach der Veröffentlichung des DeepSeek-V2-Modells lösten Sie schnell einen heftigen Preiskrieg in der Branche für große Modelle aus. Manche bezeichnen Sie als Marktstörer.

Liang Wenfeng (Gründer von DeepSeek): Es war nie unsere Absicht, ein Störer zu sein; das geschah eher zufällig.

An Yong: Waren Sie von diesem Ergebnis überrascht?

Liang Wenfeng: Sehr überrascht. Wir hätten nicht gedacht, dass Preise ein so sensibles Thema sind. Wir sind einfach unserem eigenen Tempo gefolgt, haben die Kosten berechnet und die Preise entsprechend festgelegt. Unser Prinzip ist, weder Verluste zu machen noch übermäßige Gewinne anzustreben. Der aktuelle Preis erlaubt uns eine bescheidene Gewinnmarge über unseren Kosten.

An Yong: Fünf Tage später folgte Zhipu AI, und kurz darauf schlossen sich ByteDance, Alibaba, Baidu und Tencent an.

Liang Wenfeng: Zhipu AI senkte die Preise für ein Einstiegsprodukt, während ihre Flaggschiff-Modelle teuer blieben. ByteDance war das erste Unternehmen, das tatsächlich unseren Preis für ein Flaggschiff-Modell erreichte, was dann Druck auf andere ausübte. Da große Unternehmen viel höhere Modellkosten haben als wir, hätten wir nie gedacht, dass jemand Verluste in Kauf nimmt. Es endete damit, dass die Logik der Internet-Ära mit Subventionen übernommen wurde.

An Yong: Von außen betrachtet scheinen Preissenkungen eine Taktik zu sein, um Nutzer zu gewinnen – typisch für den Wettbewerb in der Internet-Ära.

Liang Wenfeng: Nutzer zu gewinnen war nicht unser Hauptziel. Wir haben die Preise gesenkt, weil unsere Kosten bei der Erforschung neuer Modellstrukturen gesunken sind und wir daran glauben, dass sowohl KI- als auch API-Dienste erschwinglich und zugänglich sein sollten.

An Yong: Vor dieser Entwicklung haben die meisten chinesischen Unternehmen einfach die Llama-Modellstruktur kopiert, um Anwendungen zu entwickeln. Warum haben Sie sich entschieden, sich auf die Modellstruktur zu konzentrieren?

Liang Wenfeng: Wenn das Ziel darin besteht, Anwendungen zu entwickeln, ist es sinnvoll, die Llama-Struktur zu übernehmen, um schnell ein Produkt auf den Markt zu bringen. Unser Ziel ist jedoch AGI (Artificial General Intelligence), und dafür müssen wir neue Modellstrukturen erforschen, um innerhalb begrenzter Ressourcen überlegene Fähigkeiten zu erreichen. Das ist Grundlagenforschung für zukünftiges Wachstum. Neben der Architektur haben wir auch Datenaufbereitung und menschliches Denken untersucht – all das spiegelt sich in unseren Modellen wider. Zudem hinkt die Trainingseffizienz und die Kostenstruktur von Llama etwa zwei Generationen hinter den modernsten globalen Standards hinterher.

An Yong: Woher kommt diese Lücke von zwei Generationen?

Liang Wenfeng: Erstens gibt es eine Lücke in der Trainingseffizienz. Wir schätzen, dass die besten Modelle Chinas wahrscheinlich die doppelte Rechenleistung benötigen, um mit den global führenden Modellen mitzuhalten, aufgrund von strukturellen und trainingsdynamischen Unterschieden. Die Dateneffizienz ist ebenfalls nur halb so effektiv, das heißt, wir benötigen doppelt so viele Daten und Rechenressourcen, um die gleichen Ergebnisse zu erzielen. Zusammengenommen entspricht das dem Vierfachen der Ressourcen. Unser Ziel ist es, diese Lücken kontinuierlich zu verkleinern.

An Yong: Die meisten chinesischen Unternehmen verfolgen sowohl Modelle als auch Anwendungen. Warum konzentriert sich DeepSeek ausschließlich auf Forschung?

Liang Wenfeng: Weil wir glauben, dass es derzeit das Wichtigste ist, an globaler Innovation teilzunehmen. Seit Jahren sind chinesische Unternehmen daran gewöhnt, technologische Innovationen, die anderswo entwickelt wurden, zu nutzen und durch Anwendungen zu monetarisieren. Aber das ist nicht nachhaltig. Dieses Mal geht es uns nicht um schnelle Gewinne, sondern darum, die technologische Grenze zu verschieben und das Wachstum des Ökosystems voranzutreiben.

An Yong: Die vorherrschende Meinung aus der Internet- und Mobile-Internet-Ära lautet, dass die USA bei Innovationen führen, während China bei Anwendungen glänzt.

Liang Wenfeng: Wir glauben, dass China mit der wirtschaftlichen Entwicklung allmählich von einem Nutznießer zu einem Beitragsleister werden muss, anstatt weiterhin von den Errungenschaften anderer zu profitieren. In den letzten 30 Jahren der IT-Revolution haben wir kaum an der Kerntechnologie-Innovation teilgenommen.

Wir haben uns daran gewöhnt, dass das Mooresche Gesetz „vom Himmel fällt“ – wir warten 18 Monate auf bessere Hardware und Software. Dasselbe gilt für das Skalierungsgesetz. Diese Fortschritte sind jedoch das Ergebnis generationsübergreifender Bemühungen westlich geführter Technologie-Communities. Da wir nicht aktiv an diesem Prozess teilgenommen haben, haben wir dessen Bedeutung übersehen.

Die eigentliche Lücke liegt in der Originalität, nicht nur in der Zeit

An Yong: Warum hat DeepSeek V2 in Silicon Valley so viele überrascht?

Liang Wenfeng: In den täglichen Innovationen der USA ist das recht gewöhnlich. Ihre Überraschung rührt daher, dass ein chinesisches Unternehmen plötzlich nicht mehr nur ein Nachahmer ist, sondern als Innovator in ihrem Spiel mitspielt – anders als die meisten chinesischen Firmen, die es gewohnt sind zu folgen.

An Yong: Aber im chinesischen Kontext scheint es fast ein Luxus zu sein, reine Innovation zu priorisieren. Die Entwicklung großer Modelle ist kapitalintensiv. Nicht jedes Unternehmen kann es sich leisten, sich ausschließlich auf Forschung zu konzentrieren, ohne sofort kommerzialisieren zu müssen.

Liang Wenfeng: Innovation ist zweifellos teuer, und unsere frühere Tendenz, bestehende Technologien zu übernehmen, hing mit Chinas früherem Entwicklungsstand zusammen. Heute jedoch hat China eine wirtschaftliche Größe erreicht, und die Gewinne von Giganten wie ByteDance und Tencent sind weltweit bedeutend. Uns fehlt es nicht an Kapital, sondern an Selbstvertrauen und der Fähigkeit, hochkarätige Talente für effektive Innovationen zu organisieren.

An Yong: Warum priorisieren chinesische Unternehmen, selbst gut finanzierte Giganten, oft eine schnelle Kommerzialisierung?

Liang Wenfeng: Drei Jahrzehnte lang haben wir Gewinne über Innovation gestellt. Innovation ist nicht rein geschäftsgetrieben; sie erfordert Neugier und kreative Ambition. Wir sind durch alte Gewohnheiten eingeschränkt, aber das ist nur eine Phase.

An Yong: Aber DeepSeek ist ein Unternehmen, kein gemeinnütziges Forschungslabor. Wenn Sie Innovationen entwickeln und diese open-source zugänglich machen – wie zum Beispiel die MLA-Architektur, die im Mai veröffentlicht wurde – werden Konkurrenten sie schnell kopieren. Wo liegt Ihr Wettbewerbsvorteil?

Liang Wenfeng: Bei disruptiver Technologie sind geschlossene Wettbewerbsvorteile nur von kurzer Dauer. Selbst das geschlossene Modell von OpenAI kann nicht verhindern, dass andere aufholen.

Unser echter Wettbewerbsvorteil liegt daher im Wachstum unseres Teams – dem Aufbau von Know-how und der Förderung einer Innovationskultur. Open-Source und wissenschaftliche Veröffentlichungen führen nicht zu großen Verlusten. Für Technologen ist es eine Belohnung, wenn ihnen andere folgen. Open-Source ist kulturell, nicht nur kommerziell. Es ist eine Ehre, etwas zurückzugeben, und es zieht Talente an.

An Yong: Wie reagieren Sie auf marktorientierte Ansichten wie die von Zhu Xiaohu (der fordert, sofortige Kommerzialisierung zu priorisieren, und AGI als unrealistisch abtut)?

Liang Wenfeng: Zhus Logik passt zu kurzfristigen Gewinnprojekten, aber die dauerhaft profitabelsten Unternehmen in den USA sind Technologie-Giganten, die auf langfristiger Forschung und Entwicklung aufgebaut sind.

An Yong: Aber im Bereich der KI reicht eine reine technische Führungsrolle nicht aus. Worauf setzt DeepSeek in größerem Maßstab?

Liang Wenfeng: Wir glauben, dass Chinas KI nicht ewig ein Nachfolger bleiben kann. Oft heißt es, es gebe eine ein- bis zweijährige Lücke zwischen chinesischer und amerikanischer KI. Aber die eigentliche Lücke liegt zwischen Originalität und Nachahmung. Wenn sich das nicht ändert, wird China immer ein Nachfolger bleiben. Einige Erkundungen sind unvermeidlich.

NVIDIAs Dominanz beruht nicht nur auf ihrem eigenen Einsatz – sie ist das Ergebnis westlicher Technologie-Ökosysteme, die gemeinsam Fahrpläne für die nächste Generation von Technologien entwickelt haben. China braucht ähnliche Ökosysteme. Viele inländische Chips scheitern, weil es an unterstützenden Technologie-Communities fehlt und sie auf zweitklassige Erkenntnisse angewiesen sind. Jemand muss sich an die Spitze wagen.

Mehr Investitionen führen nicht immer zu mehr Innovation

An Yong: DeepSeek vermittelt derzeit ein idealistisches Gefühl, das an die frühen Tage von OpenAI erinnert, und Sie setzen auf Open-Source. Planen Sie, wie OpenAI und Mistral, in Zukunft auf ein geschlossenes Modell umzustellen?

Liang Wenfeng: Wir werden nicht auf ein geschlossenes Modell umstellen. Wir glauben, dass der Aufbau eines robusten Technologie-Ökosystems wichtiger ist.

An Yong: Gibt es Pläne zur Kapitalbeschaffung? Medienberichte deuten darauf hin, dass Huanfang【1】 plant, DeepSeek für einen Börsengang auszugliedern. Silicon-Valley-KI-Startups arbeiten zwangsläufig mit großen Akteuren zusammen – werden Sie das auch tun?

Liang Wenfeng: Es gibt keine kurzfristigen Pläne. Unsere Herausforderung war nie Geld, sondern das Embargo für High-End-Chips.

An Yong: Viele argumentieren, dass AGI mutige Allianzen und Sichtbarkeit erfordert, im Gegensatz zum quantitativen Investieren, das in der Geheimhaltung gedeiht. Stimmen Sie dem zu?

Liang Wenfeng: Mehr Investitionen führen nicht unbedingt zu mehr Innovation. Wenn das der Fall wäre, hätten große Technologieunternehmen längst die gesamte Innovation monopolisiert.

An Yong: Vermeiden Sie Anwendungen, weil DeepSeek nicht über die entsprechende operative Expertise verfügt?

Liang Wenfeng: Wir glauben, dass die aktuelle Phase eine Zeit technologischer Innovation ist und keine Phase der Anwendungsexplosion. Langfristig wollen wir ein Ökosystem schaffen, in dem die Branche unsere Technologien und Ergebnisse direkt nutzt. Andere entwickeln B2B- oder B2C-Dienste auf Basis unserer Modelle, während wir uns auf Grundlagenforschung konzentrieren. Wenn eine vollständige Branchenkette entsteht, müssen wir selbst keine Anwendungen entwickeln. Das heißt jedoch nicht, dass wir dazu nicht in der Lage wären. Forschung und Innovation bleiben aber immer unsere oberste Priorität.

An Yong: Warum sollten Kunden DeepSeeks API gegenüber denen großer Anbieter bevorzugen?

Liang Wenfeng: Die künftige Welt wird wahrscheinlich eine mit spezialisierter Arbeitsteilung sein. Grundlagen-KI-Modelle erfordern kontinuierliche Innovation, und große Unternehmen haben ihre Grenzen – sie sind möglicherweise nicht immer die beste Wahl für diese Aufgabe.

An Yong: Aber kann Technologie allein einen signifikanten Wettbewerbsvorsprung schaffen? Sie sagten, es gäbe keine absoluten „Geheimnisse“.

Liang Wenfeng: Geheimnisse gibt es nicht, aber Nachahmung erfordert Zeit und Kosten. NVIDIA-GPUs haben keine versteckte Magie – doch das Aufholen erfordert den Neuaufbau von Teams und das Streben nach deren nächster Generation von Technologien. Das ist der wahre Wettbewerbsvorteil.

An Yong: Nach Ihren Preissenkungen war ByteDance der Erste, der nachzog, was darauf hindeutet, dass sie sich bedroht fühlten. Wie sehen Sie die neue Wettbewerbslandschaft zwischen Startups und Giganten?

Liang Wenfeng: Um ehrlich zu sein, kümmern wir uns nicht wirklich darum. Preissenkungen waren nur etwas, das wir nebenbei gemacht haben. Cloud-Dienste bereitzustellen ist nicht unser Hauptziel – AGI zu erreichen ist es. Bisher haben wir keine bahnbrechenden Lösungen gesehen. Giganten haben Nutzer, aber ihre Cash-Cows fesseln sie auch, was sie anfällig für Störungen macht.

An Yong: Wie sieht Ihrer Meinung nach das Endspiel für die sechs anderen großen KI-Startups in China aus?

Liang Wenfeng: Vielleicht überleben 2-3 von ihnen. Alle verbrennen derzeit Geld. Diejenigen mit klarer Fokussierung und operativer Disziplin werden bestehen. Andere werden sich umorientieren. Der Wert verschwindet nie; sie werden neue Formen annehmen.

An Yong: Was ist Ihre Kernphilosophie, wenn es um Wettbewerb geht?

Liang Wenfeng: Ich konzentriere mich darauf, ob etwas die Effizienz der Gesellschaft steigert und ob wir unsere Stärke in der Wertschöpfungskette der Branche finden können. Solange das Endziel die Effizienz steigert, ist es gültig. Viele Aspekte sind nur vorübergehende Phasen – sich zu sehr darauf zu konzentrieren, führt nur zu Verwirrung.

V2-Modell: Vollständig von heimischen Talenten entwickelt

An Yong: Jack Clark, ehemaliger Policy Lead bei OpenAI und Mitgründer von Anthropic, bemerkte, dass DeepSeek einige dieser „rätselhaften Zauberer“ eingestellt hat, die DeepSeek V2 entwickelt haben. Was zeichnet diese Leute aus?

Liang Wenfeng: Es gibt hier keine „rätselhaften Zauberer“ – nur frische Absolventen von Spitzenuniversitäten, Doktoranden (sogar Viert- oder Fünftsemester-Praktikanten) und junge Talente mit wenigen Jahren Erfahrung.

An Yong: Viele große KI-Unternehmen sind sehr daran interessiert, Talente aus dem Ausland zu rekrutieren. Einige glauben, dass die Top-50-KI-Talente weltweit wahrscheinlich nicht für chinesische Unternehmen arbeiten. Woher kommt Ihr Team?

Liang Wenfeng: V2 wurde vollständig von heimischen Talenten entwickelt. Die globalen Top 50 sind vielleicht heute nicht in China, aber wir streben an, unsere eigenen zu entwickeln.

An Yong: Wie entstand die MLA-Innovation? Es heißt, dass die Idee ursprünglich aus dem persönlichen Interesse eines jungen Forschers hervorging.

Liang Wenfeng: Nach der Zusammenfassung der wichtigsten Entwicklungsmuster der Mainstream-Attention-Architektur hatte er eine plötzliche Inspiration, eine Alternative zu entwerfen. Aber eine Idee in die Realität umzusetzen, ist ein langer Weg. Wir haben ein Team zusammengestellt und Monate damit verbracht, es zu validieren.

An Yong: Diese Art von organischer Kreativität scheint mit Ihrer flachen Organisationsstruktur verbunden zu sein. In Huanfang haben Sie eine Top-Down-Steuerung vermieden. Aber bei AGI – einer hochgradig unsicheren Grenze – setzen Sie hier mehr auf Management?

Liang Wenfeng: DeepSeek bleibt vollständig bottom-up. Wir weisen auch keine Rollen im Voraus zu; die natürliche Arbeitsteilung entsteht. Jeder bringt einzigartige Erfahrungen und Ideen ein, und sie müssen nicht angetrieben werden. Wenn sie auf Herausforderungen stoßen, ziehen sie andere automatisch zu Diskussionen hinzu. Sobald eine Idee jedoch Potenzial zeigt, stellen wir von oben Ressourcen bereit.

An Yong: Möchten Sie noch etwas zu Ihrer Vision hinzufügen?

Liang Wenfeng: Wir brauchen Geduld und Mut, um wirklich zu innovieren. Es ist ein Marathon, kein Sprint.

Referenzen

【1】 Huanfang: Ein quantitatives Investmentunternehmen und früher Unterstützer von DeepSeek.

【2】 MoE: Mixture of Experts, eine Architektur, die die Effizienz von Modellen verbessert, indem spezialisierte Subnetzwerke aktiviert werden.

【3】 Wang Huiwen: Mitgründer von Meituan, der 2023 kurzzeitig in das KI-Geschäft einstieg, bevor er sich wieder zurückzog.

...

Stephan Heibel

Seit 1998 verfolge ich mit Begeisterung die US- und europäischen Aktienmärkte. Ich schreibe nun wöchentlich für mehr als 25.000 Leser über die Hintergründe des Aktienmarktes und die Ursachen von Kursbewegungen. Meine Leser schätzen meinen neutralen, simplen und unterhaltsamen Stil. Als Privatanleger nutzen sie meine Einschätzungen und Anlageideen, um ihr Portfolio unabhängig zu optimieren.

heibel-ticker.de

Twitter LinkedIn YouTube Podcast Xing


Der wöchtenliche Börsenbrief für alle, die professionellen und ehrlichen Rat für ihren Vermögensaufbau suchen. Jetzt gemeinsam mit über 25.000 Mitgliedern kostenfrei erhalten.

Heibel-Unplugged ist der Blog des Heibel-Ticker Börsenbriefs zur Ergänzung fachlicher Börsenexpertise mit dem Investoren-Sentiment

© Copyright 2006 - 2025 Heibel-Unplugged