Kevin Riedl

10 min Lesezeit · 01 Jul 2026

Dario hat Open Source den Krieg erklärt. Der echte Krieg geht um deine KI-Rechnung.

Dario Amodei hat Open-Source-KI nicht nur kritisiert. Anthropic hat darauf hingearbeitet, einen Teil davon verbieten zu lassen. Das Unternehmen warf chinesischen Laboren vor, seine Fähigkeiten gestohlen zu haben, und bat Washington um Eingreifen. In der Folge vom 1. Juli der 20VC x SaaStr-Show zerlegten Harry Stebbings, Jason Lemkin und Rory O'Driscoll das Argument, und der interessante Teil ist nicht die Geopolitik. Es ist das, was der Streit darüber verrät, wer die Kosten von LLM-Intelligenz kontrolliert, und wie schnell diese Kontrolle entgleitet.

Das ist unsere Lesart als Engineers, die Client-Workloads für den Lebensunterhalt über diese Modelle verschieben, keine Meinung zur US-China-Politik. Die These ist einfach: Der Open-Source-Krieg ist ein Stellvertreterkrieg um Preismacht. Folge dem Geld, und es wird offensichtlich.

Zahlst du Frontier-Preise für Commodity-Arbeit?

 Kostenloses Erstgespräch buchen

Was hat Anthropic China eigentlich vorgeworfen?

Der Vorwurf lautet Distillation: ein Modell auf den Outputs eines anderen, stärkeren zu trainieren. Im Februar 2026 nannte Anthropic DeepSeek, Moonshot AI und MiniMax und behauptete, sie hätten Claude genutzt, um Fähigkeiten auf eine Weise zu extrahieren, die gegen die Nutzungsbedingungen verstieß. Am 24. Juni eskalierte es und warf Alibaba vor, was es die größte bekannte Distillation-Attacke gegen sich bis dato nannte: rund 28,8 Millionen Austausche über tausende betrügerischer Accounts.

Lies die Formulierung genau. Anthropic räumt ein, dass Distillation selbst eine weit verbreitete und legitime Trainingsmethode ist. Die Beschwerde dreht sich darum, wie es gemacht wurde: der Verstoß gegen die Nutzungsbedingungen und die betrügerischen Accounts, nicht die Technik. Diese Unterscheidung zählt, denn die Lösung, die Anthropic vorantreibt, ist viel breiter als das angebliche Vergehen. Es hat den Kongress gedrängt, gegen Distillation durch chinesische Rivalen vorzugehen, und die ganze Sache als nationale Sicherheit gerahmt: Günstige chinesische Modelle, so das Argument, verkleinern den US-Vorsprung und könnten die militärische und Cyber-KI eines Gegners beschleunigen.

Wenn du die Mechanik dahinter willst, warum Distillation und Fine-Tuning ein starkes Modell so leicht klonbar machen, das ist das technische Herz des Streits. Der geschäftliche Punkt ist, dass die Technik inzwischen günstig genug ist, dass kein einzelnes Labor einen dauerhaften Qualitätsvorsprung halten kann.

Die Protektionismus-Lesart: Ist das Sicherheit oder ein Burggraben?

Rory O'Driscolls Konter in der Show war der schärfste. Es steckt echte Heuchelei darin, wenn ein US-Frontier-Labor, dessen eigene Modelle auf gescrapetem Web und fremdem geistigem Eigentum trainiert wurden, Diebstahl anführt, sobald ein Wettbewerber aus seinen Outputs lernt. Und das vorgeschlagene Mittel wirkt weniger wie Sicherheitspolitik und mehr wie ein mit Regulierung gegrabener Burggraben.

Seine Analogie saß am härtesten: günstige Open-Weight-Modelle zu blockieren, um die Ökonomie eines Frontier-Labors zu schützen, ist wie in den 1980ern IBM-PC-Klone zu verbieten, um IBMs Aktienkurs zu stützen. Klonen ist das, was den Preis des Computings nach unten zog und eine Maschine auf jeden Schreibtisch brachte. Das damals Diebstahl zu nennen hat es nicht gestoppt, und es wird es jetzt nicht stoppen. In seinen Worten ist es „völlig bescheuert".

Die plausibelste Lesart von Anthropics Zug, und die, um die das Panel immer wieder kreiste, ist ein regulatorischer Handel statt einer prinzipientreuen Haltung: einige Einschränkungen auf der heimischen Seite akzeptieren, im Tausch gegen ein bundesweites Verbot destillierter chinesischer Modelle. Das ist Analyse, keine bestätigte Tatsache. Aber es passt zu den Anreizen. Wenn der Stückpreis deines Produkts schnell fällt, ist der günstigste Weg, die Marge zu verteidigen, nicht, ein besseres Produkt zu bauen. Es ist, das günstigere Substitut illegal zu machen.

Kevin Riedl

"Wenn der Preis eines Produkts einbricht, ist der günstigste Weg, die Marge zu verteidigen, das günstigere Substitut illegal zu machen. Das ist ein politischer Kampf, kein Produktkampf, und Käufer sollten ihn genau so behandeln."

Coinbase hat das Experiment bereits gemacht

Während Anthropic über die Regeln streitet, hat ein börsennotiertes Unternehmen gerade gezeigt, was passiert, wenn man das Drama ignoriert und optimiert. Ende Juni sagte Coinbase-CEO Brian Armstrong, die Firma habe ihre internen KI-Ausgaben um rund 50 Prozent gesenkt, während die Token-Nutzung weiter stieg. Er hat das geschafft, ohne einem einzigen Engineer ein Limit zu setzen. Die Hebel waren genau die, die wir mit Clients durcharbeiten:

  • Bessere Defaults, keine Nutzungslimits. Coinbase setzte Engineers standardmäßig auf Open-Weight-Modelle, konkret die GLM- und Kimi-Klasse, ließ ihnen aber die Freiheit, ein Frontier-Modell zu wählen, wenn die Aufgabe es verlangte. Die meisten erreichten ihre alten Limits ohnehin nie, also schlug das Senken des Default-Preises das Überwachen der Nutzung.
  • Aufgabenbasiertes Routing. Prompts werden vorverarbeitet und an das günstigste Modell geroutet, das den Job erledigen kann, unter Berücksichtigung von Preis und Cache-Hits.
  • Caching. Der mit Abstand größte Hebel. Coinbase hob seine Cache-Hit-Rate von rund 5 Prozent auf etwa 60 Prozent.

Das ist derselbe Plan, den wir in wie man LLM-Token-Kosten 2026 senkt darlegen: cachen, was sich wiederholt, die einfache Mehrheit an ein günstiges Modell routen und das Frontier-Modell für den schweren Rest reservieren. Die Router-Schicht, die das sicher macht, vergleichen wir in unserem LLM-Gateway- und Router-Überblick, und die Open-Weight-Modelle, auf die sich Coinbase stützte, sind genau die, die wir im Open-Weight-LLM-Showdown benchmarken.

Das Panel war uneins über die Bedeutung. Lemkin tat Armstrongs Post als „performatives Social Media" ab, sein Punkt war, dass Kostensenkung wenig zählt, wenn der Top-Line-Umsatz flach bleibt. Rory las es als Kostenmanagement-Grundlagen, die jeder kostenbewusste Manager kopieren wird, um ausufernde Modellgebühren zu bremsen. Beide haben recht, und diese Spannung ist die ganze Geschichte der Enterprise-KI gerade jetzt.

Die ROI-Abrechnung, die niemand beim Namen nennen will

Hier ist das unbequeme Muster hinter der Coinbase-Debatte. Unternehmen kippen Millionen in KI-Tokens und posten dieselben Wachstumsraten wie zuvor. Mehr auszugeben hat die Top-Line nicht bewegt. Die Boards haben es bemerkt, und der Gegendruck gegen rücksichtsloses „Token-Maxing" hat begonnen. CFOs wollen eine klare Linie von KI-Ausgaben zu entweder schnellerer Lieferung oder harten Einsparungen unterm Strich, und die meisten können sie noch nicht ziehen.

Das ist kein Argument gegen KI. Es ist ein Argument dafür, sie zu messen. Ein günstigerer Preis pro Token bedeutet nichts, wenn dein Produkt Hunderte Calls pro Aufgabe macht, weshalb wir unermüdlich auf den Unterschied zwischen Kosten pro Token und Kosten pro Aufgabe hämmern. Und die Projekte, die still scheitern, scheitern selten an der Modellqualität. Sie scheitern an Scope, Evals und Integration, den Fehlermustern, die wir in warum KI-Agenten-Projekte abgebrochen werden durchgehen. Wenn du den Zugewinn nicht messen kannst, ist die Rechnung wie Coinbase zu halbieren der rationale erste Schritt, denn zumindest ist die Einsparung real.

Wohin das Geld tatsächlich fließt

Zwei weitere Datenpunkte aus der Woche machen dasselbe Argument von der Kapitalseite: Investoren belohnen jetzt Disziplin und Cash-Generierung, nicht Token-Burn.

  • Kalshi jagt eine 40-Mrd.-Dollar-Bewertung. Die Prognosemarkt-Börse nimmt Kapital zu rund dem Doppelten ihrer vorigen Runde auf, gestützt auf mehr als 2 Mrd. Dollar annualisierten Umsatz und rund 178 Mrd. Dollar annualisiertes Handelsvolumen. Ein Stück Hype ist aber zu korrigieren: Ein IPO steht nicht unmittelbar bevor. CEO Tarek Mansour hat ein Listing vor 2027 ausgeschlossen, mit Ende 2027 oder 2028 als realistischem Fenster.
  • Bending Spoons ist der klügste IPO des Jahres. Der Mailänder Operator ging am 1. Juli an die Nasdaq, bepreist mit 29 Dollar, und schloss seinen ersten Tag fast 40 Prozent im Plus bei rund 40,50 Dollar, eine Marktkapitalisierung nahe 25,7 Mrd. Dollar, mehr als das Doppelte seiner letzten privaten Bewertung. Dorthin ist es nicht durch organisches Nutzerwachstum gekommen. Es kauft klebrige, aber unterperformende Plattformen, darunter AOL, Vimeo, WeTransfer, Eventbrite und Evernote, und hebt dann die Preise, streicht Redundanz und schreibt die Software neu.

In der Show argumentierte Lemkin, dieser Roll-up-Plan komme auf reifes B2B-SaaS zu: eine klebrige, unterperformende Plattform übernehmen, hungrige Operatoren einsetzen, Retention fixen und die Umsatz-Arbitrage abgreifen. Die Namen, die er in den Raum warf, Marketo, Asana, PagerDuty, sind seine Spekulation über künftige Ziele, keine Firmen, die Bending Spoons besitzt. Das Signal darunter ist das, was für jeden zählt, der KI budgetiert: Die öffentlichen Märkte bepreisen Profitabilität und operative Disziplin, nicht Wachstum um jeden Preis. Dieselbe Logik, die einen Roll-up attraktiv macht, macht eine ungemessene KI-Rechnung zur Belastung.

Was das für einen EU-Käufer bedeutet

Du musst dich in einem US-China-Politikstreit nicht auf eine Seite schlagen, um zu handeln. Die Schritte, die deine Rechnung senken, sind heute verfügbar, egal was Washington entscheidet:

  • Behandle Open Weights als erstklassige Option. Der Qualitätsabstand bei echter Coding- und Reasoning-Arbeit hat sich weitgehend geschlossen, zu einem Bruchteil der Frontier-Preise. Coinbase hat es in Produktion bewiesen.
  • Löse Governance über Hosting, nicht über Vermeidung. Die echte Frage bei einem chinesischen Open-Weight-Modell ist nicht die Qualität, sondern wo die Inferenz läuft und wo die Daten landen. Betreibe es self-hosted auf EU-Infrastruktur, und du behältst den Preisvorteil, ohne Daten ins Ausland zu senden. Wir rechnen das in Self-Hosting von LLMs in der EU durch und kartieren die Compliance-Optionen in EU-Datenresidenz für KI-Apps.
  • Route standardmäßig, eskaliere bei Bedarf. Zuerst das günstige Modell, das Frontier-Modell nur, wenn ein Confidence-Check durchfällt. Tracke die Eskalationsrate als KPI.

Wenn ein bundesweites Verbot tatsächlich kommt, gilt es für den US-Zugang, nicht für ein self-hosted Open-Weight-Modell, das auf einem Server in Frankfurt läuft. Souveränität über deinen eigenen Stack ist die Absicherung. Das aufzusetzen, das Routing, die Evals, die Hosting-Entscheidung, ist genau die Arbeit in unseren KI-Enablement-Engagements.

Häufig gestellte Fragen

Was ist Modell-Distillation, und ist sie legal?
Distillation trainiert ein kleineres oder neueres Modell auf den Outputs eines stärkeren. Anthropic selbst nennt die Technik weit verbreitet und legitim. Seine Beschwerde gegen chinesische Labore dreht sich um die Art des Zugriffs, einen angeblichen Verstoß gegen die Nutzungsbedingungen und betrügerische Accounts, nicht um die Technik selbst. Es gibt heute kein allgemeines Gesetz gegen Distillation.
Hat Coinbase seine KI-Ausgaben wirklich um 50 Prozent gesenkt?
Ja. Ende Juni 2026 sagte CEO Brian Armstrong, die internen KI-Ausgaben seien um rund 50 Prozent gefallen, obwohl die Token-Nutzung stieg, erreicht durch Open-Weight-Defaults, aufgabenbasiertes Routing und das Anheben der Cache-Hit-Rate von etwa 5 Prozent auf 60 Prozent, ohne Engineers zu limitieren.
Sind chinesische Open-Weight-Modelle für ein EU-Unternehmen sicher nutzbar?
Die Qualität ist für die meiste Coding- und Reasoning-Arbeit wettbewerbsfähig. Die echte Frage ist Governance: wo die Inferenz läuft und wo deine Daten landen. Ein Open-Weight-Modell self-hosted auf EU-Infrastruktur zu betreiben behält den Kostenvorteil und hält die Daten in der EU. Eine Nicht-EU-API zu nutzen wirft eine Datenresidenz-Frage auf, die du zuerst beantworten musst.
Sollten wir unser Default-Modell auf Open Weights umstellen?
Für hochvolumige, kostensensible Workloads teste es. Route die einfache Mehrheit an ein günstiges Open-Weight-Modell und eskaliere nur dann zu einem Frontier-Modell, wenn ein Confidence-Check durchfällt. Wechsle nie allein aufgrund einer Benchmark-Schlagzeile. Beweise es auf deinem eigenen Eval, denn ein Modell, das 1 von 10 Aufgaben verfehlt, ist nicht günstiger.
Steht Kalshi kurz vor einem IPO zu 40 Milliarden Dollar?
Kalshi nimmt Kapital zu einer Bewertung von rund 40 Milliarden Dollar auf, etwa dem Doppelten der vorigen Runde, aber ein IPO steht nicht unmittelbar bevor. CEO Tarek Mansour hat ein Listing vor 2027 ausgeschlossen, mit Ende 2027 oder 2028 als wahrscheinlicherem Fenster.

Fazit

Der Open-Source-Krieg ist ein Preiskrieg im Mantel der nationalen Sicherheit. Wenn der Preis eines Produkts so schnell fällt, ist der günstigste Weg, die Marge zu verteidigen, das Substitut illegal zu machen, und das ist ein politischer Kampf, kein Produktkampf.

Käufer müssen das Ergebnis nicht abwarten. Coinbase hat den Zug bereits gezeigt: Open-Weight-Defaults, smartes Routing und aggressives Caching halbierten die Rechnung ohne Zugangsverlust. Die Projekte, die scheitern, sind nicht die, die ein günstigeres Modell gewählt haben, sondern die, die den Zugewinn nie gemessen haben. Behandle Open Weights als erstklassige Option, löse Governance über EU-Hosting statt Vermeidung, und route standardmäßig. Souveränität über deinen eigenen Stack ist die einzige Absicherung, die überlebt, egal was Washington entscheidet.

Willst du deinen KI-Stack kosten-auditieren lassen, bevor dein Board fragt?

 Kostenloses Erstgespräch buchen
Kevin Riedl

10 min Lesezeit · 01 Jul 2026