Suleyman sagt, dass Anthropic "extrem teuer" ist, während Microsoft ihren Plan zur Reduzierung der Abhängigkeit beschleunigt

Der CEO von Microsoft AI erklärte gegenüber Bloomberg, dass Claude zu teuer sei und dass das Ziel darin besteht, die Kosten zu eliminieren. Build 2026 brachte sieben eigene Modelle ohne Distillation von OpenAI oder Anthropic hervor.
Mustafa Suleyman, CEO von Microsoft AI, gab am vergangenen Donnerstag Bloomberg die direkteste Aussage, die ein Geschäftsführer aus Redmond je über seinen größten Drittanbieter von Modellen gemacht hat. "Anthropic ist extrem teuer, und viele Leute suchen dringend nach Alternativen", sagte Suleyman. "Wir zahlen viel Geld an Anthropic, also ist unser Ziel, diese Kosten zu reduzieren und letztendlich zu eliminieren."
Die Aussage kam zwei Tage nach dem Microsoft Build 2026, auf dem Satya Nadella sieben eigene Modelle präsentierte, die ohne Distillation von OpenAI oder Anthropic entwickelt wurden. Darunter ist das MAI-Thinking-1, ein Reasoning-Modell mit 35 Milliarden aktiven Parametern in einer sparse Mixture of Experts-Architektur mit etwa 1 Billion Gesamtparametern und einem Kontextfenster von 256.000 Tokens. Microsoft behauptet, 97,0% im AIME 2025 und 94,5% im AIME 2026 erzielt zu haben, Benchmarks für mathematisches Denken, in denen die führenden Modelle der Konkurrenz derzeit hoch punkten.
Die Dringlichkeit ist finanzieller Natur. Microsoft verpflichtet sich zu Investitionen zwischen 120 und 130 Milliarden US-Dollar im Bereich KI im Geschäftsjahr 2026. Ein bedeutender Teil dieses Flusses speist Rechenzentren, die Claude für Kunden des Foundry betreiben. Die Reduktion der Lizenzgebühren für Drittanbieter-Modelle ist der schnellste Weg, um die Gewinnmarge innerhalb einer Kostenstruktur zu erhöhen, die bereits die Grenzen des Komforts von Wall Street erreicht hat.
Der Druck auf die Unternehmenskäufer
Für den CIO einer europäischen Versicherungsgesellschaft oder eines amerikanischen Gesundheitsdienstleisters ist die operative Botschaft klar: Der Preis pro Token für die führenden Modelle wird fallen, und der Vendor Lock-in bei einem einzigen Anbieter ist die teuerste Entscheidung, die man 2026 treffen kann.
Capgemini, Cognizant und Wipro haben in den letzten zwölf Monaten Teile ihrer Delivery-Center auf Claude Opus 4.7 standardisiert. Nun müssen sie diese Wahl in Beschaffungskomitees verteidigen. Microsoft hat im Foundry über 11.000 Modelle gelistet, darunter Claude Opus 4.8, und ein automatisches Model Router eingeführt: Die Infrastruktur wählt das günstigste Modell aus, das den SLA des Kunden erfüllt. Dieser Router alleine senkt die Kosten in Anwendungsfällen zur Code-Generierung um 30% bis 50%, entsprechend Benchmarks, die Microsoft selbst in einer Konferenz mit Analysten am 2. Juni veröffentlicht hat.
Anthropic hat bis zum Redaktionsschluss dieser Studie nicht öffentlich auf Suleymans Aussage reagiert. Dario Amodei verteidigte in einem Interview mit der New York Times im letzten Monat, dass Anthropic Preise entsprechend dem Wert festsetzen wird, den sie liefert, und nicht aufgrund des Drucks von Wettbewerbern, die noch nicht dasselbe Leistungsniveau erreicht haben. Das Unternehmen hat auch die Seite der Hyperscaler: Amazon investierte kumuliert 25 Milliarden US-Dollar und Google ist der zweitgrößte Kunde für Inferenz.
Die Perspektive außerhalb der Vereinigten Staaten
Der Preiskampf ist nicht nur ein amerikanisches Problem. In Indien haben TCS, Infosys und Wipro gerade die 300.000-Lizenz-Marke für Microsoft 365 Copilot im kombinierten Deployment überschritten, so die von Microsoft am 3. Juni bekannt gegebenen Daten. Jede Kostenreduktion im zugrunde liegenden Modell des Copilot wird zur direkten Gewinnspanne für diese Firmen, die Transformationsprojekte mit integriertem Copilot zu festen Gebühren kalkulieren. Die Fähigkeit zu beweisen, dass der Backend-Copilot auf einem eigenen Microsoft-Modell und nicht auf Claude läuft, eröffnet Gespräche zur Neuaushandlung mit dem Endkunden.
Im Vereinigten Königreich, wo Lloyds Banking Group und HSBC im Mai einen Pilotversuch mit Foundry zur Integration von Agenten in KYC-Prozesse durchgeführt haben, verändert der Model Router die Berechnung der TCO, indem die Entscheidung "welches Modell" vom Architekten entfernt und in ein internes Bietverfahren zwischen den Anbietern verlagert wird. Europäische Banken operieren innerhalb des DORA, und das Audit eines einzelnen Modellanbieters ist zu einem Governance-Element geworden, das sich durch Multiplexierung löst.
In Japan befinden sich MUFG und Mizuho in der Endphase der Auswahl eines LLM-Anbieters für Call Center. Microsoft konkurriert heute mit NEC und NTT Data um diesen Vertrag, und das Argument "Entferne die Zahlungen an Anthropic über den Model Router" hat für japanische Gremien, die historisch ein Ökosystem eines einzigen Anbieters bevorzugen, ein anderes Gewicht.
Das unausgesprochene Element
Suleyman war Mitbegründer von DeepMind und Inflection AI, bevor Microsoft im März 2024 sein Team übernahm. Der Satz "Kosten eliminieren" hat persönliches Gewicht. Microsoft zahlte 650 Millionen US-Dollar, um ihn und das Team von Inflection zu holen, und die erwartete Rendite der Investition misst sich daran, wie viele Prozentpunkte der Rechnung von Anthropic er durch Microsoft-Code ersetzen kann. Der Zyklus ist noch lange nicht abgeschlossen. Anthropic bleibt einer der größten KI-Lieferanten des Foundry, und bestehende Verträge laufen bis 2028.