Claude geht in GA im Microsoft Foundry über Blackwell Ultra und schließt das Azure-AWS-Google-Dreieck

Anthropic veröffentlicht Opus 4.8 und Haiku 4.5 in der Produktion auf Azure, betrieben von NVIDIA GB300-Chips. Verfügbarkeit startet in East US und West Europe; UK South und Asien kommen bis zur Mitte Juli.
Anthropic hat Claude am Montag (29.) allgemein verfügbar im Microsoft Foundry gemacht und damit die im Mai gestartete Vorschau beendet. Die Infrastruktur besteht aus den NVIDIA GB300, der Blackwell Ultra-Generation, die der Hersteller ab dem zweiten Quartal in größerem Umfang ausliefert. Claude Opus 4.8 und Claude Haiku 4.5 sind bereits in der von Microsoft gehosteten Messages API verfügbar, mit Inferenzen, die in East US und West Europe laufen und einer geplanten Expansion nach Südostasien, Australien Ost und UK South bis zur Halbzeit Juli.
Microsoft gibt einen Anstieg von 40 % bei der Geschwindigkeit der Token-Generierung im Vergleich zu H100-Clustern und 15 % gegenüber B200 in den veröffentlichten Benchmarks gemeinsam mit dem GA an. Die Einstiegspreise liegen bei 0,25 USD pro Million Tokens für Haiku, 3 USD für Sonnet und 15 USD für Opus, was der Preistabelle der Anthropic-API entspricht. Was sich im Foundry ändert, ist der kommerzielle Rahmen: Claude wird im selben Enterprise Agreement geführt, das das Unternehmen bereits für Microsoft 365, Defender und das OpenAI-Katalog verwendet, mit vereinheitlichter Abrechnung, IAM und Auditierung.
Was sich für den CIO und den CISO ändert
Für den CIO, der bereits Azure kauft, beseitigt das GA zwei Reibungspunkte. Der erste ist regulatorisch: Die Option der US-Datenzone ermöglicht es, dass sensible Daten auf amerikanische Regionen beschränkt bleiben, was einen Pilotversuch in europäischen Banken blockiert hat, die stark auf GDPR- und DORA-Compliance angewiesen sind. Der zweite Punkt ist die Vereinfachung der Governance, da der Defender for Cloud-Apps den Datenverkehr zu Claude bereits als einen weiteren Endpunkt des Foundry sieht, ohne dass die DLP-Richtlinien, die für GPT-5.5 erstellt wurden, neu erstellt werden müssen.
Für den CISO ist die Analyse schwieriger. Die Inferenz auf GB300 eröffnet den nützlichen Kontext, der ohne schwerwiegende Degradation passt, was die Machbarkeit von Agenten, die lange Abläufe innerhalb des SOC orchestrieren, näher bringt. Aber die Governance-Oberfläche wächst: Jeder Foundry-Kunde wird mit der Möglichkeit leben müssen, dass Agenten Claude Code gegen private MCP-Server ausführen, und die von Anthropic parallel angekündigten Kontrollen, mit selbstgehosteten Sandboxes bei Anbietern wie Cloudflare, Modal und Vercel, sind ein Zeichen für diese Besorgnis. Wer Zero Trust ernsthaft umsetzt, wird dies mit seinem PAM verknüpfen müssen, anstatt es dem Agentenloop zu überlassen.
Die Geopolitik des Compute
Die britische und australische Spur im Juli verdient Beachtung. Vor neun Monaten war die Standardwahrnehmung in der Branche, dass regulierte Workloads im Vereinigten Königreich auf die nationale Infrastruktur der Hyperscaler warten müssten, um zu reifen. Der Zeitplan antizipiert nun das Szenario und zwingt lokale IT-Dienstleister, sich früher neu zu organisieren. Das Acceleration Center von PwC in Bangalore, das seit April einen Claude-Pilot innerhalb des Microsoft-Netzwerks betreibt, erhält ein regionales Pendant im Vereinigten Königreich, ohne dass die Datenpipeline neu geschrieben werden muss, und HCLTech hat bereits Kunden aus dem Versicherungssektor informiert, dass es im Juli mit dem Onboarding von Teams im Foundry beginnen wird.
In Brasilien erreicht die Expansion zwei Systeme, die das Produkt außerhalb der bevorzugten Bedingungen gekauft haben. Itaú kündigte im Mai an, Claude in einer Backoffice-Abteilung zu standardisieren, und Bradesco beauftragte Capgemini für eine entsprechende Front. Beide werden ohne neue Verhandlungen von Bedingungen zur Datenverarbeitung in den Foundry migrieren, was den Druck auf die IT-Kostenstellen verringert, die die Vorschau finanziert hatten, während sie auf die allgemeine Verfügbarkeit warteten. Parallel dazu wurde Santander Spanien, das seine primäre Infrastruktur in Madrid hat, von Microsoft als einer der Partner für den Early Access in der Region West Europe genannt.
Der blinde Fleck
Microsoft und Anthropic vermeiden in dieser Woche eine öffentliche Berechnung: Wie viel des Migrationsprozesses von Bedrock zu Foundry bereits im Gange ist. Anthropic schloss das letzte Quartal mit einem annualisierten Umsatz von etwa 30 Milliarden USD ab, mehr als dreimal so viel wie Ende 2025. Der Sprung kam nicht nur von der reinen API. Er resultierte aus Seats Foundry und Bedrock, die von Pilot auf Produktion umschalten, mit mehr als tausend Unternehmensklienten, die jährlich mehr als 1 Million USD zahlen.
Jeder Gigawatt GB300-Kapazität, der jetzt hinzukommt, ist Kapazität, die aus dem verfügbaren Kontingent für den nächsten Einsteiger abgezogen wird, und das Signal für europäische Datenzonen deutet darauf hin, dass Anthropic kein Risiko sieht, die Marge durch die Ausweitung des Footprints zu kannibalisieren. Die offene Frage ist, ob das GA im Foundry Bedrock dazu drängt, die Preise zu senken, oder ob AWS mit eigener Infrastruktur reagiert. Es gibt kein öffentliches Signal in diese Richtung. Was es gibt, ist Foundry, in Produktion, über Blackwell Ultra, heute.