Strategie6 Min.3. Juni 2026

Microsoft bringt MAI-Familie auf der Build-Konferenz mit eigenem Denkmodell zur Reduzierung der Abhängigkeit von OpenAI auf den Markt

Mesa de engenheiro em escritório da Microsoft à noite com três monitores exibindo código, caneca de café e quadro branco com a sigla MAI.

MAI-Thinking-1 hat 35 Milliarden aktive Parameter, einen Kontext von 256.000 Tokens und wurde ohne Destillation von Drittanbietermodellen trainiert, in einem Schritt, den Mustafa Suleyman als echte Eigenständigkeit beschrieb.

Mustafa Suleyman betrat am 2. Juni die Bühne der Build 2026 mit sieben eigenen Modellen von Microsoft und einer These: dem, was er als echte Eigenständigkeit bezeichnete, einer strukturierten Reduzierung der Abhängigkeit von OpenAI für den Generative AI-Stack, der heute den Copilot, die Azure AI Foundry und einen Teil von GitHub unterstützt. Das Flaggschiff ist das MAI-Thinking-1, das erste eigene Denkmodell des Unternehmens, mit 35 Milliarden aktiven Parametern in einer sparse Mixture of Experts-Architektur und insgesamt etwa einer Billion Parametern, einem Kontextfenster von 256.000 Tokens und der wiederholt betonten Tatsache, dass Suleyman zweimal erwähnte: es wurde von Grund auf trainiert, ohne Destillation von Drittanbietermodellen.

Die Wahl des sauberen Trainings ist strategisch, bevor sie technisch ist. Suleyman erklärte, dass unabhängige Bewertende das MAI-Thinking-1 in Blindtests im direkten Vergleich dem Claude Sonnet 4.6 von Anthropic bevorzugten und dass das Modell eine Leistung vergleichbar mit dem Opus 4.6 im SWE-Bench Pro, einem Benchmark für Softwaretechnik, erreicht. Microsoft berichtete auch von einem Score von über 94 % bei AIME 2026 für mathematisches Denken. Eine unabhängige Replikation dieser Ergebnisse wurde jedoch noch nicht mit vollständigen Rohdaten veröffentlicht, und Analysten fordern Vorsicht, bevor sie die Benchmark-Zahlen in Betracht ziehen.

Sieben Modelle, drei Fronten

Neben dem MAI-Thinking-1 stellte Microsoft das MAI-Code-1-Flash vor, ein Codierungsmodell mit 5 Milliarden Parametern, das in allen Plänen von GitHub Copilot und Visual Studio Code ausgerollt wird, sowie das MAI-Image-2.5, das Text-zu-Bild und Bild-zu-Bild kombiniert und im Leaderboard der Arena AI für Bildbearbeitung an zweiter Stelle steht, vor Googles Nano Banana Pro. Die anderen vier Modelle der Reihe decken Sprache, leichte Multimodalität und Flash-Varianten für die Inferenz mit niedriger Latenz ab. Begleitend zu der Reihe von Modellen stellte das Unternehmen das Project Solara vor, eine Plattform für agentenbasierte Systeme, und erläuterte den Maia 200-Beschleuniger, der auf einem Supercomputing-Netzwerk namens Fairwater läuft.

Die These von Microsoft ist nun horizontal: eigene Modelle für Kunden, die eine klare Datenherkunft und ein Training ohne Abhängigkeit von Cross-License-Berechtigungen wünschen, mehr OpenAI für diejenigen, die die Grenze ohne Übergangskosten bevorzugen. In einem Interview mit Semafor beschrieb Suleyman die Initiative als das größte Aufholen, das je gespielt wurde, und erkannte an, dass Microsoft daran arbeitet, ein seit 2019 aufgebautes Defizit an eigenen Modellen zu reduzieren.

Für CIOs ist die Lesart eine vertragliche Risikoanalyse

Für die Unternehmenskunden, die Enterprise Agreements mit integriertem Copilot unterzeichnet haben, wird die Entscheidung, welches Modell den Token bereitstellt, zu einem Beschaffungsverfahren. Microsoft bietet nun einen Weg für Unternehmen, die die Herkunft der Trainingsdaten nachweisen müssen, eine Nachfrage, die durch die Anforderungen des europäischen AI-Gesetzes und interner Audits großer Banken verstärkt wurde. Modelle mit überprüfbarer Datenherkunft werden von regulierten europäischen Kunden bereits seit Anfang dieses Jahres gefordert, und das MAI-Thinking-1 fällt genau in diese Kategorie.

Die Unabhängigkeit hat jedoch Kosten für das Portfolio. Microsoft bleibt ein Azure-Kunde von OpenAI für die Inferenz von GPT und hält eine finanzielle Beteiligung am Labor. Die Ersetzung von GPT durch MAI im Copilot senkt die Stückkosten, verringert jedoch die Gewinnspanne des Cross-Lizenzvertrags. Anthropic, das vorige Woche eine vertrauliche S-1-Registrierung bei der SEC mit einer Bewertung von 965 Milliarden US-Dollar eingereicht hat, sieht in Microsoft gleichzeitig einen Azure-Kunden und einen direkten Wettbewerber um das Budget für Copilot-Abonnements.

Wo der Einfluss ankommt

Für die Offshore-Softwarefabriken in Bengaluru, Pune und Hyderabad beschleunigt das MAI-Code-1-Flash im GitHub Copilot den Übergang zur automatisierten Code-Überprüfung, den TCS, Infosys und Wipro seit dem zweiten Halbjahr 2025 entworfen haben. In den Delivery-Hubs in Polen und den Philippinen ist der Effekt derselbe: Aufgaben der Codierung mit geringer Komplexität migrieren zu diesem Modell, und das Headcount auf Associate-Ebene, das von dieser Art von Arbeit abhing, verliert schneller die vertragliche Rechtfertigung. Für Kunden in den Vereinigten Staaten und Deutschland ist die Lesart anders: Der Produktivitätsgewinn fließt direkt in den Copilot Enterprise-Vertrag, ohne redistributive Wettbewerbe in den Delivery-Zentren.

Der empfohlene Preis für den Zugriff auf MAI-Thinking-1 über Azure wurde auf der Bühne der Build nicht bekannt gegeben, jedoch weisen Analysten kurzfristig auf Kosten pro Million Tokens hin, die unter dem Claude Sonnet 4.6 und GPT-5.1 liegen würden, was den Übergang wirtschaftlich sinnvoll für Unternehmen mit hohen Inferenzvolumina machen würde. Microsoft benötigte fünf Jahre, um sich von der Rolle des exklusiven Wiederverkäufers von OpenAI im Unternehmenssegment zu befreien, und die Build 2026 ist die erste Veranstaltung, bei der das Unternehmen ohne Umschweife als Herausgeber eigener Modelle spricht. Die verbleibende Frage für CIOs ist, ob die Azure-Infrastruktur in der Lage ist, gleichzeitig die Inferenz von GPT, Claude über Bedrock-Azure Cross-Stack und die neue MAI-Familie zu bewältigen, ohne die SLA zu gefährden.