Microsoft estrena la familia MAI en Build con un modelo de razonamiento propio para reducir la dependencia de OpenAI

MAI-Thinking-1 tiene 35 mil millones de parámetros activos, contexto de 256 mil tokens y fue entrenado sin destilación de modelos de terceros, en un movimiento que Mustafa Suleyman describió como true self-sufficiency.
Mustafa Suleyman subió al escenario del Build 2026 el 2 de junio con siete modelos propios de Microsoft y una tesis: lo que él denominó true self-sufficiency, una reducción estructurada de la dependencia de OpenAI para el stack de IA generativa que hoy sostiene Copilot, Azure AI Foundry y parte de GitHub. El modelo insignia es el MAI-Thinking-1, el primer modelo de razonamiento propio de la casa, con 35 mil millones de parámetros activos en una arquitectura Mixture of Experts dispersa y aproximadamente un billón de parámetros totales, ventana de contexto de 256 mil tokens y el detalle que Suleyman repitió dos veces: fue entrenado desde cero, sin destilación de modelos de terceros.
La elección del entrenamiento limpio es estratégica antes de ser técnica. Suleyman afirmó que evaluadores independientes prefirieron el MAI-Thinking-1 al Claude Sonnet 4.6 de Anthropic en pruebas ciegas lado a lado, y que el modelo alcanza un rendimiento comparable al Opus 4.6 en SWE-Bench Pro, benchmark de ingeniería de software. Microsoft también informó un puntaje superior al 94% en AIME 2026 para razonamiento matemático. La reproducción independiente de estos resultados, sin embargo, aún no se ha publicado con datos brutos completos, y los analistas han pedido cautela antes de considerar los números de benchmarks de referencia.
Siete modelos, tres frentes
Además del MAI-Thinking-1, Microsoft lanzó el MAI-Code-1-Flash, un modelo de codificación de 5 mil millones de parámetros que entra en despliegue en todos los planes de GitHub Copilot y en Visual Studio Code, y el MAI-Image-2.5, que combina text-to-image e image-to-image y aparece en segundo lugar en el ranking de edición de Arena AI, superando al Nano Banana Pro de Google. Los otros cuatro modelos de la serie cubren voz, multimodalidad ligera y variantes flash para inferencia de baja latencia. Acompañando la oleada de modelos, la casa presentó el Project Solara, plataforma para sistemas agénticos, y detalló el acelerador Maia 200 que funciona en un tejido de supercomputación llamado Fairwater.
La tesis de Microsoft se volvió horizontal: modelos propios para clientes que quieren un linaje de datos claro y entrenamiento sin dependencia de licencias cruzadas, más OpenAI para quienes prefieren la frontera sin costo de transición. En una entrevista con Semafor, Suleyman describió la iniciativa como el greatest game of catchup ever played, reconociendo que Microsoft trabaja para reducir un déficit de capacidad en modelos propios construido desde 2019.
Para CIOs, la lectura es de riesgo contractual
Para los clientes empresariales que firmaron Acuerdos Empresariales con Copilot embebido, la decisión de qué modelo entrega el token deja de ser una elección técnica y pasa a ser una negociación de procurement. Microsoft ahora ofrece un camino para empresas que necesitan comprobar la procedencia de los datos de entrenamiento, una demanda que se ha acentuado en los requisitos del AI Act europeo y en las auditorías internas de grandes bancos. Modelos con linaje auditables se habían solicitado por clientes regulados europeos desde principios de año, y el MAI-Thinking-1 entra exactamente en esa categoría.
La independencia tiene, sin embargo, un costo de cartera. Microsoft sigue siendo cliente de Azure de OpenAI para la inferencia de GPT y tiene participación financiera en el laboratorio. Sustituir GPT por MAI en Copilot reduce el costo unitario, pero comprime el margen del contrato cruzado. Anthropic, que protocolizó un registro confidencial de S-1 en la SEC la semana pasada con una valoración de 965 mil millones de dólares, ve en Microsoft simultáneamente un cliente de Azure y un competidor directo por el presupuesto de suscripciones de Copilot.
Donde el impacto aterriza
Para las fábricas de software offshore en Bengaluru, Pune y Hyderabad, el MAI-Code-1-Flash dentro de GitHub Copilot acelera la transición hacia la revisión de código automatizada que TCS, Infosys y Wipro han estado diseñando desde el segundo semestre de 2025. En los hubs de delivery en Polonia y Filipinas, el efecto es el mismo: tareas de codificación de baja complejidad migran al modelo, y el número de asociados que dependía de este tipo de trabajo pierde justificación contractual más rápido. Para clientes en Estados Unidos y Alemania, la lectura es diferente: la ganancia de productividad entra directamente en el contrato Copilot Enterprise, sin disputa redistributiva del centro de delivery.
El precio sugerido para el acceso al MAI-Thinking-1 a través de Azure no se divulgó en el escenario del Build, pero los analistas a corto plazo apuntan a un costo por millón de tokens inferior al Claude Sonnet 4.6 y al GPT-5.1, lo que haría que la transición fuera económicamente racional para compañías con altos volúmenes de inferencia. Microsoft tardó cinco años en salir del rol de revendedora exclusiva de OpenAI en el segmento empresarial, y el Build 2026 es el primer evento en el que la casa habla como editorial de modelos propios sin rodeos. La pregunta que sobra para los CIOs es si la infraestructura Azure puede absorber, en paralelo, la inferencia de GPT, Claude a través de la pila cruzada Bedrock-Azure y la nueva familia MAI sin comprometer SLA.