Suleyman dice que Anthropic está "extremadamente cara" y Microsoft acelera plan para eliminar dependencia

El CEO de Microsoft AI declaró a Bloomberg que Claude es demasiado caro y que su objetivo es eliminar el costo. Build 2026 lanzó siete modelos propios sin distillation de OpenAI o Anthropic.
Mustafa Suleyman, CEO de Microsoft AI, dio el jueves pasado a Bloomberg la línea más directa que un ejecutivo de Redmond ha producido sobre su mayor proveedor externo de modelos. "Anthropic es extremadamente cara, y muchas personas están urgentemente buscando alternativas", dijo Suleyman. "Pagamos mucho dinero a Anthropic, así que nuestro objetivo es reducir y, al final, eliminar ese costo."
La declaración llegó dos días después del Microsoft Build 2026, donde Satya Nadella presentó siete modelos propios construidos sin distillation de OpenAI o Anthropic. Entre ellos, el MAI-Thinking-1, un modelo de razonamiento de 35 mil millones de parámetros activos en una arquitectura sparse Mixture of Experts con alrededor de 1 billón de parámetros totales y una ventana de contexto de 256.000 tokens. Microsoft afirma un 97,0% en AIME 2025 y un 94,5% en AIME 2026, benchmarks de razonamiento matemático donde los modelos de frontera de la competencia hoy puntúan en el rango alto.
La urgencia es financiera. Microsoft se compromete entre 120.000 y 130.000 millones de dólares en capex de IA en el año fiscal 2026. Parte significativa de ese flujo abastece centros de datos que ejecutan Claude para clientes del Foundry. Reducir la factura de licenciamiento de modelos de terceros es el camino más rápido para abrir margen dentro de una estructura de costos que ya ha llegado al límite del confort de Wall Street.
La presión llega al comprador corporativo
Para el CIO de una aseguradora europea o de una operadora americana de salud, el mensaje operativo es directo: el precio del token de frontera va a caer, y el vendor lock-in en un proveedor único de modelo se ha convertido en la decisión más cara que se puede tomar en 2026.
Capgemini, Cognizant y Wipro han estandarizado parte de los centros de entrega en Claude Opus 4.7 en los últimos doce meses. Ahora tienen que defender esta elección en comités de procurement. Microsoft listó en el Foundry más de 11.000 modelos, incluido Claude Opus 4.8, e introdujo el Model Router automático: la infraestructura elige el modelo más barato que cumpla con el SLA del cliente. Este enrutamiento por sí solo reduce costos en casos de uso de generación de código entre un 30% y un 50%, según benchmarks que la propia Microsoft divulgó en conferencia con analistas el 2 de junio.
Anthropic no comentó públicamente la declaración de Suleyman hasta el cierre de esta nota. Dario Amodei, en entrevista con el New York Times el mes pasado, defendió que Anthropic fijará precios según el valor que entrega, no según la presión de competidores que aún no han alcanzado el mismo nivel de capacidad. La empresa también tiene el lado de los hyperscalers: Amazon ha invertido 25.000 millones de dólares acumulados y Google figura como el segundo mayor cliente de inference.
La lectura desde fuera de Estados Unidos
La guerra de precios no es solo un problema americano. En India, TCS, Infosys y Wipro acaban de superar las 300.000 licencias de Microsoft 365 Copilot en implementación combinada, según datos divulgados por Microsoft el 3 de junio. Cada reducción de costo en el modelo subyacente del Copilot se convierte en margen directo para estas firmas, que fijan precios de proyectos de transformación con Copilot integrado bajo tarifa fija. La capacidad de demostrar que el backend Copilot funcionaría en un modelo propio de Microsoft, y no en Claude, abre la conversación de renegociación con el cliente final.
En el Reino Unido, donde Lloyds Banking Group y HSBC hicieron en mayo un piloto con Foundry para integrar agentes a flujos de KYC, el Model Router cambia la ecuación de TCO al quitar la decisión de "qué modelo" del arquitecto y transferirla a un sistema de pujas internas entre proveedores. Los bancos europeos operan dentro del DORA, y la auditoría de un proveedor único de modelo se ha convertido en un ítem de gobernanza que la multiplexación resuelve.
En Japón, MUFG y Mizuho están en la fase final de selección de proveedor de LLM para call center. Microsoft hoy compite con NEC y NTT Data en este contrato, y el argumento de "elimina el pago a Anthropic vía Model Router" pesa diferente para consejos japoneses que históricamente prefieren un ecosistema único de proveedor.
La pieza que no se ha dicho
Suleyman fue cofundador de DeepMind y de Inflection AI antes de que Microsoft adquiriera su equipo en marzo de 2024. La frase "eliminar el costo" tiene peso personal. Microsoft pagó 650 millones de dólares para traerlo a él y al equipo de Inflection, y la expectativa de retorno de la inversión se mide en cuántos puntos porcentuales de la factura de Anthropic él puede reemplazar por código de Microsoft. El ciclo está lejos de cerrarse. Anthropic sigue siendo uno de los mayores proveedores de IA del Foundry, y contratos vigentes van hasta 2028.