Suleyman diz que Anthropic está "extremamente cara" e Microsoft acelera plano para zerar dependência

CEO da Microsoft AI declarou ao Bloomberg que o Claude é caro demais e que a meta é eliminar o custo. Build 2026 lançou sete modelos próprios sem distillation da OpenAI ou da Anthropic.
Mustafa Suleyman, CEO da Microsoft AI, deu na quinta-feira passada ao Bloomberg a linha mais direta que um executivo de Redmond já produziu sobre seu maior fornecedor terceiro de modelos. "A Anthropic é extremamente cara, e muita gente está urgentemente procurando alternativas", disse Suleyman. "Nós pagamos muito dinheiro à Anthropic, então nosso objetivo é reduzir e, no final, eliminar esse custo."
A declaração veio dois dias depois do Microsoft Build 2026, onde Satya Nadella apresentou sete modelos próprios construídos sem distillation de OpenAI ou Anthropic. Entre eles, o MAI-Thinking-1, reasoning model de 35 bilhões de parâmetros ativos numa arquitetura sparse Mixture of Experts com cerca de 1 trilhão de parâmetros totais e janela de contexto de 256.000 tokens. A Microsoft afirma 97,0% no AIME 2025 e 94,5% no AIME 2026, benchmarks de raciocínio matemático onde os modelos de fronteira da concorrência hoje pontuam na faixa alta.
A urgência é financeira. A Microsoft compromete entre US$ 120 bilhões e US$ 130 bilhões em capex de IA no ano fiscal de 2026. Parte significativa desse fluxo abastece data centers que rodam Claude para clientes do Foundry. Reduzir a fatura de licenciamento de modelo de terceiros é o caminho mais rápido para abrir margem dentro de uma estrutura de custos que já chegou ao limite do conforto de Wall Street.
A pressão chega ao comprador corporativo
Para o CIO de uma seguradora europeia ou de uma operadora americana de saúde, a mensagem operacional é direta: o preço do token de fronteira vai cair, e o vendor lock-in num provedor único de modelo virou a decisão mais cara que se pode tomar em 2026.
Capgemini, Cognizant e Wipro padronizaram parte dos delivery centers em Claude Opus 4.7 nos últimos doze meses. Agora têm de defender essa escolha em comitês de procurement. A Microsoft listou no Foundry mais de 11.000 modelos, incluindo Claude Opus 4.8, e introduziu Model Router automático: a infraestrutura escolhe o modelo mais barato que atenda ao SLA do cliente. Esse roteamento por si só reduz custo em casos de uso de geração de código entre 30% e 50%, segundo benchmarks que a própria Microsoft divulgou em conferência com analistas em 2 de junho.
A Anthropic não comentou publicamente a fala de Suleyman até o fechamento desta matéria. Dario Amodei, em entrevista ao New York Times no mês passado, defendeu que a Anthropic vai precificar conforme o valor que entrega, não conforme a pressão de competidores que ainda não chegaram ao mesmo nível de capacidade. A empresa também tem o lado dos hyperscalers: a Amazon investiu US$ 25 bilhões cumulativos e o Google figura como segundo maior cliente de inference.
A leitura para fora dos Estados Unidos
A guerra de preço não é só problema americano. Na Índia, TCS, Infosys e Wipro acabaram de ultrapassar 300.000 licenças Microsoft 365 Copilot em deployment combinado, segundo dado divulgado pela Microsoft em 3 de junho. Cada redução de custo no modelo subjacente do Copilot vira margem direta para essas firmas, que precificam projetos de transformação com Copilot embarcado sob fixed-fee. A capacidade de provar que o backend Copilot rodaria em modelo Microsoft próprio, e não em Claude, abre conversa de renegociação com cliente final.
No Reino Unido, onde Lloyds Banking Group e HSBC fizeram em maio piloto com Foundry para integrar agentes a fluxos de KYC, o Model Router muda a equação de TCO ao retirar a decisão de "qual modelo" do arquiteto e jogá-la para um sistema de bidding interno entre provedores. Bancos europeus operam dentro do DORA, e auditoria de fornecedor de modelo único virou item de governança que a multiplexação resolve.
No Japão, MUFG e Mizuho estão em fase final de seleção de provedor de LLM para call center. A Microsoft hoje compete com NEC e NTT Data nesse contrato, e o argumento de "elimine o pagamento à Anthropic via Model Router" pesa diferente para conselhos japoneses que historicamente preferem ecossistema único de fornecedor.
A peça que não está dita
Suleyman foi cofundador da DeepMind e da Inflection AI antes de a Microsoft adquirir o time dele em março de 2024. A frase "eliminar o custo" tem peso pessoal. A Microsoft pagou US$ 650 milhões para trazer ele e a equipe da Inflection, e a expectativa de retorno do investimento mede-se em quantos pontos percentuais da fatura da Anthropic ele consegue substituir por código Microsoft. O ciclo está longe de fechar. A Anthropic continua sendo um dos maiores fornecedores de IA do Foundry, e contratos vigentes vão até 2028.