Análise Principal
Estratégia6 min

Suleyman diz que Anthropic está "extremamente cara" e Microsoft acelera plano para zerar dependência

Arquiteto de TI sozinho em escritório corporativo ao anoitecer com planilha de licenciamento de software exibida em vermelho na tela curva, vista de Seattle ao fundo.

CEO da Microsoft AI declarou ao Bloomberg que o Claude é caro demais e que a meta é eliminar o custo. Build 2026 lançou sete modelos próprios sem distillation da OpenAI ou da Anthropic.

Mustafa Suleyman, CEO da Microsoft AI, deu na quinta-feira passada ao Bloomberg a linha mais direta que um executivo de Redmond já produziu sobre seu maior fornecedor terceiro de modelos. "A Anthropic é extremamente cara, e muita gente está urgentemente procurando alternativas", disse Suleyman. "Nós pagamos muito dinheiro à Anthropic, então nosso objetivo é reduzir e, no final, eliminar esse custo."


A declaração veio dois dias depois do Microsoft Build 2026, onde Satya Nadella apresentou sete modelos próprios construídos sem distillation de OpenAI ou Anthropic. Entre eles, o MAI-Thinking-1, reasoning model de 35 bilhões de parâmetros ativos numa arquitetura sparse Mixture of Experts com cerca de 1 trilhão de parâmetros totais e janela de contexto de 256.000 tokens. A Microsoft afirma 97,0% no AIME 2025 e 94,5% no AIME 2026, benchmarks de raciocínio matemático onde os modelos de fronteira da concorrência hoje pontuam na faixa alta.


A urgência é financeira. A Microsoft compromete entre US$ 120 bilhões e US$ 130 bilhões em capex de IA no ano fiscal de 2026. Parte significativa desse fluxo abastece data centers que rodam Claude para clientes do Foundry. Reduzir a fatura de licenciamento de modelo de terceiros é o caminho mais rápido para abrir margem dentro de uma estrutura de custos que já chegou ao limite do conforto de Wall Street.


A pressão chega ao comprador corporativo


Para o CIO de uma seguradora europeia ou de uma operadora americana de saúde, a mensagem operacional é direta: o preço do token de fronteira vai cair, e o vendor lock-in num provedor único de modelo virou a decisão mais cara que se pode tomar em 2026.


Capgemini, Cognizant e Wipro padronizaram parte dos delivery centers em Claude Opus 4.7 nos últimos doze meses. Agora têm de defender essa escolha em comitês de procurement. A Microsoft listou no Foundry mais de 11.000 modelos, incluindo Claude Opus 4.8, e introduziu Model Router automático: a infraestrutura escolhe o modelo mais barato que atenda ao SLA do cliente. Esse roteamento por si só reduz custo em casos de uso de geração de código entre 30% e 50%, segundo benchmarks que a própria Microsoft divulgou em conferência com analistas em 2 de junho.


A Anthropic não comentou publicamente a fala de Suleyman até o fechamento desta matéria. Dario Amodei, em entrevista ao New York Times no mês passado, defendeu que a Anthropic vai precificar conforme o valor que entrega, não conforme a pressão de competidores que ainda não chegaram ao mesmo nível de capacidade. A empresa também tem o lado dos hyperscalers: a Amazon investiu US$ 25 bilhões cumulativos e o Google figura como segundo maior cliente de inference.


A leitura para fora dos Estados Unidos


A guerra de preço não é só problema americano. Na Índia, TCS, Infosys e Wipro acabaram de ultrapassar 300.000 licenças Microsoft 365 Copilot em deployment combinado, segundo dado divulgado pela Microsoft em 3 de junho. Cada redução de custo no modelo subjacente do Copilot vira margem direta para essas firmas, que precificam projetos de transformação com Copilot embarcado sob fixed-fee. A capacidade de provar que o backend Copilot rodaria em modelo Microsoft próprio, e não em Claude, abre conversa de renegociação com cliente final.


No Reino Unido, onde Lloyds Banking Group e HSBC fizeram em maio piloto com Foundry para integrar agentes a fluxos de KYC, o Model Router muda a equação de TCO ao retirar a decisão de "qual modelo" do arquiteto e jogá-la para um sistema de bidding interno entre provedores. Bancos europeus operam dentro do DORA, e auditoria de fornecedor de modelo único virou item de governança que a multiplexação resolve.


No Japão, MUFG e Mizuho estão em fase final de seleção de provedor de LLM para call center. A Microsoft hoje compete com NEC e NTT Data nesse contrato, e o argumento de "elimine o pagamento à Anthropic via Model Router" pesa diferente para conselhos japoneses que historicamente preferem ecossistema único de fornecedor.


A peça que não está dita


Suleyman foi cofundador da DeepMind e da Inflection AI antes de a Microsoft adquirir o time dele em março de 2024. A frase "eliminar o custo" tem peso pessoal. A Microsoft pagou US$ 650 milhões para trazer ele e a equipe da Inflection, e a expectativa de retorno do investimento mede-se em quantos pontos percentuais da fatura da Anthropic ele consegue substituir por código Microsoft. O ciclo está longe de fechar. A Anthropic continua sendo um dos maiores fornecedores de IA do Foundry, e contratos vigentes vão até 2028.

Análise Principal
Suleyman diz que Anthropic está "extremamente cara" e Microsoft acelera plano para zerar dependência | The New Times