Estratégia5 min26 de junho de 2026

OpenAI estreia com a Broadcom o chip Jalapeño e promete 50% menos custo por watt que GPU atual

Corredor de sala limpa em uma fábrica de semicondutores avançados com técnicos uniformizados manuseando um carregador de wafers.

Primeiro silício próprio da OpenAI, o Jalapeño é um ASIC de inferência desenhado em nove meses para rodar GPT-5.3-Codex-Spark, com início de implantação no fim de 2026.

A OpenAI e a Broadcom apresentaram nesta quinta-feira o Jalapeño, primeiro chip de inferência projetado pela startup de Sam Altman. O acelerador é descrito como um ASIC de uso específico, não uma GPU genérica nem um chip de treinamento adaptado, e foi co-desenvolvido com a Broadcom e a fabricante de eletrônicos Celestica em ciclo de nove meses entre o desenho inicial e o tape-out, o que a OpenAI classifica como o programa de silício avançado mais rápido já documentado.

Amostras de engenharia já estão rodando workloads de produção em laboratório, incluindo o GPT-5.3-Codex-Spark, com a mesma frequência e o mesmo envelope de potência previstos para volume. Os primeiros números internos indicam economia de cerca de 50% por watt em comparação com GPUs de última geração disponíveis comercialmente. A implantação inicial está prevista para o fim de 2026, com expansão nos anos seguintes em data centers operados pela OpenAI e por parceiros.

Por que sair da Nvidia agora

O contexto é o tamanho da conta. Estimativas dos quatro maiores hiperescaladores apontam para US$ 700 bilhões em capex de IA em 2026, com Microsoft, Google, Amazon e Meta entre US$ 125 bilhões e US$ 200 bilhões cada. A OpenAI, que não é um hiperescalador no balanço, divide hoje o gasto entre Microsoft, Oracle e CoreWeave, e cada token gerado roda em GPU H100 ou B200 da Nvidia. Migrar mesmo que 20% do tráfego de inferência do ChatGPT e do Codex para silício próprio com 50% menos custo por watt muda o ponto de equilíbrio da empresa.

O contraste com a estratégia da Anthropic ou da xAI é direto. A Anthropic compra capacidade preferencialmente em TPU da Google e em Trainium da AWS, sem chip próprio. A xAI roda exclusivamente em GPU Nvidia. Quem aposta em ASIC dedicado, além da OpenAI, são as próprias casas hyperscaler: o Trainium da AWS, o TPU da Google e o Maia da Microsoft. Para a Broadcom, o contrato é a confirmação de que o desenho conjunto com clientes virou negócio recorrente, depois do sucesso do TPU do Google. As ações da empresa subiram quase 60% no ano e o pedido em carteira para silício custom passou de US$ 10 bilhões.

Quem perde, quem ganha em cada região

A leitura mais óbvia está nos Estados Unidos, onde a Nvidia continua sendo de longe o fornecedor preferido para treinamento, mas passa a dividir o mercado de inferência com ASICs feitos por hiperescaladores e por clientes deles. Para CIOs americanos avaliando contratos plurianuais com OpenAI, a chegada do Jalapeño introduz um vetor de redução de preço futuro, já que parte da economia de custo deve fluir para tarifas por milhão de tokens.

Em Taiwan, sede da TSMC, a expectativa de mercado é de mais um cliente para a linha de ASIC avançada que a foundry já produz para a Broadcom, embora a OpenAI não tenha confirmado o parceiro de fabricação. Em Cingapura e na Índia, onde a OpenAI vem expandindo regiões de inferência junto com a Microsoft Azure, a queda projetada de custo por consulta facilita lançamentos de tarifa local em moeda forte. Em centros de entrega na Índia, onde TCS, Infosys e Wipro escalam squads de desenvolvimento sobre o Codex, qualquer corte de preço por milhão de tokens é percebido em margem em poucas semanas.

Na Europa, onde o tema é soberania, o Jalapeño tem leitura ambígua. Reduz a dependência da Nvidia, mas amarra ainda mais a inferência da OpenAI a uma cadeia de fornecimento que combina desenho em San Francisco, silício implementado pela Broadcom e montagem por uma fornecedora canadense, com a etapa de foundry em jurisdição que a OpenAI não detalhou no comunicado. Para um banco europeu que opera o Claude da Anthropic via Bedrock e o GPT da OpenAI via Azure, a pergunta é onde está o data center físico que processa o prompt e quem é o proprietário do silício.

O que ainda não sabemos

A OpenAI não divulgou o nó de processo da TSMC usado, não confirmou volume inicial de wafers nem disse quem mais terá acesso ao chip além de operações próprias e da Microsoft. Também não há comparação pública contra o B200 ou o futuro B300 da Nvidia em métrica padronizada, apenas a métrica interna de custo por watt. A Nvidia não havia comentado o anúncio até o fechamento desta matéria.

O próximo marco a observar é o relatório fiscal da Broadcom em setembro. Se a receita de silício custom dobrar de novo em ritmo trimestral, o mercado começará a precificar uma Nvidia menos dominante na fatia de inferência da pilha de IA. Se as remessas iniciais de Jalapeño escorregarem do quarto trimestre para 2027, a leitura inverte e a Nvidia recupera fôlego na narrativa.