Estratégia6 min1 de junho de 2026

Vera Rubin entra em producao plena e amarra Coreia, Taiwan e hyperscalers ao novo ciclo de capex da Nvidia

Vista aerea ao amanhecer de complexo de manufatura de semicondutores em Taiwan com racks de IA sendo carregados em caminhao plataforma.

A plataforma sucessora de Grace Blackwell promete 10x mais throughput de agentes e ja conta com AWS, Google, Microsoft, Oracle e CoreWeave operando racks de engenharia, com HBM4 de Samsung, SK hynix e Micron.

A Nvidia anunciou em 31 de maio, durante a keynote da GTC Taipei, que a plataforma Vera Rubin entrou em produção plena. A leitura de Jensen Huang sobre a escala envolvida foi direta: "o maior lançamento de produto, provavelmente, da história de Taiwan". O dado que dá tamanho ao número é o footprint industrial: 350 fábricas em 30 países estão na cadeia de produção, das quais 150 ficam só em Taiwan, segundo o release oficial. Comparado a Grace Blackwell, o sistema entrega 10 vezes mais throughput de agentes em escala. A primeira leva de shipments começa no terceiro trimestre, com ramp de volume no quarto trimestre e continuidade no primeiro semestre de 2027.

O sistema de referência é o Vera Rubin NVL72: 72 GPUs Rubin e 36 Vera CPUs em um rack, 3,6 exaflops de inferência em precisão NVFP4 e 2,5 exaflops de treinamento, com 20,7 TB de HBM4 conectados a 1,6 PB por segundo de banda. O rack vem completo de complementos críticos: BlueField-4 como DPU e Spectrum-X Ethernet Photonics, também declarada em produção, para tecer o fabric entre milhares de racks com óptica co-empacotada.

A factura coreana e a estrutura de poder asiatica

A memória é a peça que fixa a Coreia ao roadmap da Nvidia até 2028. Samsung Electronics, SK hynix e Micron foram nomeadas como fornecedoras de HBM4 da plataforma, segundo confirmação de Huang reportada pelo Korea Herald. Para a SK hynix, o acordo dá visibilidade plurianual a fábricas em Cheongju e Wuxi. Para a Samsung, é a confirmação de que sua aposta agressiva em HBM4 com I/O de 12 Hi compensa o atraso de 2024. O efeito é simétrico em Taiwan: TSMC produz o die de cálculo da Rubin em N3P, MediaTek desenha o die da Vera CPU, e o ASIC backend é dividido entre Foxconn, Quanta Cloud Technology, Wistron, Wiwynn e Pegatron.

A viagem de Huang a Seul em 5 de junho, com agenda confirmada com SK Group, Hyundai Motor, LG e Naver, segundo a Seoul Economic Daily, sela a peça política da equação. A aliança tem nome interno na Coreia, "kkanbu", uma palavra que designa amizade próxima e que ganhou peso geopolítico desde a primeira cúpula da APEC em outubro.

Quem ja roda Vera Rubin em rack de engenharia

O release lista os clientes que assinaram contrato. Os hyperscalers presentes são AWS, Google Cloud, Microsoft e Oracle Cloud Infrastructure. Os Neo Cloud Providers nomeados são CoreWeave, Lambda, Nebius e Nscale. Os laboratórios de IA citados são Anthropic, OpenAI, xAI e ByteDance. Microsoft, Dell e CoreWeave já operam racks de engenharia, segundo material complementar do release. Para o CIO de banco, consultoria ou seguradora que comprou capacity reservation em Bedrock, Azure OpenAI ou Vertex AI, a janela de migração da inferência crítica para hardware Rubin abre no quarto trimestre.

O efeito sobre custo unitário de inferência é o número que importa. A Nvidia já havia projetado, no CES de janeiro, redução de 10 vezes no custo por token na transição Blackwell para Rubin, e ganho de até 5 vezes em performance de inferência. Em uma carga típica de chat com modelos de fronteira, o equivalente custaria em torno de US$ 1,5 por milhão de tokens hoje em modelos de classe Sonnet ou GPT-5; em Rubin, conforme a tese da companhia, a equação cai para abaixo de US$ 0,30 por milhão. Wedbush, via Matt Bryson, elevou o preço-alvo de NVDA para US$ 300 a partir de US$ 230. Bernstein manteve outperform com US$ 315, citando "trajetória de US$ 1 trilhão de receita Blackwell e Rubin até CY2027" e mais de US$ 20 bilhões em receita só de Vera CPU em 2026.

A leitura para Brasil, Japao e a Europa

A Vera Rubin reforça o jogo que SoftBank acaba de jogar na França. O grupo de Son anunciou €75 bilhões em datacenters de IA em 30 de maio, e a peça que faltava de equipamento já existe. O Japão entra duas vezes na equação: SoftBank capta tickets europeus enquanto Mizuho, MUFG e Nomura analisam exposição cambial ao ciclo, e fundos como o Vision Fund 3 buscam co-investimento com Korea Investment Corporation. Para a Europa, a tese funciona apenas se SAP, Siemens e Airbus desbloquearem demanda corporativa que justifique o consumo de petaflops nos novos GW franceses.

No Brasil, Itaú, Bradesco e Petrobras dependem da capacidade que Microsoft, Google e AWS pretendem alocar em São Paulo. A regra é simples: rack de engenharia Rubin em operação no terceiro trimestre nos Estados Unidos significa migração de carga de inferência corporativa entre o final de 2026 e meados de 2027, com janela curta para CIO negociar contrato plurianual antes da pressão de preço terminar.

A Comissão de Valores Mobiliários americana e o Cade brasileiro ainda têm trabalho a fazer com Rubin. O sistema concentra mais poder computacional do que qualquer geração anterior em uma fração de fornecedores, e a próxima década do mercado de IA vai depender de quem assina o contrato de capacity primeiro.