Vera Rubin entra en producción plena y amarra Corea, Taiwán y hyperscalers al nuevo ciclo de capex de Nvidia

La plataforma sucesora de Grace Blackwell promete 10x más throughput de agentes y ya cuenta con AWS, Google, Microsoft, Oracle y CoreWeave operando racks de ingeniería, con HBM4 de Samsung, SK hynix y Micron.
Nvidia anunció el 31 de mayo, durante la keynote de la GTC Taipei, que la plataforma Vera Rubin ha entrado en producción plena. La lectura de Jensen Huang sobre la escala involucrada fue directa: "el mayor lanzamiento de producto, probablemente, de la historia de Taiwán". El dato que da tamaño al número es la huella industrial: 350 fábricas en 30 países están en la cadena de producción, de las cuales 150 están solo en Taiwán, según el comunicado oficial. Comparado con Grace Blackwell, el sistema entrega 10 veces más throughput de agentes a escala. La primera leva de envíos comienza en el tercer trimestre, con una ramp de volumen en el cuarto trimestre y continuidad en el primer semestre de 2027.
El sistema de referencia es el Vera Rubin NVL72: 72 GPUs Rubin y 36 Vera CPUs en un rack, 3.6 exaflops de inferencia en precisión NVFP4 y 2.5 exaflops de entrenamiento, con 20.7 TB de HBM4 conectados a 1.6 PB por segundo de banda. El rack viene completo con complementos críticos: BlueField-4 como DPU y Spectrum-X Ethernet Photonics, también declarada en producción, para tejer el fabric entre miles de racks con óptica co-empaquetada.
La factura coreana y la estructura de poder asiática
La memoria es la pieza que fija a Corea al roadmap de Nvidia hasta 2028. Samsung Electronics, SK hynix y Micron fueron nombradas como proveedoras de HBM4 de la plataforma, según la confirmación de Huang reportada por el Korea Herald. Para SK hynix, el acuerdo da visibilidad plurianual a fábricas en Cheongju y Wuxi. Para Samsung, es la confirmación de que su apuesta agresiva en HBM4 con I/O de 12 Hi compensa el atraso de 2024. El efecto es simétrico en Taiwán: TSMC produce el die de cálculo de Rubin en N3P, MediaTek diseña el die de la Vera CPU, y el backend de ASIC está dividido entre Foxconn, Quanta Cloud Technology, Wistron, Wiwynn y Pegatron.
El viaje de Huang a Seúl el 5 de junio, con agenda confirmada con SK Group, Hyundai Motor, LG y Naver, según la Seoul Economic Daily, sella la pieza política de la ecuación. La alianza tiene nombre interno en Corea, "kkanbu", una palabra que designa amistad cercana y que ganó peso geopolítico desde la primera cumbre de la APEC en octubre.
¿Quién ya ejecuta Vera Rubin en rack de ingeniería?
El comunicado lista los clientes que han firmado contrato. Los hyperscalers presentes son AWS, Google Cloud, Microsoft y Oracle Cloud Infrastructure. Los Neo Cloud Providers nombrados son CoreWeave, Lambda, Nebius y Nscale. Los laboratorios de IA citados son Anthropic, OpenAI, xAI y ByteDance. Microsoft, Dell y CoreWeave ya operan racks de ingeniería, según material complementario del comunicado. Para el CIO de bancos, consultorías o aseguradoras que compraron reservas de capacidad en Bedrock, Azure OpenAI o Vertex AI, la ventana de migración de la inferencia crítica a hardware Rubin se abre en el cuarto trimestre.
El efecto sobre el costo unitario de inferencia es el número que importa. Nvidia ya había proyectado, en el CES de enero, una reducción de 10 veces en el costo por token en la transición de Blackwell a Rubin, y una ganancia de hasta 5 veces en rendimiento de inferencia. En una carga típica de chat con modelos de frontera, el equivalente costaría en torno a USD 1.5 por millón de tokens hoy en modelos de clase Sonnet o GPT-5; en Rubin, según la tesis de la compañía, la ecuación cae por debajo de USD 0.30 por millón. Wedbush, a través de Matt Bryson, elevó el precio objetivo de NVDA a USD 300 a partir de USD 230. Bernstein mantuvo outperform con USD 315, citando "trayectoria de USD 1 billón de ingresos de Blackwell y Rubin hasta CY2027" y más de USD 20 mil millones en ingresos solo de Vera CPU en 2026.
La lectura para Brasil, Japón y Europa
La Vera Rubin refuerza el juego que SoftBank acaba de jugar en Francia. El grupo de Son anunció €75 mil millones en datacenters de IA el 30 de mayo, y la pieza que faltaba de equipo ya existe. Japón entra dos veces en la ecuación: SoftBank capta tickets europeos mientras Mizuho, MUFG y Nomura analizan exposición cambiaria al ciclo, y fondos como el Vision Fund 3 buscan co-inversión con Korea Investment Corporation. Para Europa, la tesis funciona solo si SAP, Siemens y Airbus desbloquean demanda corporativa que justifique el consumo de petaflops en los nuevos GW franceses.
En Brasil, Itaú, Bradesco y Petrobras dependen de la capacidad que Microsoft, Google y AWS pretenden asignar en São Paulo. La regla es simple: rack de ingeniería Rubin en operación en el tercer trimestre en Estados Unidos significa migración de carga de inferencia corporativa entre finales de 2026 y mediados de 2027, con una ventana corta para que el CIO negocie contrato plurianual antes de que la presión de precio termine.
La Comisión de Valores Mobiliarios americana y el Cade brasileño aún tienen trabajo que hacer con Rubin. El sistema concentra más poder computacional que cualquier generación anterior en una fracción de proveedores, y la próxima década del mercado de IA dependerá de quién firma el contrato de capacidad primero.