Strategie6 Min.1. Juni 2026

Vera Rubin geht in die volle Produktion und bindet Korea, Taiwan und Hyperscaler an den neuen Capex-Zyklus von Nvidia

Vista aerea ao amanhecer de complexo de manufatura de semicondutores em Taiwan com racks de IA sendo carregados em caminhao plataforma.

Die Nachfolgeplattform von Grace Blackwell verspricht 10x mehr Durchsatz von Agenten und umfasst bereits AWS, Google, Microsoft, Oracle und CoreWeave, die Ingenieurracks mit HBM4 von Samsung, SK hynix und Micron betreiben.

Nvidia gab am 31. Mai während der Keynote der GTC Taipei bekannt, dass die Plattform Vera Rubin in die volle Produktion gegangen ist. Jensen Huangs Einschätzung des damit verbundenen Maßstabs war eindeutig: "Die größte Produkteinführung, wahrscheinlich in der Geschichte Taiwans". Die Größe dieser Zahl zeigt sich in der industriellen Fußabdruck: 350 Fabriken in 30 Ländern sind in der Produktionskette, von denen 150 nur in Taiwan liegen, so die offizielle Mitteilung. Im Vergleich zu Grace Blackwell bietet das System 10-mal mehr Durchsatz von Agenten im großen Maßstab. Die erste Charge von Auslieferungen beginnt im dritten Quartal, mit einer Steigerung des Volumens im vierten Quartal und einer Fortsetzung im ersten Halbjahr 2027.

Das Referenzsystem ist der Vera Rubin NVL72: 72 Rubin-GPUs und 36 Vera-CPUs in einem Rack, 3,6 Exaflops bei Inferenz in NVFP4-Präzision und 2,5 Exaflops beim Training, mit 20,7 TB HBM4 verbunden mit 1,6 PB pro Sekunde Bandbreite. Das Rack wird komplett mit kritischen Ergänzungen geliefert: BlueField-4 als DPU und Spectrum-X Ethernet Photonics, die ebenfalls als produziert erklärt wurden, um den Fabric zwischen Tausenden von Racks mit co-packaged Optik zu verbinden.

Die koreanische Rechnung und die asiatische Machtstruktur

Der Speicher ist das Element, das Korea an den Roadmap von Nvidia bis 2028 bindet. Samsung Electronics, SK hynix und Micron wurden laut einer Bestätigung von Huang, die im Korea Herald berichtet wurde, als HBM4-Lieferanten für die Plattform genannt. Für SK hynix bedeutet die Vereinbarung mehrjährige Sichtbarkeit für Fabriken in Cheongju und Wuxi. Für Samsung ist es die Bestätigung, dass ihre aggressive Wette auf HBM4 mit 12 Hi-I/O den Rückstand von 2024 ausgleicht. Der Effekt ist symmetrisch in Taiwan: TSMC produziert den Rechenteil von Rubin in N3P, MediaTek entwirft den Die von Vera CPU, und das ASIC-Backend wird zwischen Foxconn, Quanta Cloud Technology, Wistron, Wiwynn und Pegatron aufgeteilt.

Huangs Reise nach Seoul am 5. Juni, mit bestätigten Terminen bei SK Group, Hyundai Motor, LG und Naver, laut der Seoul Economic Daily, besiegelt das politische Element der Gleichung. Die Allianz trägt einen internen Namen in Korea, "kkanbu", ein Wort, das enge Freundschaft bezeichnet und seit dem ersten APEC-Gipfel im Oktober geopolitisches Gewicht gewonnen hat.

Wer bereits Vera Rubin in Ingenieurracks betreibt

Die Mitteilung listet die Kunden auf, die Verträge unterzeichnet haben. Die anwesenden Hyperscaler sind AWS, Google Cloud, Microsoft und Oracle Cloud Infrastructure. Die benannten Neo Cloud Providers sind CoreWeave, Lambda, Nebius und Nscale. Die genannten KI-Labors sind Anthropic, OpenAI, xAI und ByteDance. Microsoft, Dell und CoreWeave betreiben bereits Ingenieurracks, so das ergänzende Material zur Mitteilung. Für den CIO einer Bank, Beratungsfirma oder Versicherungsgesellschaft, die eine Kapazitätsreservierung bei Bedrock, Azure OpenAI oder Vertex AI getätigt hat, öffnet sich im vierten Quartal das Fenster zur Migration der kritischen Inferenz auf die Rubin-Hardware.

Der Effekt auf die Stückkosten der Inferenz ist die entscheidende Zahl. Nvidia hatte bereits im Januar auf der CES eine 10-fache Senkung der Kosten pro Token bei der Transition von Blackwell zu Rubin prognostiziert und eine bis zu fünffache Leistungssteigerung bei Inferenz angekündigt. Bei einer typischen Chatlast mit Frontier-Modellen würde das Äquivalent heute etwa 1,5 US-Dollar pro Million Tokens bei Modellen der Klasse Sonnet oder GPT-5 kosten; bei Rubin, gemäß der These des Unternehmens, sinkt die Gleichung auf unter 0,30 US-Dollar pro Million. Wedbush, vertreten durch Matt Bryson, hob das Kursziel von NVDA von 230 auf 300 US-Dollar an. Bernstein hielt die Outperformance mit 315 US-Dollar aufrecht und erwähnte die "Trajektorie von 1 Billion US-Dollar Umsatz von Blackwell und Rubin bis CY2027" und mehr als 20 Milliarden US-Dollar Umsatz nur mit Vera CPU im Jahr 2026.

Die Sicht auf Brasilien, Japan und Europa

Die Vera Rubin verstärkt das Spiel, das SoftBank gerade in Frankreich gespielt hat. Die Son-Gruppe gab am 30. Mai 75 Milliarden Euro für KI-Datencenter bekannt, und das fehlende Stück an Ausstattung existiert bereits. Japan ist zweimal in der Gleichung präsent: SoftBank akquiriert europäische Tickets, während Mizuho, MUFG und Nomura die Währungsrisikosexponierung gegenüber dem Zyklus analysieren, und Fonds wie der Vision Fund 3 suchen Co-Investitionen mit Korea Investment Corporation. Für Europa funktioniert die These nur, wenn SAP, Siemens und Airbus die Unternehmensnachfrage freisetzen, die den Verbrauch von Petaflops in den neuen französischen GW rechtfertigt.

In Brasilien hängen Itaú, Bradesco und Petrobras von der Kapazität ab, die Microsoft, Google und AWS in São Paulo zuweisen wollen. Die Regel ist einfach: Ein Rubin-Ingenieurrack, das im dritten Quartal in den USA im Betrieb ist, bedeutet eine Migration der Unternehmensinferenzlast zwischen Ende 2026 und Mitte 2027, mit einem kurzen Fenster für den CIO, um einen mehrjährigen Vertrag vor Ablauf des Preisdrucks zu verhandeln.

Die US-amerikanische Wertpapier- und Börsenaufsichtsbehörde und der brasilianische Cade haben mit Rubin ebenfalls noch Arbeit vor sich. Das System konzentriert mehr Rechenleistung als jede Vorgängergeneration auf einen Bruchteil der Anbieter, und das nächste Jahrzehnt des KI-Marktes wird davon abhängen, wer zuerst den Vertrag über die Kapazität unterzeichnet.