Strategie5 Min.26. Juni 2026

OpenAI stellt gemeinsam mit Broadcom den Jalapeño-Chip vor und verspricht 50% geringere Kosten pro Watt im Vergleich zu aktuellen GPUs

Corredor de sala limpa em uma fábrica de semicondutores avançados com técnicos uniformizados manuseando um carregador de wafers.

Der erste eigene Siliziumchip von OpenAI, der Jalapeño, ist ein für die Inferenz ausgelegter ASIC, der in neun Monaten entwickelt wurde, um GPT-5.3-Codex-Spark auszuführen, mit Beginn der Implementierung Ende 2026.

OpenAI und Broadcom haben am Donnerstag den Jalapeño vorgestellt, den ersten Inferenzchip, der von der Startup von Sam Altman entworfen wurde. Der Beschleuniger wird als Anwendungsspezifischer integrierter Schaltkreis (ASIC) beschrieben, nicht als generische GPU oder angepasster Training-Chip, und wurde gemeinsam mit Broadcom und dem Elektronikhersteller Celestica in einem Zyklus von neun Monaten zwischen der ersten Entwurfsphase und dem Tape-Out entwickelt, was OpenAI als das am schnellsten dokumentierte fortgeschrittene Siliziumprogramm bezeichnet.

Ingenieurexemplare laufen bereits mit Produktions-Workloads im Labor, einschließlich GPT-5.3-Codex-Spark, mit derselben Frequenz und demselben Leistungsrahmen, die für das Volumen vorgesehen sind. Die ersten internen Zahlen deuten auf Einsparungen von etwa 50% pro Watt im Vergleich zu kommerziell erhältlichen Hochleistungs-GPUs hin. Die erste Implementierung ist für Ende 2026 geplant, mit einer Erweiterung in den folgenden Jahren in Rechenzentren, die von OpenAI und Partners betrieben werden.

Warum jetzt von Nvidia weg

Der Kontext ist die Größenordnung der Rechnung. Schätzungen der vier größten Hyperscaler deuten auf 700 Milliarden USD Capex für KI im Jahr 2026 hin, mit Microsoft, Google, Amazon und Meta, die jeweils zwischen 125 und 200 Milliarden USD investieren. OpenAI, das nicht als Hyperscaler auf der Bilanz erscheint, teilt die Ausgaben derzeit zwischen Microsoft, Oracle und CoreWeave auf, und jeder erzeugte Token wird auf einer Nvidia GPU H100 oder B200 ausgeführt. Selbst die Migration von nur 20% des Inferenzverkehrs von ChatGPT und Codex auf eigenes Silizium mit 50% geringeren Kosten pro Watt verändert den Break-Even-Punkt des Unternehmens.

Der Kontrast zur Strategie von Anthropic oder xAI ist direkt. Anthropic kauft bevorzugt Kapazitäten in TPUs von Google und Trainium von AWS, ohne eigenen Chip. xAI läuft ausschließlich auf Nvidia GPUs. Neben OpenAI setzen auch die Hyperscaler selbst auf dedizierte ASICs: das Trainium von AWS, das TPU von Google und das Maia von Microsoft. Für Broadcom ist der Vertrag die Bestätigung, dass das gemeinsame Design mit Kunden zu einem wiederkehrenden Geschäft geworden ist, nach dem Erfolg des Google TPU. Die Aktien des Unternehmens sind im Laufe des Jahres um fast 60% gestiegen, und der Auftragseingang für maßgeschneiderte Silizien überstieg 10 Milliarden USD.

Wer verliert, wer gewinnt in jeder Region

Die offensichtlichste Lesart liegt in den Vereinigten Staaten, wo Nvidia nach wie vor der bevorzugte Anbieter für das Training ist, aber den Inferenzmarkt mit von Hyperscalern und deren Kunden gefertigten ASICs teilen muss. Für CIOs in den USA, die mehrjährige Verträge mit OpenAI prüfen, bringt die Ankunft des Jalapeño einen zukünftigen Preisreduktionsfaktor mit sich, da ein Teil der Kosteneinsparungen in die Gebühren pro Million Tokens fließen sollte.

In Taiwan, dem Sitz von TSMC, wird eine weitere Erwartung für den Markt als ein neuer Kunde für die fortschrittliche ASIC-Linie angesehen, die die Foundry bereits für Broadcom produziert, obwohl OpenAI den Fertigungspartner nicht bestätigt hat. In Singapur und Indien, wo OpenAI zusammen mit Microsoft Azure die Regionen für die Inferenz ausweitet, erleichtert der prognostizierte Rückgang der Kosten pro Anfrage die Einführung lokaler Tarife in starken Währungen. In Lieferzentren in Indien, wo TCS, Infosys und Wipro Entwicklungsteams für den Codex aufbauen, wird jede Preissenkung pro Million Tokens in wenigen Wochen als Gewinn wahrgenommen.

In Europa, wo das Thema Souveränität aufkommt, hat der Jalapeño eine ambivalente Lesart. Er reduziert die Abhängigkeit von Nvidia, bindet aber die Inferenz von OpenAI noch stärker an eine Lieferkette, die Design in San Francisco, von Broadcom implementiertes Silizium und Montage durch einen kanadischen Anbieter kombiniert, wobei die Foundry-Phase in einer nicht näher bezeichneten Jurisdiktion liegt, die OpenAI in der Mitteilung nicht erläutert hat. Für eine europäische Bank, die den Claude von Anthropic über Bedrock und das GPT von OpenAI über Azure betreibt, ist die Frage, wo sich das physische Rechenzentrum befindet, das das Prompt verarbeitet, und wer der Eigentümer des Siliziums ist.

Was wir noch nicht wissen

OpenAI hat den Prozessknoten von TSMC, der verwendet wird, nicht veröffentlicht, den anfänglichen Wafer-Volumen nicht bestätigt und auch nicht gesagt, wer außer den eigenen Operationen und Microsoft Zugang zu dem Chip haben wird. Auch gibt es keinen öffentlichen Vergleich gegen die B200 oder die zukünftige B300 von Nvidia in standardisierten Metriken, nur die interne Metrik der Kosten pro Watt. Nvidia hatte bis zur Drucklegung dieses Berichts nicht auf die Ankündigung reagiert.

Der nächste Meilenstein, den man beobachten sollte, ist der Finanzbericht von Broadcom im September. Wenn die Einnahmen aus maßgeschneidertem Silizium im vierteljährlichen Tempo erneut verdoppeln, wird der Markt beginnen, Nvidia als weniger dominant im Inferenzsegment des KI-Stacks zu bewerten. Sollten die ersten Lieferungen des Jalapeño vom vierten Quartal nach 2027 verschoben werden, kehrt sich die Lesart um und Nvidia gewinnt in der Erzählung wieder an Schwung.