Estrategia5 min26 de junio de 2026

OpenAI estrena con Broadcom el chip Jalapeño y promete un 50% menos costo por vatio que la GPU actual

Corredor de sala limpa em uma fábrica de semicondutores avançados com técnicos uniformizados manuseando um carregador de wafers.

El primer silicio propio de OpenAI, el Jalapeño, es un ASIC de inferencia diseñado en nueve meses para ejecutar GPT-5.3-Codex-Spark, con inicio de implementación a fin de 2026.

OpenAI y Broadcom presentaron este jueves el Jalapeño, primer chip de inferencia diseñado por la startup de Sam Altman. El acelerador se describe como un ASIC de uso específico, no una GPU genérica ni un chip de entrenamiento adaptado, y fue co-desarrollado con Broadcom y el fabricante de electrónica Celestica en un ciclo de nueve meses entre el diseño inicial y el tape-out, lo que OpenAI califica como el programa de silicio avanzado más rápido documentado.

Muestras de ingeniería ya están ejecutando cargas de trabajo de producción en laboratorio, incluyendo el GPT-5.3-Codex-Spark, con la misma frecuencia y el mismo envelope de potencia previstos para volumen. Los primeros números internos indican un ahorro de alrededor del 50% por vatio en comparación con las GPUs de última generación disponibles comercialmente. La implementación inicial está prevista para finales de 2026, con expansión en los años siguientes en centros de datos operados por OpenAI y por socios.

Por qué salir de Nvidia ahora

El contexto es el tamaño de la cuenta. Estimaciones de los cuatro mayores hiperescaladores apuntan a 700 mil millones de dólares en capex de IA en 2026, con Microsoft, Google, Amazon y Meta entre 125 mil millones y 200 mil millones cada uno. OpenAI, que no es un hiperescalador en su balance, divide hoy el gasto entre Microsoft, Oracle y CoreWeave, y cada token generado se ejecuta en GPU H100 o B200 de Nvidia. Migrar incluso el 20% del tráfico de inferencia de ChatGPT y Codex a silicio propio con un 50% menos de costo por vatio cambia el punto de equilibrio de la empresa.

El contraste con la estrategia de Anthropic o xAI es directo. Anthropic compra capacidad preferentemente en TPU de Google y en Trainium de AWS, sin chip propio. xAI opera exclusivamente en GPU Nvidia. Quienes apuestan por ASIC dedicados, además de OpenAI, son los propios hiperescaladores: el Trainium de AWS, el TPU de Google y el Maia de Microsoft. Para Broadcom, el contrato es la confirmación de que el diseño conjunto con clientes se ha convirtió en un negocio recurrente, después del éxito del TPU de Google. Las acciones de la empresa subieron casi un 60% en el año y el pedido en cartera para silicio personalizado superó los 10 mil millones de dólares.

Quién pierde, quién gana en cada región

La lectura más obvia está en Estados Unidos, donde Nvidia sigue siendo de lejos el proveedor preferido para entrenamiento, pero comienza a compartir el mercado de inferencia con ASICs hechos por hiperescaladores y por clientes de estos. Para CIOs americanos evaluando contratos plurianuales con OpenAI, la llegada del Jalapeño introduce un vector de reducción de precio futuro, ya que parte del ahorro de costos debe fluir hacia tarifas por millón de tokens.

En Taiwán, sede de TSMC, la expectativa del mercado es más de un cliente para la línea de ASIC avanzada que la fundición ya produce para Broadcom, aunque OpenAI no ha confirmado el socio de fabricación. En Singapur y en India, donde OpenAI ha estado expandiendo regiones de inferencia junto con Microsoft Azure, la caída proyectada de costo por consulta facilita lanzamientos de tarifas locales en moneda fuerte. En centros de entrega en India, donde TCS, Infosys y Wipro escalan equipos de desarrollo sobre Codex, cualquier recorte de precio por millón de tokens se percibe en margen en pocas semanas.

En Europa, donde el tema es soberanía, el Jalapeño tiene una lectura ambigua. Reduce la dependencia de Nvidia, pero atará aún más la inferencia de OpenAI a una cadena de suministro que combina el diseño en San Francisco, silicio implementado por Broadcom y ensamblaje por un proveedor canadiense, con la etapa de fundición en jurisdicción que OpenAI no detalló en el comunicado. Para un banco europeo que opera con Claude de Anthropic a través de Bedrock y el GPT de OpenAI a través de Azure, la pregunta es dónde está el centro de datos físico que procesa el prompt y quién es el propietario del silicio.

Lo que aún no sabemos

OpenAI no ha divulgado el nodo de proceso de TSMC utilizado, no ha confirmado el volumen inicial de wafers ni ha indicado quién más tendrá acceso al chip además de sus propias operaciones y las de Microsoft. Tampoco hay comparación pública contra el B200 o el futuro B300 de Nvidia en métrica estandarizada, solo la métrica interna de costo por vatio. Nvidia no había comentado el anuncio hasta el cierre de este artículo.

El próximo hito a observar es el informe fiscal de Broadcom en septiembre. Si los ingresos de silicio personalizado vuelven a duplicarse en ritmo trimestral, el mercado comenzará a valorar a una Nvidia menos dominante en la porción de inferencia de la pila de IA. Si los envíos iniciales de Jalapeño se retrasan del cuarto trimestre a 2027, la lectura se invierte y Nvidia recupera fuerza en la narrativa.