Análisis Principal
Estrategia6 min

OpenAI y Broadcom debutan Jalapeño, ASIC propio con un 50% de ventaja de costo sobre GPU

Acelerador de IA customizado em superfície antiestática branca com sonda de calibração suspensa acima do dissipador de calor.

El primer chip diseñado por OpenAI pasó de diseño a producción en nueve meses y comenzará a ejecutar workloads de inferencia a partir de 2026, en lo que Hock Tan calificó como el ciclo más rápido visto en ASICs avanzados.

OpenAI y Broadcom presentaron este miércoles el Jalapeño, el primer acelerador de IA diseñado por OpenAI y dedicado a workloads de inferencia de modelos de lenguaje. El chip es un ASIC, diseñado para una única clase de cargas, y fue del diseño inicial a la producción en nueve meses, a un ritmo que Hock Tan, CEO de Broadcom, describió como el ciclo más rápido jamás realizado en un semiconductor avanzado de alto rendimiento. Las primeras unidades comenzarán a operar a finales de 2026, como paso inicial de una plataforma de múltiples generaciones.


El número que pesa para el CIO es otro. En una entrevista después del anuncio, Tan afirmó que las pruebas iniciales indican un ahorro de costo de alrededor del 50% en comparación con las GPUs tradicionales de IA para la misma tarea de inferencia. Como ASIC, el Jalapeño no intenta competir con la flexibilidad de una GPU: cubre menos casos de uso, pero con un rendimiento por watt que, según la empresa, supera sustancialmente el estado del arte. Para una operación que gasta miles de millones en computación por trimestre solo para servir ChatGPT a gran escala, recortar a la mitad el costo unitario de la capa de inferencia cambia la ecuación de margen de los productos pagos de OpenAI antes de modificar cualquier hoja de ruta externa.


Por qué importa que el ciclo haya sido de nueve meses


Un ASIC de este tamaño suele tardar entre 18 y 24 meses desde el RTL hasta el silicio validado. Los nueve meses del Jalapeño, según ambas empresas, fueron posibles porque OpenAI utilizó sus propios modelos para acelerar etapas de diseño y optimización, en particular la verificación y exploración de espacio de diseño. El detalle no es trivial: significa que la ventaja de tiempo al mercado, históricamente la barrera más costosa para entrar en el mercado de aceleradores, está cediendo a quienes operan con modelos propios y disponen de capacidad de cálculo simbólico. Nvidia mantiene la ventaja en arquitecturas de propósito general; pierde, en este nuevo eje, la carrera por el silicio verticalizado y desechable.


Broadcom entra como socio de ejecución. La empresa proporciona la experiencia de implementación física, manufactura a través de TSMC y la pila de IP de red y SerDes que conecta miles de estas piezas en un pod de inferencia coherente. El contrato sigue un estándar que Broadcom ya opera con Google y Meta, pero que por primera vez gana un cliente cuya parte servible del negocio depende casi por completo del silicio que está comprando.


Quién pierde con el Jalapeño


Nvidia pierde menos de lo que sugiere el titular y más de lo que sugiere su propio discurso. El Jalapeño no reemplaza el entrenamiento, que sigue dependiendo de GPUs H100, H200 y Blackwell. Pero la inferencia es el lado de la carga que crece con la adopción del producto, y donde el 50% de ahorro citado por Tan se acumula a lo largo de cada token generado. Para Nvidia, la lectura interna más importante es que su mayor cliente declarado comenzó a comprar parte de su propia pila de inferencia por fuera, y eso cambia el cálculo de duración de la supercurva de ingresos de data center.


AMD e Intel quedan aún más expuestas. Tanto la MI400 como la Gaudi 3 venden el argumento de mejor costo-beneficio en inferencia. Este discurso se encoge frente a una OpenAI capaz de diseñar su propio ASIC en una ventana de nueve meses y recortar el TCO a la mitad sin subcontratar el diseño de la arquitectura.


Lectura global: dos mercados donde el efecto llega rápido


En el Reino Unido, OpenAI mantiene el segundo mayor contingente de ingeniería de la empresa fuera de los Estados Unidos, con una oficina en Londres dedicada, entre otras cosas, a aplicaciones empresariales. Bancos como Barclays y HSBC, que ya han contratado capacidad dedicada de inferencia ChatGPT Enterprise para flujos internos, deben ver el Jalapeño llegar como una reducción de precio por token en los planes corporativos antes de alcanzar a cualquier cliente final. En Singapur, hub regional donde OpenAI procesa demanda del Sudeste Asiático, el mismo movimiento cambia la viabilidad económica de suscripciones pagas por parte de gobiernos y bancos centrales que rechazaron la fijación de precios de 2025.


Brasil siente en segunda orden, vía repercusión. Itaú, Bradesco, Stone y operaciones de IA de Cosan realizan inferencia sobre OpenAI dentro de pipelines de BPO y atención; la mitad del costo por token es la mitad de una curva de costo que venía siendo el principal argumento de los CTO locales para desacelerar contratos.


La decisión de producto no anunciada este miércoles vale el anuncio entero: OpenAI dejó de ser cliente exclusivo de sus proveedores de chips y comenzó a ser también competidora de ellos en parte de la pila.

Análisis Principal