Hoy y de manera oficial, OpenAI presentó «Jalapeño», su primer procesador diseñado específicamente para ejecutar modelos de lenguaje, una pieza de hardware desarrollado junto a Broadcom. El chip apunta a mejorar la eficiencia de la infraestructura donde corren servicios como ChatGPT y también como estrategia para controlar una mayor parte de la tecnología sobre la que funcionan sus modelos.
Es importante destacar que a diferencia de otros procesadores, Jalapeño no está pensado para entrenar modelos de IA, sino para realizar tareas de inferencia, es decir, el proceso mediante el cual un modelo responde consultas, ejecuta agentes o genera contenido a partir de solicitudes de los usuarios.
OpenAI dijo en una publicación de su blog que el procesador comenzará a usarse en centros de datos hacia finales de 2026 y que es el primer paso de una plataforma de hardware de varias generaciones que prometen continuar y mantener.
Jalapeño y la optimización de los modelos de IA
A diferencia de las GPU de propósito general que dominan actualmente este mercado, Jalapeño es un circuito integrado de aplicación específica (ASIC) desarrollado exclusivamente para cargas de trabajo de inferencia. Según OpenAI, la arquitectura fue diseñada desde cero a partir de las necesidades de sus modelos de lenguaje y de los sistemas que utiliza para operar ChatGPT, Codex y su plataforma de API.
La empresa dice que las primeras pruebas muestran un rendimiento por vatio «sustancialmente superior» al de las soluciones más avanzadas disponibles, aunque aclaró que las mediciones finales aún están en curso y que publicará un informe técnico con los resultados completos en los próximos meses. También dijeron que el diseño busca reducir el movimiento de datos y equilibrar el uso de recursos de cómputo, memoria y redes para acercarse al rendimiento teórico máximo del hardware.
Broadcom participó en la implementación del silicio y de la infraestructura de red, mientras que Celestica colaboró en el desarrollo de placas, racks y sistemas para producción a gran escala. OpenAI explicó que la plataforma fue creada para funcionar con modelos de lenguaje actuales y futuros, no únicamente con sus propios desarrollos.
Recordemos que este anuncio llega nueve meses después de que OpenAI anunciara su alianza con Broadcom para desarrollar chips. ¿Y cuál es la idea? Buscar reducir su dependencia de los procesadores de Nvidia, cuyos GPU siguen siendo la base de gran parte de la infraestructura utilizada para entrenar y ejecutar modelos de inteligencia artificial.
En declaraciones hechas al medio Reuters, el director ejecutivo de Broadcom, Hock Tan, contó que Jalapeño tiene un desempeño comparable al de los procesadores Blackwell de Nvidia y a las TPU de Google para este tipo de tareas. Sin embargo, otros fabricantes como Microsoft, Meta y Amazon también han desarrollado chips propios para sus centros de datos, aunque Nvidia continúa liderando el mercado de aceleradores de IA de propósito general.
¿Y cómo notarán a Jalapeño los usuarios? De acuerdo con OpenAI, habrá mejoras en costo, velocidad y eficiencia de la inferencia, cuestión que debería traducirse en respuestas más rápidas en ChatGPT, una mayor capacidad para ejecutar tareas en Codex, menores costos para los servicios de API y una disponibilidad más estable cuando aumenta la demanda.









