OpenAI acaba de presentar a su modelo GPT-5.4, una nueva versión de su sistema de inteligencia artificial orientado al trabajo profesional que ya comenzó a desplegarse en ChatGPT, Codex y la API. El lanzamiento incluyó variantes como GPT-5.4 Thinking, centrada en razonamiento, y GPT-5.4 Pro, diseñada para tareas complejas y de alto rendimiento, con mejoras en programación, análisis de datos y automatización de tareas en computadoras.

La compañía informó que el modelo reúne avances en razonamiento, programación y flujos de trabajo con agentes, con el objetivo de ejecutar tareas complejas como la creación de presentaciones, hojas de cálculo y documentos con menos iteraciones entre usuario y sistema.

Capacidades y rendimiento de GPT-5.4

Entre las novedades técnicas, GPT-5.4 incorpora capacidades nativas en el uso de computadores, lo que permite que el sistema ejecute tareas en distintos programas y sistemas operativos mediante comandos de teclado y mouse o mediante código que interactúa con aplicaciones.

En pruebas de rendimiento, el modelo alcanzó un 83 % en el benchmark GDPval, una evaluación de tareas de conocimiento profesional en 44 ocupaciones, superando el 70,9 % obtenido por GPT-5.2. También registró mejoras en pruebas relacionadas con el uso de computadores y navegación web, como OSWorld-Verified y WebArena-Verified.

Según OpenAI, el modelo también mejoró su precisión factual. En comparaciones internas con GPT-5.2, las afirmaciones individuales resultaron un 33 % menos propensas a ser falsas y las respuestas completas un 18 % menos propensas a contener errores.

Es importante destacar que el nuevo modelo se diseñó con especial énfasis para tareas habituales en entornos profesionales. En evaluaciones internas, por ejemplo, obtuvo un 87,3 % en pruebas de modelado de hojas de cálculo, frente al 68,4 % de GPT-5.2, mientras que evaluadores humanos prefirieron las presentaciones generadas por GPT-5.4 en el 68 % de los casos.

OpenAI comparó las capacidades del modelo en programas de ofimática, por ejemplo, PowerPoint.

Nuevas funciones para desarrolladores y empresas

En el ámbito técnico, GPT-5.4 admite ventanas de contexto de hasta un millón de tokens, lo que permite procesar grandes volúmenes de información en una sola interacción y planificar tareas extensas en flujos de trabajo automatizados.

El modelo también introduce un sistema denominado Tool Search, que permite a los agentes buscar definiciones de herramientas cuando las necesitan en lugar de incluirlas todas en el prompt inicial. Según la compañía, este método redujo el uso total de tokens en un 47 % en pruebas con flujos de trabajo complejos, lo que puede acelerar las solicitudes y disminuir costos.

GPT-5.4 comenzó a desplegarse de forma gradual. GPT-5.4 Thinking está disponible para usuarios de ChatGPT Plus, Team y Pro, mientras que GPT-5.4 Pro se ofrece para planes Pro, Enterprise y desarrolladores mediante la API, con precios de $2,50 dólares por millón de tokens de entrada, por encima de los $1,75 dólares que costaba el modelo anterior.