Anthropic presentó Opus 4.5, una actualización de su modelo insignia Claude, disponible desde este 24 de noviembre en sus aplicaciones, API y principales nubes. Según la compañía, el nuevo sistema ofrece mayor precisión en programación, razonamiento y tareas de oficina, además de una arquitectura optimizada que reduce costos y amplía la duración de las conversaciones, una de las principales limitaciones de versiones anteriores.
Además, dentro de las características principales del nuevo modelo, se señaló que este alcanzó un 80,9% de precisión en el benchmark SWE-Bench Verified, superando a GPT-5.1-Codex-Max y Gemini 3 Pro, y que mejoró su rendimiento en tareas complejas con agentes autónomos. Y, se redujeron los precios de uso a $5 y $25 dólares por millón de tokens, ampliando el acceso a equipos y empresas.
La actualización incluye mejoras en Claude Code, que ahora permite ejecutar múltiples sesiones locales y remotas, así como nuevas herramientas en Excel, Chrome y escritorio. El modelo también introduce un parámetro de esfuerzo que ajusta la profundidad de razonamiento y consumo de recursos, adaptándose a distintos tipos de tareas.
Entre sus avances técnicos, la compañía destacó un rendimiento un 15% superior en eficiencia y un 20% en precisión para automatización en Microsoft Excel, con soporte para tablas dinámicas, gráficos y cargas de archivos. Además, su nueva gestión de contexto permite conversaciones más extensas mediante resúmenes automáticos, evitando los cortes abruptos que caracterizaban a Claude en sesiones largas.

Opus 4.5 y la seguridad en los modelos IA
El modelo fue presentado como el más seguro desarrollado por Anthropic hasta la fecha. En pruebas internas, Opus 4.5 mostró mayor resistencia frente a ataques de inyección de prompts, una técnica utilizada para manipular las respuestas de los modelos. En evaluaciones externas e internas, rechazó el 100% de las solicitudes maliciosas de programación prohibida y más del 88% de las de uso indebido en entornos de computadora, aunque los resultados fueron menos sólidos en Claude Code, donde la tasa de rechazo fue del 78%.
Según el informe técnico publicado por la empresa, el modelo demostró capacidad para coordinar múltiples subagentes, resolver tareas de investigación prolongadas y optimizar código con un menor número de iteraciones. Estas mejoras apuntan a consolidar la posición de Anthropic frente a competidores como OpenAI y Google, en un contexto donde los agentes inteligentes y la seguridad se convierten en los ejes centrales del desarrollo de IA empresarial.




