Claude Opus 4.7
El modelo insignia Claude 4 de Anthropic. La opción más potente de la familia para bucles de agente de largo horizonte, razonamiento complejo y ediciones de código al primer intento.
1M tokens · Text / Vision / Code · Prompt cache
Claude Opus 4.7 es el modelo al que recurres cuando el trabajo debe salir bien a la primera: código que compila limpiamente, planes de múltiples pasos que no pierden el hilo en largas cadenas de herramientas, puzles abstractos con los que modelos más pequeños tropiezan. Los benchmarks del proveedor (SWE-bench Verified, Terminal-Bench 2.0, ARC AGI 2, OSWorld, BrowseComp) ponen cifras concretas a las mejoras sobre Opus 4.6.
El precio de lista del proveedor es de $5 / $25 por 1M tokens con entrada cacheada a $0,50 / 1M, el más alto de la familia Claude. El patrón rentable es mantener Sonnet 4.6 como predeterminado y enrutar solo los pasos más difíciles a Opus.
¿Qué es Claude Opus 4.7?
Abril 2026 (sucediendo a Opus 4.6) · Nivel superior de la familia Claude 4. La actualización recomendada por Anthropic para usuarios de Opus 4.6.
Claude Opus 4.7 es el buque insignia de la familia Claude 4 de Anthropic, lanzado en abril de 2026 como la actualización recomendada desde Opus 4.6. Anthropic lo presenta como una mejora sustancial en codificación agéntica y razonamiento abstracto, no como un simple refresco de la API superficial. La ventana de contexto de 1M tokens y los niveles de esfuerzo de pensamiento adaptativo introducidos en 4.6 se mantienen sin cambios, por lo que el código de agente existente funciona sin reescrituras.
En comparación con Sonnet 4.6 (el caballo de batalla de la misma familia), Opus invierte más cómputo por token. El beneficio práctico se manifiesta en tres áreas: menos instrucciones perdidas en bucles de agente largos, parches de código significativamente mejores al primer intento y mejor recuperación cuando el historial de conversación supera los 100K tokens. El compromiso es el precio de lista más alto de la familia Claude ($5 / $25 por 1M tokens) y una velocidad de salida por token más lenta, razón por la cual Anthropic posiciona a Opus como el orquestador o nivel de escalación, no como el predeterminado universal.
Los rankings independientes (Artificial Analysis, Vellum) corroboran el orden relativo frente a Opus 4.6, pero las cifras absolutas cambian semanalmente y OpenAI ha señalado contaminación de datos de entrenamiento en SWE-bench Verified en todos los modelos frontera. Trata las puntuaciones públicas como direccionales, no como autoritativas; las diferencias estructurales de comportamiento (coherencia en bucles largos, calidad de parche al primer intento, fiabilidad de enrutamiento multi-herramienta) son la señal más duradera.
Qué destaca de Claude Opus 4.7
Características principales de arquitectura y capacidades.
Opus 4.7 mantiene la ventana de contexto de 1M tokens de Opus 4.6, facturada a precio de entrada estándar en toda la ventana. Soporta pensamiento adaptativo en cuatro niveles de esfuerzo (bajo, medio, alto y máximo), una API de Compactación para resumen de contexto del lado del servidor en ejecuciones largas, y caché de prompts donde la entrada cacheada se factura a una décima parte de la tarifa de entrada. Las superficies multi-agente y de uso de herramientas no cambian respecto a 4.6, incluyendo el Protocolo Mailbox para equipos de agentes peer-to-peer y el parámetro inference_geo que expone inferencia solo en EE. UU. con un multiplicador de 1,1×. Las entradas son multimodales: texto, visión y código.
Especificaciones rápidas
Benchmarks de Claude Opus 4.7
Puntuaciones reportadas por el proveedor de los materiales de lanzamiento de Opus 4.7 de Anthropic, con deltas mostrados contra las cifras públicas de Opus 4.6. Las reseñas independientes sitúan a 4.7 por delante de GPT-5.2 en la mayoría de tareas de codificación agéntica y a pocos puntos de Gemini 3 Pro en razonamiento abstracto. Trata los porcentajes absolutos como direccionales; OpenAI ha señalado contaminación de datos de entrenamiento en SWE-bench Verified en todos los modelos frontera.
Precios de Claude Opus 4.7
Precio de lista del proveedor, por 1M de tokens.
Cómo se comporta Claude Opus 4.7 en la práctica
Comportamiento observado en ejecuciones de agentes en producción.
Enrutamiento de herramientas
La tasa más baja de llamadas a herramientas mal enrutadas en la familia Claude. La brecha frente a Sonnet 4.6 se amplía en casos límite difíciles como selección condicional de herramientas, argumentos profundamente anidados y llamadas a herramientas después de largos tramos de razonamiento.
Recuperación de contexto largo
Coherente en transcripciones de agente de más de 200K tokens. La ventana de 1M tokens se mantiene mucho mejor que sus predecesores gracias a las mejoras de deterioro de contexto que Anthropic introdujo en Opus 4.6 y refinó aún más para 4.7. MRCR v2 a 1M reportado por el proveedor muestra una mejora medible sobre el 76% de Opus 4.6.
Ediciones de código al primer intento
La mejor calidad de parche en la familia Claude. La opción correcta cuando un agente debe modificar código que debe seguir compilando y pasando pruebas, especialmente cuando el parche abarca múltiples archivos. El resultado de Terminal-Bench 2.0 de Anthropic refleja esto directamente.
Velocidad
Más lento que Sonnet 4.6 y notablemente más lento que Haiku 4.5. Anthropic publica ~41 tokens/seg en esfuerzo máximo para Opus 4.6, y 4.7 está en un rango similar. Resérvalo para los pasos que realmente necesitan la profundidad de razonamiento adicional y ejecuta niveles más ligeros en paralelo.
Comportamiento de alucinación
Opus 4.7 mantiene la postura conservadora de rechazo de Anthropic y tiende a admitir incertidumbre en lugar de confabular, razón por la cual los equipos de producción siguen pagando la prima por razonamiento de alto riesgo a pesar de que alternativas de peso abierto más baratas como Kimi K2.6 y DeepSeek V4 Pro ahora lo igualan en benchmarks.
Mejores tareas para Claude Opus 4.7
La revisión de PR que detecta lo que los humanos pasan por alto
Cuando un pull request cambia 30 archivos, Opus 4.7 mantiene todo el cambio en memoria de trabajo y escribe una revisión que conecta lo que cambió en auth/middleware.ts con la prueba que rompió en routes/admin.test.ts. Los revisores junior reciben el tipo de retroalimentación entre archivos que los ingenieros senior suelen detectar en una segunda pasada, y el equipo envía menos parches que pasan CI pero fallan en producción.
La ejecución de investigación que lee todo el montón
Carga un borrador de contrato de 200 páginas, tres propuestas de competidores y las opiniones legales del último trimestre en la ventana de contexto de 1M tokens, luego pide a Opus que marque cada cláusula más restrictiva que el mercado y enumere los puntos probables de negociación. Los modelos más pequeños empiezan a olvidar secciones anteriores después de 100K tokens; Opus mantiene la imagen completa y referencia el párrafo exacto que está citando.
El orquestador ejecutando un plan multi-herramienta
Usa Opus 4.7 como el planificador que divide la solicitud de un cliente en diez pasos, despacha cada paso a un sub-agente de nivel Sonnet o Haiku, y une los resultados. Ejecutar Opus solo en la capa de planificación (y los niveles más baratos en el resto) cuesta una fracción de ejecutar Opus de principio a fin, conservando la mayor parte de la calidad.
Las ediciones de código al primer intento que no desperdician una ejecución de CI
Pide a Opus 4.7 que migre un código base de 50 archivos de un ORM a otro, refactorice un módulo enredado o aplique una corrección de seguridad en todo el repositorio. El parche se aplica limpiamente al primer intento con más frecuencia que cualquier otro modelo de la familia, que es lo que refleja Terminal-Bench 2.0 reportado por el proveedor, y lo que tu factura de CI también reflejará.
Cuándo evitar Claude Opus 4.7
Evita Opus 4.7 en trabajo rutinario de alto volumen donde Sonnet 4.6 alcanza la misma calidad a una fracción del costo, en respuestas de chat sensibles a la latencia donde Haiku 4.5 es mucho más rápido, y en trabajos de clasificación o extracción masiva donde DeepSeek V4 Flash es aproximadamente 80× más barato a nivel de proveedor.
Claude Opus 4.7 vs otros modelos
Claude Opus 4.7 vs Claude Sonnet 4.6
Sonnet 4.6 es el caballo de batalla predeterminado en la familia Claude y la opción correcta para la mayoría de agentes. Promueve a Opus 4.7 solo cuando Sonnet falla visiblemente en razonamiento difícil, contexto largo o ediciones de código al primer intento, usualmente como el orquestador que delega hacia abajo a sub-agentes de nivel Sonnet o Haiku.
Claude Opus 4.7 vs Claude Opus 4.6
Misma ventana de contexto (1M tokens), mismo precio de proveedor y la misma arquitectura de pensamiento adaptativo. Opus 4.7 es la generación más reciente con mejoras reportadas por el proveedor en SWE-bench Verified, Terminal-Bench 2.0, ARC AGI 2 y OSWorld. Elige 4.7 para nuevos agentes; mantén 4.6 solo cuando un agente existente haya sido validado contra esa versión y necesites estabilidad de comportamiento.
Claude Opus 4.7 vs Kimi K2.6
Kimi K2.6 de Moonshot lidera varios benchmarks agénticos en la frontera de código abierto (SWE-bench Pro 58,6 reportado por el proveedor versus 53,4 de Opus 4.6). Opus 4.7 mantiene el liderazgo en fiabilidad de enrutamiento de herramientas para agentes de producción en inglés y en perfil de seguridad, razón por la cual la mayoría de equipos empresariales aún lo mantienen como el nivel de alto riesgo.
Claude Opus 4.7 vs DeepSeek V4 Pro
DeepSeek V4 Pro va por detrás de Opus en la mayoría de benchmarks de razonamiento pero lo iguala en codificación (SWE-bench Verified reportado por el proveedor dentro de ~0,2 puntos). La división es clara: elige DeepSeek cuando el costo bruto domina, elige Opus 4.7 cuando la fiabilidad, el perfil de seguridad o la precisión de enrutamiento de herramientas importan más que el precio por llamada.
Claude Opus 4.7 vs GPT-5.2 / Gemini 3 Pro
Los materiales del proveedor de Anthropic posicionan a Opus 4.7 por delante de GPT-5.2 en la mayoría de tareas de codificación agéntica (Terminal-Bench, τ2-bench Retail) y a pocos puntos de Gemini 3 Pro en razonamiento abstracto (ARC AGI 2, GPQA Diamond). Los rankings independientes corroboran el orden aproximado pero cambian semanalmente.
Conclusión: ¿deberías usar Claude Opus 4.7?
Opus 4.7 es el nivel de escalación. Usa Sonnet 4.6 por defecto; promueve a Opus solo en los pasos específicos donde Sonnet falla visiblemente.
Preguntas frecuentes
¿Cuál es la ventana de contexto de Claude Opus 4.7?
1 millón de tokens, con hasta 64K tokens de salida por respuesta. La ventana completa se factura a tarifas estándar. Una solicitud de 900K tokens tiene la misma tarifa por token que una solicitud de 9K tokens.
¿Puede Claude Opus 4.7 manejar imágenes?
Sí. Opus 4.7 es multimodal. Acepta entradas de imagen junto con texto y código, por lo que los agentes basados en capturas de pantalla y visión de documentos funcionan de forma nativa.
¿Cuándo debería elegir Opus 4.7 sobre Sonnet 4.6?
Cuando (a) el agente es el planificador/orquestador y las decisiones se propagan en cascada, (b) la ejecución es lo suficientemente larga como para que Sonnet empiece a perder instrucciones, o (c) la salida debe aplicarse limpiamente al primer intento (ediciones de código, cargas estructuradas).
¿Debería migrar de Opus 4.6 a Opus 4.7?
Sí. Anthropic recomienda explícitamente 4.7 sobre 4.6. Mismo multiplicador, mejor comportamiento. Migra los agentes de producción fijados solo después de ejecutarlos en tu suite de regresión.
¿Opus 4.7 soporta caché de prompts?
Sí. La entrada cacheada se factura a $0,50 por 1M tokens. Un descuento del 10× en la porción cacheada. Vale la pena usarlo cuando tu prompt de sistema o esquema de herramientas es estable entre llamadas.
Alternativas
Usar Claude Opus 4.7 en VM0
Dos formas de acceder a Claude Opus 4.7 en VM0
VM0 admite Claude Opus 4.7 como modelo Built-in facturado en créditos VM0, y mediante bring-your-own con una Anthropic API key. La ruta Built-in usa enrutamiento gestionado de VM0 y el multiplicador de créditos explicado abajo; la ruta bring-your-own te factura directamente con el proveedor upstream y omite la conversión de créditos VM0.
Recomendación de VM0
VM0 posiciona Claude Opus 4.7 como modelo principal de agente, recomendado junto a Claude Opus 4.7, Claude Opus 4.6 y Claude Sonnet 4.6 para los pasos que determinan el resultado real de una ejecución. Estos son los modelos que elegimos para el rol de orquestador, para agentes que trabajan con código y para cualquier paso donde una respuesta incorrecta sea costosa.
Créditos y el multiplicador ×1.7
Cada modelo Built-in en VM0 se valora como un múltiplo de Claude Sonnet 4.6, que establece la base de ×1 crédito. Claude Opus 4.7 factura a ×1.7 créditos. El multiplicador es lo que aparece en tu factura de VM0; el precio de lista del proveedor en la tabla de arriba es lo que cobra el proveedor upstream antes de que VM0 lo convierta en créditos.
Claude Opus 4.7 factura a ×1.7, lo que significa que un paso aquí cuesta 1.7× los créditos de un paso equivalente en Sonnet 4.6 (la base ×1). Es un nivel premium en VM0, por lo que el patrón rentable es usar por defecto un modelo más barato y enrutar solo los pasos que realmente necesitan la profundidad de razonamiento adicional a Claude Opus 4.7.
Disponible en VM0 desde April 17, 2026.