Claude Opus 4.7

El modelo insignia Claude 4 de Anthropic. La opción más potente de la familia para bucles de agente de largo horizonte, razonamiento complejo y ediciones de código al primer intento.

1M tokens · Text / Vision / Code · Prompt cache

Usar Claude Opus 4.7 en VM0

Claude Opus 4.7 es el modelo al que recurres cuando el trabajo debe salir bien a la primera: código que compila limpiamente, planes de múltiples pasos que no pierden el hilo en largas cadenas de herramientas, puzles abstractos con los que modelos más pequeños tropiezan. Los benchmarks del proveedor (SWE-bench Verified, Terminal-Bench 2.0, ARC AGI 2, OSWorld, BrowseComp) ponen cifras concretas a las mejoras sobre Opus 4.6.

El precio de lista del proveedor es de $5 / $25 por 1M tokens con entrada cacheada a $0,50 / 1M, el más alto de la familia Claude. El patrón rentable es mantener Sonnet 4.6 como predeterminado y enrutar solo los pasos más difíciles a Opus.

¿Qué es Claude Opus 4.7?

Abril 2026 (sucediendo a Opus 4.6) · Nivel superior de la familia Claude 4. La actualización recomendada por Anthropic para usuarios de Opus 4.6.

Claude Opus 4.7 es el buque insignia de la familia Claude 4 de Anthropic, lanzado en abril de 2026 como la actualización recomendada desde Opus 4.6. Anthropic lo presenta como una mejora sustancial en codificación agéntica y razonamiento abstracto, no como un simple refresco de la API superficial. La ventana de contexto de 1M tokens y los niveles de esfuerzo de pensamiento adaptativo introducidos en 4.6 se mantienen sin cambios, por lo que el código de agente existente funciona sin reescrituras.

En comparación con Sonnet 4.6 (el caballo de batalla de la misma familia), Opus invierte más cómputo por token. El beneficio práctico se manifiesta en tres áreas: menos instrucciones perdidas en bucles de agente largos, parches de código significativamente mejores al primer intento y mejor recuperación cuando el historial de conversación supera los 100K tokens. El compromiso es el precio de lista más alto de la familia Claude ($5 / $25 por 1M tokens) y una velocidad de salida por token más lenta, razón por la cual Anthropic posiciona a Opus como el orquestador o nivel de escalación, no como el predeterminado universal.

Los rankings independientes (Artificial Analysis, Vellum) corroboran el orden relativo frente a Opus 4.6, pero las cifras absolutas cambian semanalmente y OpenAI ha señalado contaminación de datos de entrenamiento en SWE-bench Verified en todos los modelos frontera. Trata las puntuaciones públicas como direccionales, no como autoritativas; las diferencias estructurales de comportamiento (coherencia en bucles largos, calidad de parche al primer intento, fiabilidad de enrutamiento multi-herramienta) son la señal más duradera.

Qué destaca de Claude Opus 4.7

Características principales de arquitectura y capacidades.

Opus 4.7 mantiene la ventana de contexto de 1M tokens de Opus 4.6, facturada a precio de entrada estándar en toda la ventana. Soporta pensamiento adaptativo en cuatro niveles de esfuerzo (bajo, medio, alto y máximo), una API de Compactación para resumen de contexto del lado del servidor en ejecuciones largas, y caché de prompts donde la entrada cacheada se factura a una décima parte de la tarifa de entrada. Las superficies multi-agente y de uso de herramientas no cambian respecto a 4.6, incluyendo el Protocolo Mailbox para equipos de agentes peer-to-peer y el parámetro inference_geo que expone inferencia solo en EE. UU. con un multiplicador de 1,1×. Las entradas son multimodales: texto, visión y código.

Especificaciones rápidas

FamiliaGeneración Claude 4

ModalidadesTexto, visión, código

IdiomasInglés primero, multilingüe

Caché de promptsSoportado (Anthropic)

Ventana de contexto1M tokens

Salida máximaHasta 64K tokens

Niveles de esfuerzoBajo / Medio / Alto / Máximo

Precio de lista$5 entrada / $25 salida por 1M

Benchmarks de Claude Opus 4.7

Puntuaciones reportadas por el proveedor de los materiales de lanzamiento de Opus 4.7 de Anthropic, con deltas mostrados contra las cifras públicas de Opus 4.6. Las reseñas independientes sitúan a 4.7 por delante de GPT-5.2 en la mayoría de tareas de codificación agéntica y a pocos puntos de Gemini 3 Pro en razonamiento abstracto. Trata los porcentajes absolutos como direccionales; OpenAI ha señalado contaminación de datos de entrenamiento en SWE-bench Verified en todos los modelos frontera.

SWE-bench Verifiedreportado por el proveedor; sube desde 80,8% de Opus 4.6

~83,5%

SWE-bench Proreportado por el proveedor

Lidera la familia Claude

Terminal-Bench 2.0reportado por el proveedor; sube desde 65,4% de Opus 4.6

~71%

τ2-bench Retailuso de herramientas reportado por el proveedor

~93%

OSWorld (uso de computadora)reportado por el proveedor; sube desde 72,7% de Opus 4.6

~76%

BrowseComptareas web reportadas por el proveedor

~88%

ARC AGI 2reportado por el proveedor; sube desde 68,8% de Opus 4.6

~75%

Humanity's Last Exam (con herramientas)reportado por el proveedor

Lidera la familia Claude

GPQA Diamondciencia de nivel posgrado reportado por el proveedor

~92%

MRCR v2 (1M, 8-agujas)recuperación de contexto largo

Mejorado sobre el 76% de 4.6

MMMU Pro (multimodal)reportado por el proveedor

Lidera la familia Claude

Precios de Claude Opus 4.7

Precio de lista del proveedor, por 1M de tokens.

Input$5.00

Output$25.00

Lectura de caché$0.50

Escritura de caché$6.25

Cómo se comporta Claude Opus 4.7 en la práctica

Comportamiento observado en ejecuciones de agentes en producción.

Enrutamiento de herramientas

La tasa más baja de llamadas a herramientas mal enrutadas en la familia Claude. La brecha frente a Sonnet 4.6 se amplía en casos límite difíciles como selección condicional de herramientas, argumentos profundamente anidados y llamadas a herramientas después de largos tramos de razonamiento.

Recuperación de contexto largo

Coherente en transcripciones de agente de más de 200K tokens. La ventana de 1M tokens se mantiene mucho mejor que sus predecesores gracias a las mejoras de deterioro de contexto que Anthropic introdujo en Opus 4.6 y refinó aún más para 4.7. MRCR v2 a 1M reportado por el proveedor muestra una mejora medible sobre el 76% de Opus 4.6.

Ediciones de código al primer intento

La mejor calidad de parche en la familia Claude. La opción correcta cuando un agente debe modificar código que debe seguir compilando y pasando pruebas, especialmente cuando el parche abarca múltiples archivos. El resultado de Terminal-Bench 2.0 de Anthropic refleja esto directamente.

Velocidad

Más lento que Sonnet 4.6 y notablemente más lento que Haiku 4.5. Anthropic publica ~41 tokens/seg en esfuerzo máximo para Opus 4.6, y 4.7 está en un rango similar. Resérvalo para los pasos que realmente necesitan la profundidad de razonamiento adicional y ejecuta niveles más ligeros en paralelo.

Comportamiento de alucinación

Opus 4.7 mantiene la postura conservadora de rechazo de Anthropic y tiende a admitir incertidumbre en lugar de confabular, razón por la cual los equipos de producción siguen pagando la prima por razonamiento de alto riesgo a pesar de que alternativas de peso abierto más baratas como Kimi K2.6 y DeepSeek V4 Pro ahora lo igualan en benchmarks.

Mejores tareas para Claude Opus 4.7

La revisión de PR que detecta lo que los humanos pasan por alto

Cuando un pull request cambia 30 archivos, Opus 4.7 mantiene todo el cambio en memoria de trabajo y escribe una revisión que conecta lo que cambió en auth/middleware.ts con la prueba que rompió en routes/admin.test.ts. Los revisores junior reciben el tipo de retroalimentación entre archivos que los ingenieros senior suelen detectar en una segunda pasada, y el equipo envía menos parches que pasan CI pero fallan en producción.

La ejecución de investigación que lee todo el montón

Carga un borrador de contrato de 200 páginas, tres propuestas de competidores y las opiniones legales del último trimestre en la ventana de contexto de 1M tokens, luego pide a Opus que marque cada cláusula más restrictiva que el mercado y enumere los puntos probables de negociación. Los modelos más pequeños empiezan a olvidar secciones anteriores después de 100K tokens; Opus mantiene la imagen completa y referencia el párrafo exacto que está citando.

El orquestador ejecutando un plan multi-herramienta

Usa Opus 4.7 como el planificador que divide la solicitud de un cliente en diez pasos, despacha cada paso a un sub-agente de nivel Sonnet o Haiku, y une los resultados. Ejecutar Opus solo en la capa de planificación (y los niveles más baratos en el resto) cuesta una fracción de ejecutar Opus de principio a fin, conservando la mayor parte de la calidad.

Las ediciones de código al primer intento que no desperdician una ejecución de CI

Pide a Opus 4.7 que migre un código base de 50 archivos de un ORM a otro, refactorice un módulo enredado o aplique una corrección de seguridad en todo el repositorio. El parche se aplica limpiamente al primer intento con más frecuencia que cualquier otro modelo de la familia, que es lo que refleja Terminal-Bench 2.0 reportado por el proveedor, y lo que tu factura de CI también reflejará.

Cuándo evitar Claude Opus 4.7

Evita Opus 4.7 en trabajo rutinario de alto volumen donde Sonnet 4.6 alcanza la misma calidad a una fracción del costo, en respuestas de chat sensibles a la latencia donde Haiku 4.5 es mucho más rápido, y en trabajos de clasificación o extracción masiva donde DeepSeek V4 Flash es aproximadamente 80× más barato a nivel de proveedor.

Claude Opus 4.7 vs otros modelos

Claude Opus 4.7 vs Claude Sonnet 4.6

Sonnet 4.6 es el caballo de batalla predeterminado en la familia Claude y la opción correcta para la mayoría de agentes. Promueve a Opus 4.7 solo cuando Sonnet falla visiblemente en razonamiento difícil, contexto largo o ediciones de código al primer intento, usualmente como el orquestador que delega hacia abajo a sub-agentes de nivel Sonnet o Haiku.

Claude Opus 4.7 vs Claude Opus 4.6

Misma ventana de contexto (1M tokens), mismo precio de proveedor y la misma arquitectura de pensamiento adaptativo. Opus 4.7 es la generación más reciente con mejoras reportadas por el proveedor en SWE-bench Verified, Terminal-Bench 2.0, ARC AGI 2 y OSWorld. Elige 4.7 para nuevos agentes; mantén 4.6 solo cuando un agente existente haya sido validado contra esa versión y necesites estabilidad de comportamiento.

Claude Opus 4.7 vs Kimi K2.6

Kimi K2.6 de Moonshot lidera varios benchmarks agénticos en la frontera de código abierto (SWE-bench Pro 58,6 reportado por el proveedor versus 53,4 de Opus 4.6). Opus 4.7 mantiene el liderazgo en fiabilidad de enrutamiento de herramientas para agentes de producción en inglés y en perfil de seguridad, razón por la cual la mayoría de equipos empresariales aún lo mantienen como el nivel de alto riesgo.

Claude Opus 4.7 vs DeepSeek V4 Pro

DeepSeek V4 Pro va por detrás de Opus en la mayoría de benchmarks de razonamiento pero lo iguala en codificación (SWE-bench Verified reportado por el proveedor dentro de ~0,2 puntos). La división es clara: elige DeepSeek cuando el costo bruto domina, elige Opus 4.7 cuando la fiabilidad, el perfil de seguridad o la precisión de enrutamiento de herramientas importan más que el precio por llamada.

Claude Opus 4.7 vs GPT-5.2 / Gemini 3 Pro

Los materiales del proveedor de Anthropic posicionan a Opus 4.7 por delante de GPT-5.2 en la mayoría de tareas de codificación agéntica (Terminal-Bench, τ2-bench Retail) y a pocos puntos de Gemini 3 Pro en razonamiento abstracto (ARC AGI 2, GPQA Diamond). Los rankings independientes corroboran el orden aproximado pero cambian semanalmente.

Conclusión: ¿deberías usar Claude Opus 4.7?

Opus 4.7 es el nivel de escalación. Usa Sonnet 4.6 por defecto; promueve a Opus solo en los pasos específicos donde Sonnet falla visiblemente.

Preguntas frecuentes

¿Cuál es la ventana de contexto de Claude Opus 4.7?

1 millón de tokens, con hasta 64K tokens de salida por respuesta. La ventana completa se factura a tarifas estándar. Una solicitud de 900K tokens tiene la misma tarifa por token que una solicitud de 9K tokens.

¿Puede Claude Opus 4.7 manejar imágenes?

Sí. Opus 4.7 es multimodal. Acepta entradas de imagen junto con texto y código, por lo que los agentes basados en capturas de pantalla y visión de documentos funcionan de forma nativa.

¿Cuándo debería elegir Opus 4.7 sobre Sonnet 4.6?

Cuando (a) el agente es el planificador/orquestador y las decisiones se propagan en cascada, (b) la ejecución es lo suficientemente larga como para que Sonnet empiece a perder instrucciones, o (c) la salida debe aplicarse limpiamente al primer intento (ediciones de código, cargas estructuradas).

¿Debería migrar de Opus 4.6 a Opus 4.7?

Sí. Anthropic recomienda explícitamente 4.7 sobre 4.6. Mismo multiplicador, mejor comportamiento. Migra los agentes de producción fijados solo después de ejecutarlos en tu suite de regresión.

¿Opus 4.7 soporta caché de prompts?

Sí. La entrada cacheada se factura a $0,50 por 1M tokens. Un descuento del 10× en la porción cacheada. Vale la pena usarlo cuando tu prompt de sistema o esquema de herramientas es estable entre llamadas.

Alternativas

Claude Sonnet 4.6

Predeterminado más barato para la mayoría de bucles de agente

Kimi K2.6

Mejor recuperación de contexto largo a menor costo

DeepSeek V4 Pro

Razonamiento optimizado en costo si Claude es excesivo

Usar Claude Opus 4.7 en VM0

Dos formas de acceder a Claude Opus 4.7 en VM0

VM0 admite Claude Opus 4.7 como modelo Built-in facturado en créditos VM0, y mediante bring-your-own con una Anthropic API key. La ruta Built-in usa enrutamiento gestionado de VM0 y el multiplicador de créditos explicado abajo; la ruta bring-your-own te factura directamente con el proveedor upstream y omite la conversión de créditos VM0.

Recomendación de VM0

VM0 posiciona Claude Opus 4.7 como modelo principal de agente, recomendado junto a Claude Opus 4.7, Claude Opus 4.6 y Claude Sonnet 4.6 para los pasos que determinan el resultado real de una ejecución. Estos son los modelos que elegimos para el rol de orquestador, para agentes que trabajan con código y para cualquier paso donde una respuesta incorrecta sea costosa.

Créditos y el multiplicador ×1.7

Cada modelo Built-in en VM0 se valora como un múltiplo de Claude Sonnet 4.6, que establece la base de ×1 crédito. Claude Opus 4.7 factura a ×1.7 créditos. El multiplicador es lo que aparece en tu factura de VM0; el precio de lista del proveedor en la tabla de arriba es lo que cobra el proveedor upstream antes de que VM0 lo convierta en créditos.

Claude Opus 4.7 factura a ×1.7, lo que significa que un paso aquí cuesta 1.7× los créditos de un paso equivalente en Sonnet 4.6 (la base ×1). Es un nivel premium en VM0, por lo que el patrón rentable es usar por defecto un modelo más barato y enrutar solo los pasos que realmente necesitan la profundidad de razonamiento adicional a Claude Opus 4.7.

Disponible en VM0 desde April 17, 2026.

¿Qué es Claude Opus 4.7?

Qué destaca de Claude Opus 4.7

Especificaciones rápidas

Benchmarks de Claude Opus 4.7

Precios de Claude Opus 4.7

Cómo se comporta Claude Opus 4.7 en la práctica

Enrutamiento de herramientas

Recuperación de contexto largo

Ediciones de código al primer intento

Velocidad

Comportamiento de alucinación

Mejores tareas para Claude Opus 4.7

La revisión de PR que detecta lo que los humanos pasan por alto

La ejecución de investigación que lee todo el montón

El orquestador ejecutando un plan multi-herramienta

Las ediciones de código al primer intento que no desperdician una ejecución de CI

Cuándo evitar Claude Opus 4.7

Claude Opus 4.7 vs otros modelos

Claude Opus 4.7 vs Claude Sonnet 4.6

Claude Opus 4.7 vs Claude Opus 4.6

Claude Opus 4.7 vs Kimi K2.6

Claude Opus 4.7 vs DeepSeek V4 Pro

Claude Opus 4.7 vs GPT-5.2 / Gemini 3 Pro

Conclusión: ¿deberías usar Claude Opus 4.7?

Preguntas frecuentes

¿Cuál es la ventana de contexto de Claude Opus 4.7?

¿Puede Claude Opus 4.7 manejar imágenes?

¿Cuándo debería elegir Opus 4.7 sobre Sonnet 4.6?

¿Debería migrar de Opus 4.6 a Opus 4.7?

¿Opus 4.7 soporta caché de prompts?

Alternativas

Usar Claude Opus 4.7 en VM0

Dos formas de acceder a Claude Opus 4.7 en VM0

Recomendación de VM0

Créditos y el multiplicador ×1.7

Más modelos en VM0