DeepSeek V4 Pro en VM0. Razonamiento optimizado en costo
El modelo insignia de razonamiento V4 de DeepSeek. A 0,2 puntos de Claude Opus 4.6 en SWE-bench Verified a un séptimo del costo de proveedor. API compatible con Claude.
1M tokens · Text / Code · Prompt cache
DeepSeek V4 Pro es el buque insignia de la generación V4 de DeepSeek — un MoE de 1,6T parámetros de peso abierto bajo licencia MIT. El titular es la relación precio-calidad: SWE-bench Verified reportado por el proveedor es 80,6%, a una fracción de punto de Claude Opus 4.6, a aproximadamente un séptimo del costo de proveedor de Anthropic. Esto hace que los agentes intensivos en razonamiento — revisión masiva de PR, análisis de documentos por lotes, resúmenes programados — sean asequibles a alto volumen.
El precio de lista del proveedor es $1,74 / $3,48 por 1M tokens con lecturas de caché a $0,028 / 1M y escrituras de caché gratuitas (único en el catálogo). Contexto de 1M tokens, API compatible con Anthropic. Recurre a Sonnet 4.6 cuando la fiabilidad de enrutamiento de herramientas en producción es el factor decisivo, y a V4 Flash cuando el trabajo masivo de un solo paso justifica un modelo 12× más barato.
¿Qué es DeepSeek V4 Pro?
24 de abril de 2026 · Variante de razonamiento de la familia DeepSeek V4. Emparejado con V4 Flash para costo.
DeepSeek V4 Pro es el buque insignia de la generación V4 de DeepSeek, lanzado el 24 de abril de 2026 bajo la Licencia MIT. Es un modelo Mixture-of-Experts de peso abierto con 1,6T parámetros totales y 49B activos por token, emparejado con V4 Flash (284B / 13B activos) para trabajo sensible al costo.
Ambos modelos V4 comparten un conjunto de características idéntico: ventana de contexto de 1M tokens, 384K de salida máxima, tres modos de esfuerzo de razonamiento (standard, think, think-max), salida JSON, llamadas a herramientas y completado FIM en modo no-think. El modelo Pro añade una arquitectura de atención híbrida (Compressed Sparse Attention + Heavily Compressed Attention) para una eficiencia de contexto largo drásticamente mejorada. 27% de los FLOPs de inferencia por token y 10% de la caché KV vs DeepSeek V3.2 en contexto de 1M.
DeepSeek causó sensación durante 2025 al ofrecer razonamiento de nivel Anthropic a una fracción del precio. V4 Pro continúa ese patrón: SWE-bench Verified 80,6% reportado por el proveedor está a 0,2 puntos de Claude Opus 4.6, a aproximadamente un séptimo del costo de proveedor. En VM0 se expone a través del proveedor de clave API de DeepSeek y en VM0 Managed a ×0,3. El mismo multiplicador que Claude Haiku 4.5 pero con un comportamiento de razonamiento sustancialmente más fuerte.
Qué destaca de DeepSeek V4 Pro
Características principales de arquitectura y capacidades.
V4 Pro es un modelo Mixture-of-Experts con 1,6T parámetros totales y 49B activos por token, con una pila de atención híbrida (Compressed Sparse Attention más Heavily Compressed Attention) que mantiene la inferencia de contexto largo económica. Soporta una ventana de contexto de 1M tokens con 384K de salida máxima, tres modos de esfuerzo de razonamiento (standard, think y think-max), y usa Conexiones Hiper-Restringidas de Variedad para propagación estable de señales. El modelo fue entrenado en más de 32T tokens con el optimizador Muon y se publica bajo la Licencia MIT con pesos abiertos.
Especificaciones rápidas
Benchmarks de DeepSeek V4 Pro
Puntuaciones reportadas por el proveedor del lanzamiento de V4 Pro de DeepSeek. Reseñas independientes (Geeky Gadgets, Code Arena) sitúan a V4 Pro tercero en Code Arena detrás de GLM-5.1 y Kimi K2.6. Las afirmaciones de benchmark más fuertes provienen de los propios materiales de DeepSeek. Trátalas como direccionales, no como verdad absoluta.
Precios de DeepSeek V4 Pro
Precio de lista del proveedor, por 1M de tokens.
Cómo se comporta DeepSeek V4 Pro en la práctica
Comportamiento observado en ejecuciones de agentes en producción.
Razonamiento
El razonamiento sub-Sonnet más fuerte de nuestro catálogo. Se mantiene en trabajo multi-paso donde modelos más baratos empiezan a desviarse. MMLU-Pro reportado por el proveedor iguala a GPT-5.4.
Benchmarks de codificación
Reportado por el proveedor: SWE-bench Verified 80,6% (a 0,2 de Opus 4.6), Terminal-Bench 2.0 67,9% (supera a Opus 4.6), LiveCodeBench 93,5%.
Eficiencia de costo
La propiedad destacada. Costo de crédito ×0,3 con razonamiento que compite bien con Sonnet 4.6 hace de V4 Pro el predeterminado de optimización de costos. ~7× más barato que Claude Opus 4.7.
Economía de caché
Las escrituras de caché son gratuitas. Único entre los modelos Built-in de VM0. Los prompts de sistema estables y los grandes documentos de referencia pegados no cuestan nada extra en caché, solo se factura el lado de lectura.
Velocidad
Alrededor de 36 tokens/seg en esfuerzo máximo según Artificial Analysis. Más lento que Haiku, ligeramente más lento que Opus 4.6.
Mejores tareas para DeepSeek V4 Pro
El agente de revisión de PR que se ejecuta en cada commit
La precisión de nivel Sonnet a aproximadamente un tercio del costo de proveedor de Sonnet es lo que hace que "revisar cada commit, no solo los PR grandes" sea realmente viable. V4 Pro lee el diff, los archivos relacionados y el issue vinculado, luego escribe un comentario estructurado — y el precio por llamada es lo suficientemente bajo como para que ejecutarlo como un paso de CI en cada push no aparezca como una partida notable.
El resumidor programado que se ejecuta cada noche
Extrae las conversaciones de clientes de ayer, tickets de soporte o llamadas de ventas y escribe un resumen. El prompt de sistema y el esquema de herramientas no cambian entre ejecuciones, y DeepSeek no factura las escrituras de caché — así que el largo prefijo fijo se paga una vez y las lecturas cacheadas cuestan una fracción de la entrada normal. Aquí es donde el modelo de precios de V4 Pro cambia genuinamente lo que es asequible.
El agente de código de repositorio completo que cuesta menos que Opus
Contexto de 1M tokens con atención híbrida (Compressed Sparse Attention más Heavily Compressed Attention) significa que un código base de tamaño medio cabe en un solo prompt y el costo de inferencia se mantiene manejable a medida que la ventana se llena. Para refactorizaciones entre archivos y revisiones a nivel de arquitectura, aquí es donde obtienes el flujo de trabajo estilo Opus de "ver todo a la vez" sin la factura estilo Opus.
Cuándo evitar DeepSeek V4 Pro
Evita V4 Pro en los casos límite más difíciles de enrutamiento de herramientas donde Sonnet 4.6 aún lidera, y en trabajo masivo de un solo paso donde no se requiere razonamiento y V4 Flash es aproximadamente 12× más barato.
DeepSeek V4 Pro vs otros modelos
DeepSeek V4 Pro vs DeepSeek V4 Flash
Mismo proveedor, diferente posicionamiento. V4 Pro (×0,3) te da razonamiento; V4 Flash (×0,02) te da el modelo de un solo paso más barato posible. SWE-bench Verified reportado por el proveedor muestra a Flash a 1,6 puntos de Pro (79,0 vs 80,6). Pero Pro se destaca en Terminal-Bench (67,9 vs 56,9) en uso de herramientas multi-paso.
DeepSeek V4 Pro vs Claude Sonnet 4.6
Sonnet 4.6 (×1) gana en casos límite de enrutamiento de herramientas y razonamiento en inglés. V4 Pro (×0,3) gana en costo y es competitivo en benchmarks de codificación (reportados por el proveedor). Vale la pena hacer pruebas A/B en un agente real antes de comprometerse.
DeepSeek V4 Pro vs Kimi K2.6
Mismo multiplicador (×0,3). Kimi tiene mejor recuperación de contexto largo y un Índice de Inteligencia más alto (54 vs 52); V4 Pro tiene mejor economía de caché (escrituras gratuitas) y una ventana de contexto de 1M vs 256K de Kimi. Elige según qué propiedad importa más.
Conclusión: ¿deberías usar DeepSeek V4 Pro?
Prefiltra con V4 Flash, escala a V4 Pro para razonamiento, escala a Sonnet 4.6 solo cuando V4 Pro se estanca en casos límite de enrutamiento de herramientas.
Preguntas frecuentes
¿Cuándo se lanzó DeepSeek V4 Pro?
DeepSeek lanzó V4 Pro y V4 Flash juntos el 24 de abril de 2026 bajo la Licencia MIT con pesos abiertos.
¿Por qué las escrituras de caché son gratuitas?
DeepSeek no factura la porción de escritura de caché. Solo las lecturas de caché facturan, a $0,145 por 1M tokens. Los prompts de sistema estables y los grandes contextos de referencia no cuestan nada extra en caché.
¿Cuál es la ventana de contexto de V4 Pro?
1 millón de tokens con hasta 384K tokens de salida. La arquitectura de atención híbrida hace que la ventana completa sea utilizable a un costo de inferencia mucho menor que V3.2.
¿Cómo se compara V4 Pro con Claude Opus 4.6?
SWE-bench Verified reportado por el proveedor está a 0,2 puntos (80,6 vs 80,8). Terminal-Bench 2.0 favorece a V4 Pro (67,9 vs 65,4). Opus 4.6 lidera en HLE (40,0 vs 37,7) y matemáticas HMMT 2026 (96,2 vs 95,2). A un costo de proveedor ~7× menor, V4 Pro es la opción correcta cuando la calidad de razonamiento es el listón pero el costo importa.
¿Es V4 Pro de código abierto?
Sí. Los pesos se publican bajo la Licencia MIT. La API alojada de DeepSeek es la ruta de producción para VM0.
Alternativas
Usar DeepSeek V4 Pro en VM0
Dos formas de acceder a DeepSeek V4 Pro en VM0
VM0 admite DeepSeek V4 Pro como modelo Built-in facturado en créditos VM0, y mediante bring-your-own con una DeepSeek API key. La ruta Built-in usa enrutamiento gestionado de VM0 y el multiplicador de créditos explicado abajo; la ruta bring-your-own te factura directamente con el proveedor upstream y omite la conversión de créditos VM0.
Recomendación de VM0
VM0 posiciona DeepSeek V4 Pro como una opción de ahorro en lugar de un modelo principal de agente. Úsalo para optimizar el coste unitario en trabajo no principal, como clasificación masiva, prefiltros, respuestas cortas con requisitos de latencia o agentes heredados fijos, manteniendo Claude Opus 4.7, Claude Opus 4.6 o Claude Sonnet 4.6 en los pasos que deciden la ejecución.
Créditos y el multiplicador ×0.3
Cada modelo Built-in en VM0 se valora como un múltiplo de Claude Sonnet 4.6, que establece la base de ×1 crédito. DeepSeek V4 Pro factura a ×0.3 créditos. El multiplicador es lo que aparece en tu factura de VM0; el precio de lista del proveedor en la tabla de arriba es lo que cobra el proveedor upstream antes de que VM0 lo convierta en créditos.
DeepSeek V4 Pro factura a ×0.3, lo que significa que un paso aquí cuesta solo 0.3× los créditos de un paso equivalente en Sonnet 4.6 (la base ×1). Esto lo sitúa muy por debajo de la base de créditos y lo convierte en la elección natural para trabajo en segundo plano de alto volumen donde el coste por paso importa más que la máxima calidad de razonamiento.
Disponible en VM0 desde April 24, 2026.