Todos los modelos

Claude Haiku 4.5 en VM0. Enrutamiento rápido y barato

El Claude rápido y barato. Suficientemente bueno para enrutamiento, resúmenes cortos y llamadas simples a herramientas a una fracción del costo de Sonnet.

200K tokens · Text / Vision / Code · Prompt cache

Claude Haiku 4.5 es el Claude pequeño y rápido — las respuestas se ejecutan a aproximadamente 97 tokens de salida por segundo (cuatro a cinco veces más rápido que Sonnet 4.5) y puedes ejecutarlo en mucho tráfico sin ver la factura dispararse.

Sigue siendo un Claude real: SWE-bench Verified reportado por el proveedor alcanza 73,3%, solo unos pocos puntos por detrás de Sonnet 4.5 a un tercio del costo, y la evaluación de codificación agéntica de Augment supuestamente lo sitúa al 90% del rendimiento de Sonnet 4.5.

El precio de lista del proveedor es $1 / $5 por 1M tokens con entrada cacheada a $0,10 / 1M. Úsalo como el trabajador de alto rendimiento o sub-agente bajo un sistema liderado por Sonnet u Opus; evítalo cuando el bucle es largo y de múltiples pasos.

¿Qué es Claude Haiku 4.5?

Finales de 2025 (generación Claude 4.5) · El nivel más pequeño de la familia Claude 4. La opción de alto rendimiento y baja latencia de Anthropic.

Claude Haiku 4.5 es el miembro pequeño y rápido de la familia Claude 4. Está construido para trabajo sensible a la latencia y de alto volumen donde Sonnet sería excesivo: llamadas a una sola herramienta, clasificaciones rápidas, resúmenes cortos y respuestas simples de Slack.

Haiku 4.5 es notablemente capaz para su nivel. La puntuación SWE-bench Verified reportada por Anthropic es 73,3%. Solo ~4 puntos por detrás de Sonnet 4.5 a un tercio del costo. En la evaluación de codificación agéntica de Augment, supuestamente alcanza el 90% del rendimiento de Sonnet 4.5, lo que lo sitúa en territorio genuino de sub-agente.

A pesar de ser el Claude pequeño, Haiku 4.5 es multimodal (capaz de visión), soporta caché de prompts y se ejecuta a ~97 tokens/seg. Cómodamente el modelo más rápido en nuestro catálogo Built-in.

Qué destaca de Claude Haiku 4.5

Características principales de arquitectura y capacidades.

Haiku 4.5 incluye una ventana de contexto de 200K tokens, entrada multimodal de texto, visión y código, y caché de prompts que factura la entrada cacheada a una décima parte de la tarifa de entrada. La salida se ejecuta a aproximadamente 97 tokens por segundo, cuatro a cinco veces más rápido que Sonnet 4.5.

Especificaciones rápidas

FamiliaGeneración Claude 4
ModalidadesTexto, visión, código
IdiomasInglés primero, multilingüe
Caché de promptsSoportado (Anthropic)
Ventana de contexto200K tokens
Salida máximaHasta 64K tokens
Ideal paraFlujos de alto volumen / sensibles a latencia

Benchmarks de Claude Haiku 4.5

Cifras reportadas por el proveedor de los materiales de lanzamiento de Haiku 4.5 de Anthropic. Nota que OpenAI señaló contaminación de datos de entrenamiento en SWE-bench Verified en todos los modelos frontera. Trata las cifras absolutas con precaución, pero el orden relativo es robusto.

SWE-bench Verifiedreportado por el proveedor, promedio de 50 intentos
73,3%
SWE-bench Proterceros (Scale AI)
39,5%
OSWorld (uso de computadora)reportado por el proveedor
50,7%
Velocidadreportado por el proveedor
~97 tokens/seg

Precios de Claude Haiku 4.5

Precio de lista del proveedor, por 1M de tokens.

Input$1.00
Output$5.00
Lectura de caché$0.10
Escritura de caché$1.25

Cómo se comporta Claude Haiku 4.5 en la práctica

Comportamiento observado en ejecuciones de agentes en producción.

Velocidad

El modelo más rápido del catálogo Built-in a ~97 tokens/seg. La latencia de respuesta es lo suficientemente corta para agentes interactivos de Slack.

Precisión de enrutamiento

Suficientemente buena para flujos de una sola herramienta; el enrutamiento multi-herramienta está significativamente por detrás de Sonnet 4.6 en casos límite. Mantén los esquemas de herramientas ajustados.

Razonamiento

Se mantiene en tareas cortas; pierde el hilo en bucles largos de múltiples pasos. Úsalo como trabajador, no como planificador.

Costo

El costo más bajo en la familia Claude en VM0. El caché de prompts lo convierte en la opción Anthropic práctica más barata para prompts repetidos.

Mejores tareas para Claude Haiku 4.5

El agente de triaje de Slack que se siente instantáneo

Lee cada mensaje entrante, lo clasifica ("reporte de bug", "oportunidad de venta", "solicitud de reunión"), lo enruta al canal correcto y publica un acuse de recibo en menos de dos segundos. A la velocidad de Sonnet, el mismo flujo se sentiría lento; a los ~97 tokens por segundo de Haiku, se siente como si el bot estuviera realmente prestando atención en tiempo real.

El sub-agente bajo un planificador Sonnet u Opus

Sonnet (u Opus) elige la estrategia y divide la solicitud en diez pasos concretos; Haiku ejecuta cada uno. "Extrae este campo del CRM, resume este correo, formatea esta lista" — ninguno de esos pasos necesita razonamiento de nivel insignia, y enrutarlos a Haiku en lugar de ejecutar todo el bucle en Sonnet reduce drásticamente el costo por conversación sin cambiar la calidad de salida.

El clasificador masivo que se ejecuta en cada registro

Etiqueta un millón de tickets, extrae los campos estructurados del backlog de correos del último trimestre, enruta un flujo de formularios entrantes. El bajo costo por token de Haiku más el caché de prompts en el prompt de sistema (estable) significa que el costo unitario por registro es esencialmente insignificante en el presupuesto, lo que hace que los flujos de trabajo de "clasificar todo" sean realmente viables.

La micro-tarea de visión que necesita ser rápida

OCR de una captura de pantalla, identificar qué tipo de gráfico es, extraer un número de una imagen de recibo. Haiku 4.5 es multimodal y muy rápido, lo que significa que un agente de UI que toma una captura de pantalla cada pocos segundos y pregunta "¿qué acaba de cambiar?" se mantiene receptivo en lugar de tartamudear.

Cuándo evitar Claude Haiku 4.5

Evita Haiku 4.5 en bucles de agente largos de múltiples pasos donde pierde instrucciones después de varios turnos, y en razonamiento difícil o ediciones de código donde Sonnet 4.6 u Opus 4.7 es la opción correcta.

Claude Haiku 4.5 vs otros modelos

Claude Haiku 4.5 vs Claude Sonnet 4.6

Sonnet (×1) es el predeterminado para agentes completos. Haiku (×0,3) es la opción correcta cuando la velocidad y el costo importan más que la coherencia en bucles largos. Típicamente como trabajador bajo un planificador Sonnet/Opus. Los benchmarks del proveedor sitúan a Haiku a ~4 puntos de Sonnet 4.5 en SWE-bench Verified.

Claude Haiku 4.5 vs DeepSeek V4 Flash

DeepSeek V4 Flash (×0,02) es mucho más barato pero con uso de herramientas más débil y menos fiable en bucles de múltiples pasos. Usa Flash para trabajo masivo de un solo paso; usa Haiku para respuestas cortas interactivas estilo Slack.

Claude Haiku 4.5 vs MiniMax M2.7

MiniMax M2.7 (×0,1) es más barato y más fuerte en tareas multilingües. Haiku 4.5 lidera en fiabilidad de enrutamiento de herramientas en inglés y es multimodal.

Conclusión: ¿deberías usar Claude Haiku 4.5?

El Claude que pones bajo carga pesada. Triaje, clasificación, sub-agente bajo un orquestador Sonnet/Opus — sí. Rol de planificador — no, ese es el trabajo de Sonnet.

Preguntas frecuentes

¿Es Haiku 4.5 multimodal?

Sí. Haiku 4.5 acepta entradas de imagen junto con texto y código, por lo que los agentes impulsados por visión funcionan de forma nativa.

¿Qué tan rápido es Haiku 4.5?

Anthropic reporta ~97 tokens por segundo. 4 a 5 veces más rápido que Sonnet 4.5. El modelo más rápido en nuestro catálogo Built-in.

¿Cuándo debería elegir Haiku sobre Sonnet?

Elige Haiku cuando (a) el bucle de agente es corto, usualmente menos de 5 turnos, (b) la latencia importa más que la profundidad de razonamiento, o (c) necesitas un sub-agente barato bajo un orquestador Sonnet/Opus.

¿Puede Haiku ejecutar agentes multi-herramienta?

Puede, pero la precisión disminuye en casos límite comparado con Sonnet 4.6. Mantén la superficie de herramientas reducida y el bucle corto, o recurre a Sonnet.

¿Cuál es la puntuación SWE-bench de Haiku 4.5?

Anthropic reporta 73,3% en SWE-bench Verified. A ~4 puntos de Sonnet 4.5 a un tercio del costo. En el más difícil SWE-bench Pro obtiene 39,5% (Scale AI).

Alternativas

Usar Claude Haiku 4.5 en VM0

Dos formas de acceder a Claude Haiku 4.5 en VM0

VM0 admite Claude Haiku 4.5 como modelo Built-in facturado en créditos VM0, y mediante bring-your-own con una Anthropic API key. La ruta Built-in usa enrutamiento gestionado de VM0 y el multiplicador de créditos explicado abajo; la ruta bring-your-own te factura directamente con el proveedor upstream y omite la conversión de créditos VM0.

Recomendación de VM0

VM0 posiciona Claude Haiku 4.5 como una opción de ahorro en lugar de un modelo principal de agente. Úsalo para optimizar el coste unitario en trabajo no principal, como clasificación masiva, prefiltros, respuestas cortas con requisitos de latencia o agentes heredados fijos, manteniendo Claude Opus 4.7, Claude Opus 4.6 o Claude Sonnet 4.6 en los pasos que deciden la ejecución.

Créditos y el multiplicador ×0.3

Cada modelo Built-in en VM0 se valora como un múltiplo de Claude Sonnet 4.6, que establece la base de ×1 crédito. Claude Haiku 4.5 factura a ×0.3 créditos. El multiplicador es lo que aparece en tu factura de VM0; el precio de lista del proveedor en la tabla de arriba es lo que cobra el proveedor upstream antes de que VM0 lo convierta en créditos.

Claude Haiku 4.5 factura a ×0.3, lo que significa que un paso aquí cuesta solo 0.3× los créditos de un paso equivalente en Sonnet 4.6 (la base ×1). Esto lo sitúa muy por debajo de la base de créditos y lo convierte en la elección natural para trabajo en segundo plano de alto volumen donde el coste por paso importa más que la máxima calidad de razonamiento.

Disponible en VM0 desde Available since launch.