Alle Modelle

Claude Haiku 4.5 on VM0. Fast, cheap routing

Anthropics leichtes und schnelles Modell. Ideal für latenzkritische Agent-Schritte, Bulk-Klassifikation und kostensensitive Workloads.

200K tokens · Text / Vision / Code · Prompt cache

Claude Haiku 4.5 ist das leichteste und schnellste Modell in Anthropics Claude 4-Familie. Es wurde für Aufgaben entwickelt, bei denen Geschwindigkeit und Kosten wichtiger sind als Reasoning-Tiefe: Bulk-Klassifikation, Vorfilter, kurze Zusammenfassungen und latenzkritische Antworten.

Mit $1/$5 pro 1M Tokens und ×0,3 Credits auf VM0 ist es das günstigste Anthropic-Modell. Das 200K-Kontextfenster ist kleiner als bei Opus/Sonnet (1M), aber für die meisten Single-Shot-Aufgaben mehr als ausreichend.

Was ist Claude Haiku 4.5?

Verfügbar seit VM0-Launch · Leichtgewicht der Claude 4-Familie. Optimiert für Geschwindigkeit und Kosteneffizienz.

Claude Haiku 4.5 ist das Einstiegsmodell der Claude 4-Familie und teilt die multimodalen Fähigkeiten (Text, Bild, Code) mit Opus und Sonnet, jedoch mit einem kleineren 200K-Token-Kontextfenster und reduziertem Reasoning-Profil. Es ist das schnellste Claude-Modell, optimiert für Sub-Sekunden-Latenz bei einfachen Aufgaben.

Auf VM0 ist Haiku 4.5 als kostensparende Option positioniert (×0,3 Credits). Es ist nicht das empfohlene Standardmodell für Agent-Schritte, aber die richtige Wahl, wenn Stückkosten die Entscheidung dominieren — Bulk-Klassifikation, Vorfiltern, kurze Antworten und latenzkritische Chats.

Haiku 4.5 erreicht solide SWE-bench-Ergebnisse für seine Größe, aber seine Stärke liegt im Durchsatz und in der Kosteneffizienz, nicht in der Reasoning-Tiefe. Für die meisten Agent-Orchestrator-Rollen ist Sonnet 4.6 die bessere Wahl.

Das zeichnet Claude Haiku 4.5 aus

Architektur- und Funktionsmerkmale im Überblick.

Haiku 4.5 teilt die Claude 4-Multimodal-Architektur, jedoch mit reduziertem 200K-Kontext und ohne Adaptive-Thinking-Effort-Levels. Optimiert für minimale Time-to-First-Token und hohen Durchsatz bei einfachen Aufgaben.

Technische Daten auf einen Blick

FamilieClaude 4 Generation
ModalitätenText, Bild, Code
SprachenEnglisch-zentriert, mehrsprachig
Prompt CachingUnterstützt (Anthropic)
Kontextfenster200K Token
Max Output16K Token
Am besten fürHigh-Volume, latenzkritische Aufgaben

Claude Haiku 4.5 Benchmarks

Haiku 4.5 erreicht respektable Ergebnisse für ein Leichtgewicht-Modell, liegt aber erwartungsgemäß hinter Opus und Sonnet.

SWE-bench Verifiedvom Anbieter gemeldet
58,0%
SWE-bench Provom Anbieter gemeldet
28
OSWorld (Computer-Nutzung)vom Anbieter gemeldet
42,3%
GeschwindigkeitSchnellstes Claude-Modell
Sehr hoch

Claude Haiku 4.5 Preise

Listenpreis des Anbieters, pro 1 Mio. Tokens.

Input$1.00
Output$5.00
Cache Read$0.10
Cache Write$1.25

Wie sich Claude Haiku 4.5 in der Praxis verhält

Beobachtetes Verhalten aus produktiven Agent-Durchläufen.

Schnellstes Anthropic-Modell

Haiku 4.5 liefert die niedrigste Time-to-First-Token der Claude-Familie. Ideal für Chat-Oberflächen und latenzkritische Agenten.

Gut genug für einfache Aufgaben

Klassifikation, Sentiment-Analyse, kurze Zusammenfassungen und Übersetzungen führt Haiku 4.5 mit minimalem Qualitätsverlust gegenüber Sonnet aus — bei 3× niedrigeren Kosten.

Begrenzte Reasoning-Tiefe

Haiku 4.5 hat Schwierigkeiten bei mehrschrittigem Reasoning, komplexen Code-Änderungen und Aufgaben, die tiefes kontextuelles Verständnis erfordern. Für diese Aufgaben eskaliere an Sonnet oder Opus.

Beste Agent-Aufgaben für Claude Haiku 4.5

Bulk-Klassifikation und Vorfiltern

Triage eingehender Issues, klassifiziere Support-Tickets, filtere Spam — Haiku 4.5 verarbeitet Hunderte von Items zu minimalen Kosten.

Latenzkritische Chat-Antworten

Wenn dein Agent in Echtzeit-Chats antwortet und jede Millisekunde zählt, liefert Haiku die schnellsten Antworten.

Einfache Ein-Schritt-Aufgaben

Zusammenfassung eines Absatzes, Übersetzung einer Phrase, Formatierungskorrektur — Aufgaben, bei denen die Antwort offensichtlich ist.

Wann du Claude Haiku 4.5 überspringen solltest

Haiku 4.5 für komplexe mehrschrittige Agent-Arbeit zu verwenden. Wenn die Aufgabe Planung, Tool-Orchestrierung oder tiefes kontextuelles Reasoning erfordert, starte mit Sonnet 4.6. Haiku ist für einfache, latenzkritische Schritte gedacht.

Claude Haiku 4.5 vs andere Modelle

Claude Haiku 4.5 vs Claude Sonnet 4.6

Haiku 4.5 ist ~3× günstiger (×0,3 vs. ×1 Credits) und schneller, aber Sonnet 4.6 übertrifft es bei Reasoning-Tiefe und Tool-Use-Zuverlässigkeit. Verwende Haiku für einfache Single-Shot-Aufgaben, Sonnet für alles, was Planung erfordert.

Claude Haiku 4.5 vs DeepSeek V4 Flash

Beide sind kostengünstige Leichtgewicht-Modelle. V4 Flash (×0,02 Credits) ist noch günstiger mit 1M-Kontext; Haiku 4.5 bietet bessere Anthropic-Ökosystem-Integration und leicht bessere Reasoning-Qualität.

Claude Haiku 4.5 vs MiniMax M2.7

M2.7 ist günstiger (×0,1 vs. ×0,3 Credits), hat aber ein kleineres Kontextfenster und niedrigere Reasoning-Qualität. Haiku 4.5 ist die bessere Wahl, wenn minimale Qualität wichtig ist; M2.7, wenn Kosten das einzige Kriterium sind.

Fazit: Solltest du Claude Haiku 4.5 nutzen?

Haiku 4.5 ist die richtige Wahl für einfache, latenzkritische und kostensensitive Aufgaben. Es ist nicht das Modell für anspruchsvolle Agent-Arbeit, aber es ist das beste Anthropic-Modell für High-Volume-Workloads, bei denen Kosten und Geschwindigkeit Vorrang haben.

Häufig gestellte Fragen

Ist Haiku 4.5 multimodal?

Ja. Haiku 4.5 akzeptiert Text, Bilder und Code als Eingabe — dieselben Modalitäten wie Opus und Sonnet.

Wie schnell ist Haiku 4.5?

Es ist das schnellste Claude 4-Modell, mit der niedrigsten Time-to-First-Token und dem höchsten Durchsatz in der Familie.

Wann Haiku statt Sonnet wählen?

Wähle Haiku, wenn Kosten oder Latenz wichtiger sind als Reasoning-Tiefe: Bulk-Klassifikation, Vorfiltern, einfache Q&A, kurze Zusammenfassungen.

Kann Haiku Multi-Tool-Agenten ausführen?

Es kann, aber die Tool-Auswahl-Zuverlässigkeit ist niedriger als bei Sonnet oder Opus. Für Agenten mit mehr als 2–3 Tools ist Sonnet 4.6 sicherer.

Was ist Haiku 4.5s SWE-bench-Score?

58,0% auf SWE-bench Verified (vom Anbieter gemeldet). Respektabel für ein Leichtgewicht, aber signifikant hinter Opus (80,6%) und Sonnet (73,8%).

Alternativen

Claude Haiku 4.5 auf VM0 nutzen

Zwei Wege, um Claude Haiku 4.5 auf VM0 zu nutzen

VM0 unterstützt Claude Haiku 4.5 als Built-in-Modell, das in VM0-Credits abgerechnet wird, sowie über Bring-your-own mit einem Anthropic API key. Der Built-in-Weg nutzt VM0 Managed Routing und den unten erklärten Credit-Multiplikator; der Bring-your-own-Weg rechnet direkt mit dem Upstream-Anbieter ab und überspringt die VM0-Credit-Umrechnung.

VM0s Empfehlung

VM0 positioniert Claude Haiku 4.5 als kostensparende Option statt als Core-Agent-Modell. Nutze es zur Optimierung der Stückkosten bei Nicht-Kernarbeit wie Massenklassifikation, Vorfiltern, latenzkritischen Kurzantworten oder fest zugewiesenen Legacy-Agents, während Claude Opus 4.7, Claude Opus 4.6 oder Claude Sonnet 4.6 die entscheidenden Schritte übernehmen.

Credits und der ×0.3-Multiplikator

Jedes Built-in-Modell auf VM0 wird als Vielfaches von Claude Sonnet 4.6 bepreist, das die ×1-Credit-Basislinie bildet. Claude Haiku 4.5 wird mit ×0.3 Credits abgerechnet. Der Multiplikator erscheint auf deiner VM0-Rechnung; der Anbieter-Listenpreis in der obigen Preistabelle ist das, was der Upstream-Anbieter berechnet, bevor VM0 ihn in Credits umrechnet.

Claude Haiku 4.5 wird mit ×0.3 abgerechnet, d.h. ein Schritt kostet hier nur das 0.3-fache der Credits eines äquivalenten Schritts mit Sonnet 4.6 (der ×1-Basislinie). Damit liegt es deutlich unter der Credit-Basislinie und ist die natürliche Wahl für volumenstarke Hintergrundarbeit, bei der Kosten pro Schritt wichtiger sind als höchste Reasoning-Qualität.

Verfügbar auf VM0 seit Available since launch.