DeepSeek V4 Flash on VM0. 最も安いモデル
ラインアップ内で最も安いモデル。Sonnet 4.6の50分の1。その価格帯では驚くほど有能。ベンダー報告のSWE-bench VerifiedはV4 Proと1.6ポイント差。
1M tokens · Text / Code · Prompt cache
DeepSeek V4 FlashはV4世代のコストリーダーであり、ラインアップ内で絶対的な最低単価を実現するよう設計されています。プロンプトが作業の大部分を行う単発作業に優れています:100万件のチケットのタグ付け、メールバックログからの構造化フィールド抽出、レビューのスコアリング、強いモデルに回す前のレコードの事前フィルタリング。ベンダー報告のSWE-bench Verifiedは79.0%(V4 Proと1.6ポイント差)ですが、Terminal-Bench 2.0は11ポイント遅れています — ここがFlashが遅れを取る場所:長いマルチステップツールチェーンです。
ベンダー価格は$0.14/$0.28/1Mトークン、キャッシュ読み取り$0.028/1M、キャッシュ書き込み無料。Flashをプランナーロールに置かないでください。そのためにはV4 ProまたはSonnet 4.6を。コストが支配的な他のすべての場所では、競合するものはありません。
DeepSeek V4 Flashとは?
2026年4月24日 · DeepSeek V4ファミリーのコストリーダー。推論用のV4 Proとペア。
DeepSeek V4 FlashはDeepSeekのV4世代のコストリーダーで、2026年4月24日にV4 Proと共にリリースされました。V4 Proが推論向けに位置付けられているのに対し、Flashは絶対的な最低単価向けに位置付けられています。予算を気にせず非常に高いボリュームで実行できるモデルです。
Flashは284BパラメータのMoEで、トークンあたり13Bアクティブ(Proは1.6T/49B)。両方ともV4ファミリーの同一の機能セットを共有:1Mトークンコンテキスト、384K最大出力、3つの推論努力モード、JSON出力、ツール呼び出し。
VM0では×0.02のクレジットマルチプライヤー。Built-inカタログ全体で最低。これにより、バルク分類、タグ付け、抽出、事前フィルタワークロードのデフォルトとなります — プロンプトが作業の大部分を行い、モデルは指示に確実に従うだけでよいケースです。V4ファミリーの無料キャッシュ書き込み経済性を共有:キャッシュ読み取りのみ課金されます。
DeepSeek V4 Flashの注目ポイント
アーキテクチャと機能の主な特徴。
V4 Flashは284B総パラメータ・13Bアクティブ/トークンのMixture-of-Expertsモデルで、1Mトークンのコンテキストウィンドウと384Kの最大出力を備えています。3つの推論努力モード(standard、think、think-max)を公開し、キャッシュ読み取りのみ課金(キャッシュ書き込みは無料)、MITライセンスでオープンウェイトが公開されています。
スペック概要
DeepSeek V4 Flashのベンチマーク
DeepSeekのV4リリースからのベンダー報告スコア。Flashは単純なベンチマークではProと同等ですが、マルチステップツール使用(Terminal-Bench)と事実再現率(SimpleQA)では差をつけられます。小型MoEから期待される通りの結果です。
DeepSeek V4 Flashの価格
プロバイダー定価、100万トークンあたり。
DeepSeek V4 Flashの実践的な挙動
本番エージェント実行で観測された動作。
コスト
Built-inラインアップで断然最低のコスト。単価が決定を支配する場合の適切な選択です。
単発精度
プロンプトが明示的でタスクが1〜2ターンに収まる場合に良好。多くのステップにわたって計画、分岐、記憶するよう求められると著しく低下します。
マルチステップツール使用
ベンダー報告のTerminal-Bench 2.0は56.9%(V4 Proの67.9%と比較)。複雑なマルチステップツールフローでは有意に劣ります。V4 Flashをプランナーロールに置かないでください。
コンテキストウィンドウ
1Mトークン。V4 Proと同じで、Anthropic Haiku(200K)よりはるかに大きい。
DeepSeek V4 Flashに最適なエージェントタスク
すべてのレコードでひるまずに実行する分類器
100万件のチケットをカテゴリ別にタグ付け、受信フォームを適切なチームにルーティング、重要な次元ですべてのレビューをスコアリング。Flashのレコードあたりコストはセントの数分の一であり、「到着するすべてを分類する」ワークフローをサンプルに絞られることなく実際に持続可能にします。
より強力なモデルの前段事前フィルタ
まずすべてのレコードでV4 Flashを実行し、上位5%(またはFlashが確信を持てないケース)をV4 ProまたはSonnet 4.6にルーティングします。2段階パイプラインはほぼ常に総コストで単一モデルパイプラインを上回ります — Flashが簡単な95%を処理し、強力なモデルは難しい5%だけを見て、請求額は総量ではなく推論ニーズに比例します。
どこからでも構造化データを引き出すバルク抽出ジョブ
メールバックログ、PDF、会議トランスクリプト、スキャンされた請求書 — 同じJSON形状を要求する固定システムプロンプトがあるすべての場所。Flashはキャッシュ読み取りに課金しますがキャッシュ書き込みには課金しないため、出力スキーマを定義する長い固定プレフィックスは一度支払われ、バッチ全体で償却され、ドキュメントあたりの限界コストをほぼゼロに近づけます。
長文ワンショットQ&A
本全体、200ページの契約書、またはコードベースを1Mトークンのコンテキストウィンドウに投入し、単一の的を絞った質問をします。Flashは1コールあたりセントの数分の一でワンショット回答し、大規模に長文書にわたって「この文書はXに言及しているか?」に答えるのに十分な速さです。これはエージェントループが真に役に立たないワークフローの1つです。
DeepSeek V4 Flashを避けるべきケース
長いツールチェーンでドリフトするマルチステップエージェントループではV4 Flashをスキップし、難しい推論、コード編集、プランナーロールではV4 ProまたはSonnet 4.6が適切な選択です。
DeepSeek V4 Flash vs 他のモデル
DeepSeek V4 Flash vs DeepSeek V4 Pro
同じベンダー。V4 Pro(×0.3)が推論を行い、V4 Flash(×0.02)がボリュームを処理します。古典的な分割:Flashが事前フィルタ、Proがエスカレーター。ベンダー報告のSWE-bench Verifiedは1.6ポイント差(79.0 vs 80.6)。Terminal-Bench 2.0はProが11ポイント有利(67.9 vs 56.9)。
DeepSeek V4 Flash vs Claude Haiku 4.5
Haiku 4.5(×0.3)はマルチツールルーティングでより信頼性が高く、インタラクティブフローでより高速です。V4 Flash(×0.02)は生のコストとコンテキストサイズで勝ります。バッチジョブにはFlashを、インタラクティブなSlackスタイルの返信にはHaikuを選びましょう。
DeepSeek V4 Flash vs MiniMax M2.7
M2.7(×0.1)は多言語推論が強く、長い思考のための50分タイムアウトがあります。V4 Flash(×0.02)は単発作業でより高速かつはるかに安価です。
結論: DeepSeek V4 Flashを使うべきか?
カタログ内で最も安いモデル。バルクタグ付け、抽出、事前フィルタリングに適切。プランナーロールや長いエージェントループには不適切。
よくある質問
DeepSeek V4 Flashはいつリリースされましたか?
DeepSeekは2026年4月24日にV4 FlashとV4 ProをMITライセンスで同時リリースし、オープンウェイトを公開しました。
エージェント全体をV4 Flashで実行すべきですか?
おそらく違います。Flashは単発タスクに優れていますが、長いマルチステップループではドリフトします(ベンダー報告のTerminal-Bench 2.0はV4 Proより11ポイント低い)。標準パターンは事前フィルタとして使用し、難しいケースをV4 ProまたはSonnet 4.6にエスカレーションすることです。
キャッシュ書き込みは本当に無料ですか?
はい。DeepSeekはキャッシュ書き込み部分に課金しません。キャッシュ読み取りのみ$0.028/1Mトークンで課金されます。
V4 Flashはオープンソースですか?
はい。ウェイトはMITライセンスで公開されています(284B総/13BアクティブMoE)。VM0のプロダクションパスはホストされたDeepSeek APIです。
V4 Flashのコンテキストウィンドウは?
100万トークン。V4 Proと同一。最も安い価格帯でも長文書のワンショットQ&Aに有用です。
代替モデル
VM0でDeepSeek V4 Flashを使う
VM0でDeepSeek V4 Flashにアクセスする2つの方法
VM0はDeepSeek V4 Flashを、VM0クレジットで課金されるBuilt-inモデル、およびDeepSeek API keyを使用したBring-your-ownの2通りでサポートしています。Built-inパスではVM0 Managedルーティングと後述のクレジット倍率が適用され、Bring-your-ownパスでは上流プロバイダーに直接課金され、VM0クレジットへの変換は行われません。
VM0の推奨
VM0はDeepSeek V4 Flashをコアエージェントモデルではなく、コスト削減オプションとして位置付けています。一括分類、プレフィルター、レイテンシが重要な短い返信、固定のレガシーエージェントなど、非コア作業の単価最適化に使用し、実行を左右するステップにはClaude Opus 4.7、Claude Opus 4.6、またはClaude Sonnet 4.6を維持します。
クレジットと×0.02倍率
VM0のすべてのBuilt-inモデルは、×1クレジット基準となるClaude Sonnet 4.6の倍数で価格設定されています。DeepSeek V4 Flashは×0.02クレジットで課金されます。倍率はVM0の請求書に表示されるもので、上記の価格表のベンダー定価はVM0がクレジットに変換する前に上流プロバイダーが請求する金額です。
DeepSeek V4 Flashは×0.02で課金されます。つまり、1ステップのコストはSonnet 4.6(×1基準)の同等ステップのわずか0.02倍です。これはBuilt-inカタログで最も安価なティアであり、単価が意思決定を左右し、ワークロードが主に単発である場合の明確な選択肢です。
VM0でApril 24, 2026から利用可能。