DeepSeek V4 Pro on VM0. コスト最適化された推論

DeepSeekのフラッグシップV4推論モデル。SWE-bench VerifiedでClaude Opus 4.6と0.2ポイント差、ベンダーコストは約7分の1。Claude互換API。

1M tokens · Text / Code · Prompt cache

DeepSeek V4 ProはDeepSeekのV4世代のフラッグシップ — MITライセンスのオープンウェイト1.6TパラメータMoEです。最大の特徴は価格品質比：ベンダー報告のSWE-bench Verifiedは80.6%で、Claude Opus 4.6と小数点以下の差、Anthropicのベンダーコストの約7分の1です。これにより、推論重視のエージェント（バルクPRレビュー、バッチ文書分析、定期要約）を高ボリュームで手頃に実行できます。

ベンダー価格は$1.74/$3.48/1Mトークン、キャッシュ読み取り$0.028/1M、キャッシュ書き込み無料（ラインアップで唯一）。1Mトークンコンテキスト、Anthropic互換API。プロダクションのツールルーティング信頼性が決定要因の場合はSonnet 4.6を、単発バルク作業の場合は12倍安いV4 Flashを選びましょう。

DeepSeek V4 Proとは？

2026年4月24日 · DeepSeek V4ファミリーの推論バリアント。コスト用のV4 Flashとペア。

DeepSeek V4 ProはDeepSeekのV4世代のフラッグシップで、2026年4月24日にMITライセンスでリリースされました。1.6T総パラメータ・49Bアクティブ/トークンのオープンウェイトMixture-of-Expertsモデルで、コスト重視の作業用にV4 Flash（284B/13Bアクティブ）とペアになっています。

両V4モデルは同一の機能セットを共有：1Mトークンコンテキストウィンドウ、384K最大出力、3つの推論努力モード（standard、think、think-max）、JSON出力、ツール呼び出し、非thinkモードでのFIM補完。Proモデルはハイブリッドアテンションアーキテクチャ（Compressed Sparse Attention + Heavily Compressed Attention）を追加し、長文コンテキスト効率を劇的に改善。1MコンテキストでDeepSeek V3.2と比較してシングルトークン推論FLOPの27%、KVキャッシュの10%。

DeepSeekは2025年を通じて、Anthropic級の推論を数分の一の価格で提供することで波紋を広げました。V4 Proはそのパターンを継承：ベンダー報告のSWE-bench Verified 80.6%はClaude Opus 4.6と0.2ポイント差、ベンダーコストは約7分の1。VM0ではDeepSeek APIキープロバイダーとVM0 Managedで×0.3で利用可能。Claude Haiku 4.5と同じマルチプライヤーですが、大幅に強力な推論動作を持ちます。

DeepSeek V4 Proの注目ポイント

アーキテクチャと機能の主な特徴。

V4 Proは1.6T総パラメータ・49Bアクティブ/トークンのMixture-of-Expertsモデルで、ハイブリッドアテンションスタック（Compressed Sparse Attention + Heavily Compressed Attention）を備え、長文コンテキスト推論を低コストに保ちます。1Mトークンのコンテキストウィンドウと384Kの最大出力、3つの推論努力モード（standard、think、think-max）をサポートし、安定した信号伝播のためにManifold-Constrained Hyper-Connectionsを使用しています。32T+トークンでMuonオプティマイザを使用して訓練され、MITライセンスでオープンウェイトが公開されています。

スペック概要

ファミリーDeepSeek V4シリーズ

パラメータ1.6T総/49Bアクティブ（MoE）

モダリティテキスト、コード

言語多言語

コンテキストウィンドウ1Mトークン

最大出力384Kトークン

ライセンスMIT（オープンウェイト）

VM0での利用開始2026年4月24日

DeepSeek V4 Proのベンチマーク

DeepSeekのV4 Proリリースからのベンダー報告スコア。独立したレビュー（Geeky Gadgets、Code Arena）ではV4 ProはCode ArenaでGLM-5.1とKimi K2.6に次ぐ3位。最も強いベンチマーク主張はDeepSeek自身の資料からです。絶対的真実ではなく方向性として扱ってください。

SWE-bench Verifiedベンダー報告；Opus 4.6と0.2pts差

80.6%

Terminal-Bench 2.0ベンダー報告；Opus 4.6をリード

67.9%

LiveCodeBenchベンダー報告

93.5%

Codeforcesレーティングベンダー報告

3206

MMLU-Proベンダー報告

GPT-5.4と同等

Artificial Analysis Intelligence Index最大努力

速度Artificial Analysis

約36トークン/秒

DeepSeek V4 Proの価格

プロバイダー定価、100万トークンあたり。

入力$1.74

出力$3.48

キャッシュ読み取り$0.14

キャッシュ書き込み課金対象外

DeepSeek V4 Proの実践的な挙動

本番エージェント実行で観測された動作。

推論

当社ラインアップで最強のサブSonnet推論。安価なモデルがドリフトし始めるマルチステップ作業で持ちこたえます。ベンダー報告のMMLU-ProはGPT-5.4と同等。

コーディングベンチマーク

ベンダー報告：SWE-bench Verified 80.6%（Opus 4.6と0.2差）、Terminal-Bench 2.0 67.9%（Opus 4.6をリード）、LiveCodeBench 93.5%。

コスト効率

際立った特性。Sonnet 4.6と十分競合する推論力を持ちながら×0.3のクレジットコストで、V4 Proはコスト最適化のデフォルトです。Claude Opus 4.7より約7倍安価。

キャッシュ経済性

キャッシュ書き込みが無料。VM0のBuilt-inモデルで唯一。安定したシステムプロンプトと大きな参照ドキュメントの貼り付けは、キャッシュに追加コストなしで保存され、読み取り側のみ課金されます。

速度

Artificial Analysisによると最大努力で約36トークン/秒。Haikuより遅く、Opus 4.6よりわずかに遅い。

DeepSeek V4 Proに最適なエージェントタスク

すべてのコミットで実行するPRレビューエージェント

Sonnet級の精度をSonnetの約3分の1のベンダーコストで実現することが、「大きなPRだけでなくすべてのコミットをレビューする」を実際に持続可能にします。V4 Proは差分、関連ファイル、リンクされたIssueを読み、構造化されたコメントを書きます — そして1コールあたりの価格は、すべてのプッシュでCIステップとして実行しても目立った費用項目にならないほど低いのです。

毎晩実行する定期要約エージェント

昨日の顧客会話、サポートチケット、または営業電話を取得してダイジェストを作成します。システムプロンプトとツールスキーマは実行間で変わらず、DeepSeekはキャッシュ書き込みに課金しません — 長い固定プレフィックスは一度だけ支払われ、キャッシュ読み取りは通常の入力の数分の一のコストです。ここがV4 Proの価格モデルが本当に手頃な範囲を変える場所です。

Opusより安いリポジトリ全体のコードエージェント

ハイブリッドアテンション（Compressed Sparse Attention + Heavily Compressed Attention）を備えた1Mトークンコンテキストにより、中規模のコードベースが1プロンプトに収まり、ウィンドウが埋まっても推論コストが管理可能です。クロスファイルリファクタリングやアーキテクチャレベルのレビューでは、「すべてを一度に見る」OpusスタイルのワークフローをOpusスタイルの請求書なしで実現できます。

DeepSeek V4 Proを避けるべきケース

Sonnet 4.6が依然リードする最も難しいツールルーティングのエッジケースではV4 Proをスキップし、推論が不要でV4 Flashが約12倍安いバルク単発作業でもスキップします。

DeepSeek V4 Pro vs 他のモデル

DeepSeek V4 Pro vs DeepSeek V4 Flash

同じベンダー、異なるポジショニング。V4 Pro（×0.3）は推論を提供し、V4 Flash（×0.02）は可能な限り安い単発モデルを提供します。ベンダー報告のSWE-bench VerifiedではFlashはProと1.6ポイント差（79.0 vs 80.6）。しかしTerminal-Bench（67.9 vs 56.9）ではマルチステップツール使用でProが引き離します。

DeepSeek V4 Pro vs Claude Sonnet 4.6

Sonnet 4.6（×1）はツールルーティングのエッジケースと英語推論で勝ります。V4 Pro（×0.3）はコストで勝り、コーディングベンチマーク（ベンダー報告）で競争力があります。コミットする前に実際のエージェントでA/Bテストする価値があります。

DeepSeek V4 Pro vs Kimi K2.6

同じマルチプライヤー（×0.3）。Kimiは長文コンテキスト再現率が強くIntelligence Indexが高い（54 vs 52）。V4 Proはキャッシュ経済性が優れ（書き込み無料）、1Mコンテキストウィンドウ（Kimiは256K）。どちらの特性がより重要かで選択します。

結論: DeepSeek V4 Proを使うべきか？

V4 Flashで事前フィルタリング、推論にはV4 Proにエスカレーション、V4 Proがツールルーティングのエッジケースで止まった場合のみSonnet 4.6にエスカレーション。

よくある質問

DeepSeek V4 Proはいつリリースされましたか？

DeepSeekは2026年4月24日にV4 ProとV4 FlashをMITライセンスで同時リリースし、オープンウェイトを公開しました。

なぜキャッシュ書き込みが無料なのですか？

DeepSeekはキャッシュ書き込み部分に課金しません。キャッシュ読み取りのみ$0.145/1Mトークンで課金されます。安定したシステムプロンプトと大きな参照コンテキストは、キャッシュに追加コストなしで保存されます。

V4 Proのコンテキストウィンドウは？

100万トークン、最大384Kトークンの出力。ハイブリッドアテンションアーキテクチャにより、V3.2よりはるかに低い推論コストでウィンドウ全体が使用可能です。

V4 ProはClaude Opus 4.6と比べてどうですか？

ベンダー報告のSWE-bench Verifiedは0.2ポイント差（80.6 vs 80.8）。Terminal-Bench 2.0はV4 Pro有利（67.9 vs 65.4）。Opus 4.6はHLE（40.0 vs 37.7）とHMMT 2026数学（96.2 vs 95.2）でリード。約7倍低いベンダーコストで、推論品質が基準だがコストが重要な場合、V4 Proが適切な選択です。

V4 Proはオープンソースですか？

はい。ウェイトはMITライセンスで公開されています。VM0のプロダクションパスはホストされたDeepSeek APIです。

代替モデル

DeepSeek V4 Flash

12倍安い、単発作業用

Claude Sonnet 4.6

難しいツールルーティングへのステップアップ

Kimi K2.6

同じ価格、より強力な長文コンテキスト再現率

VM0でDeepSeek V4 Proを使う

VM0でDeepSeek V4 Proにアクセスする2つの方法

VM0はDeepSeek V4 Proを、VM0クレジットで課金されるBuilt-inモデル、およびDeepSeek API keyを使用したBring-your-ownの2通りでサポートしています。Built-inパスではVM0 Managedルーティングと後述のクレジット倍率が適用され、Bring-your-ownパスでは上流プロバイダーに直接課金され、VM0クレジットへの変換は行われません。

VM0の推奨

VM0はDeepSeek V4 Proをコアエージェントモデルではなく、コスト削減オプションとして位置付けています。一括分類、プレフィルター、レイテンシが重要な短い返信、固定のレガシーエージェントなど、非コア作業の単価最適化に使用し、実行を左右するステップにはClaude Opus 4.7、Claude Opus 4.6、またはClaude Sonnet 4.6を維持します。

クレジットと×0.3倍率

VM0のすべてのBuilt-inモデルは、×1クレジット基準となるClaude Sonnet 4.6の倍数で価格設定されています。DeepSeek V4 Proは×0.3クレジットで課金されます。倍率はVM0の請求書に表示されるもので、上記の価格表のベンダー定価はVM0がクレジットに変換する前に上流プロバイダーが請求する金額です。

DeepSeek V4 Proは×0.3で課金されます。つまり、1ステップのコストはSonnet 4.6（×1基準）の同等ステップのわずか0.3倍です。これはクレジット基準を大きく下回り、ピーク時の推論品質よりもステップあたりのコストが重視される高ボリュームのバックグラウンドワークに自然な選択肢です。

VM0でApril 24, 2026から利用可能。