blog

DeepSeek V4とは?現行主力モデルの仕様・料金・導入判断【2026年版】

DeepSeek V4とは?現行主力モデルの仕様・料金・導入判断【2026年版】

DeepSeek V4の正確な位置づけ――2026年6月時点の現行主力

2026年4月24日、DeepSeekは新世代モデルシリーズ「DeepSeek V4」を正式リリースした。現行の主力はDeepSeek-V4-Pro(旗艦)とDeepSeek-V4-Flash(軽量・低コスト)の2モデルであり、2025年に広く話題となったV3系やR1はすでに旧世代に位置づけられる。導入判断においてモデルの世代を正確に把握することは、API移行コストやロードマップへの備えに直結するため、まずここを押さえておきたい。

旗艦のDeepSeek-V4-Proは総1.6兆パラメータのMoE(Mixture of Experts)構造を採用し、推論時のアクティブパラメータは約49Bに抑制されている。最大コンテキスト長1Mトークン・最大出力384Kトークンに対応し、推論(thinking)モードも搭載する。API名はdeepseek-v4-pro

DeepSeek-V4-Flashは総284B・アクティブ約13BのMoE構成で、同じく1Mトークンのコンテキストと384Kの出力に対応する。thinkingとnon-thinkingの両モードを備え、消費者向けチャット(chat.deepseek.com)の既定モデルでもある。API名はdeepseek-v4-flash。両モデルともMITライセンスのオープンウェイトとしてHugging FaceおよびGitHubで公開されている。

なお、旧API名のdeepseek-chatおよびdeepseek-reasonerは2026年7月24日(15:59 UTC)に廃止予定であり、現在は経過措置としてV4-Flashのnon-thinking/thinkingモードにそれぞれマッピングされている。新規導入では必ず新しいAPI名を使用すること(出典:DeepSeek API公式 Change Log、2026-06-08アクセス)。

DeepSeekの基本概要については DeepSeekとは を参照されたい。

V22024-05236B MoEV32024-12671B MoEV3.1 / V3.22025-08 / 12ハイブリッド推論V4-Flash(現行)2026-04-24284B / 活性13B / 1MコンテキストV4-Pro(旗艦)2026-04-241.6T / 活性49B / 1Mコンテキスト▲ DeepSeek Vシリーズの系譜(2026年6月時点、公式情報に基づく)
DeepSeek Vシリーズの系譜。2026年4月24日リリースのV4-ProおよびV4-Flashが現行主力。出典:DeepSeek API公式 Change Log

世代ごとの主要スペックを整理すると以下のとおりだ。

モデル リリース 総パラメータ アクティブ 最大コンテキスト 位置づけ
DeepSeek-V2 2024-05 236B 21B 128K 旧世代
DeepSeek-V3 2024-12 671B 37B 128K 旧世代
DeepSeek-V3.1 2025-08 非公表 非公表 旧世代
DeepSeek-V3.2 2025-12 非公表 非公表 旧世代(V3系最終)
DeepSeek-V4-Flash 2026-04-24 284B 約13B 1M 現行・軽量主力
DeepSeek-V4-Pro 2026-04-24 1.6T 約49B 1M 現行・旗艦

出典:DeepSeek API公式 Change LogDeepSeek-V4-Pro(Hugging Face)(いずれも2026-06-08アクセス)

DeepSeek V4を支える中核アーキテクチャ――費用対効果の技術的根拠

「なぜこのモデルがこのコストでこの性能を出せるのか」を理解することは、将来の依存リスク評価にも役立つ。V4世代の性能・コスト効率を支える技術的な柱を三点に絞って整理する。

Mixture of Experts(MoE)――計算効率の源泉

DeepSeekはV2以降、MoEアーキテクチャを一貫して採用している。MoEは入力トークンごとにルーターが最適な「エキスパート(専門ネットワーク)」を選択する仕組みで、全パラメータを一度に使わず一部のみを活性化する。V4-Proでは総1.6兆パラメータのうち推論時のアクティブは約49B相当に留まり、V4-Flashでは総284Bに対してアクティブ約13Bという高い効率を実現している。この構造が、プロプライエタリモデルに匹敵する性能をはるかに低い推論コストで達成する直接的な根拠だ。

Multi-head Latent Attention(MLA)――1Mトークンコンテキストの実用化

通常のトランスフォーマーではKV(Key-Value)キャッシュがシーケンス長に比例してVRAMを消費し、長文処理のボトルネックになる。MLAはKey・Valueを低ランク空間に圧縮することでキャッシュ量を抑制し、1Mトークンという大規模なコンテキストウィンドウを現実的なインフラコストで運用可能にしている。法的文書・技術仕様書・長大なコードベースを一括処理する業務ユースケースへの対応力は、この技術なしには成立しない。

Multi-Token Prediction(MTP)――出力スループットの向上

標準的なLLMは1推論ステップで1トークンを生成する。MTPは1ステップで複数トークンを並列予測する手法で、同一の計算資源でより高いスループットを実現する。バッチ処理や応答速度がコスト・UXに影響するプロダクション環境では、MTPによる生成効率の向上が運用コストの抑制に寄与する。

入力トークン(プロンプト)ルーター(専門家を選択)共有エキスパート(全トークンに常時適用)ルーティングエキスパート(一部のみ選択・活性化)出力統合(応答生成)▲ MoEの処理フロー:全パラメータのごく一部のみを活性化することで高効率な推論を実現
MoEアーキテクチャの処理フロー。ルーターが各トークンに最適なエキスパート群のみを選択し、全パラメータの一部だけを活性化することで高い計算効率を実現する。

DeepSeek V4のAPI料金と稟議に必要なコスト試算

経営・導入判断において最も直接的な指標がAPI料金だ。以下はDeepSeek公式料金ページ(DeepSeek API Docs — Pricing、2026-06-08アクセス)に基づく従量課金の現行価格(USD/100万トークン)である。

モデル 入力(キャッシュヒット) 入力(キャッシュミス) 出力 備考
deepseek-v4-flash $0.0028 $0.14 $0.28 現行軽量主力・チャット既定
deepseek-v4-pro(プロモ価格) $0.003625 $0.435 $0.87 75%割引中。終了後は↓
deepseek-v4-pro(標準価格) $1.74 $3.48 プロモ終了後の正規価格

deepseek-v4-proの$0.435(入力)・$0.87(出力)は75%割引のプロモーション価格であり、割引終了後は入力$1.74・出力$3.48の標準価格が適用される。稟議・予算計画では標準価格を基準とした試算を行うことを強く推奨する。プロモ価格を恒久的なコストとして計画した場合、割引終了時にTCOが大きく乖離するリスクがある。

消費者向けチャット(chat.deepseek.com)は完全無料で利用でき、個人向けの有料サブスクリプション(Plus/Pro等)は存在しない。課金はAPIの従量制のみである(出典:DeepSeek API公式料金ページ、2026-06-08アクセス)。無料チャットの活用範囲については DeepSeek 無料版 を参照されたい。料金体系の詳細と他社比較は DeepSeek 料金 で包括的に扱っている。

DeepSeek V4の推論・数学処理能力を示すイメージ:数式とテキストが融合したデジタル空間の可視化
DeepSeek V4の推論・数学処理能力を示すイメージ

DeepSeek V4導入時の主要リスクと対策

性能・コストの優位性を認めたうえで、導入前に意思決定者が把握すべきリスクを整理する。いずれも軽視すると稟議通過後に問題が顕在化しやすい論点だ。

データプライバシーと法規制リスク

DeepSeekは中国企業(深度求索)が開発・運営するサービスである。公式APIを利用する場合、入力データはDeepSeekのサーバーに送信される。機密情報・個人情報・顧客データを含むプロンプトの送信は、日本の個人情報保護法や欧州GDPRの観点から問題を招く可能性がある。総務省の生成AIセキュリティに関する資料でも、クラウドAIサービス利用時のデータ流通経路の把握と契約上の確認が重要とされている(出典:AWSの生成AIサービスとセキュリティ対策・総務省)。金融・医療・行政領域での利用検討時は、組織の情報セキュリティポリシーと所管規制を事前に確認することが必須だ。

機密性の高いタスクへの対応策として、オープンウェイト版を自社インフラ上にデプロイするローカル運用が選択肢となる。V4-ProおよびV4-FlashはMITライセンスでHugging Faceに公開されており、十分なGPUリソースがある環境であれば自社クラウドやオンプレミスへの展開が技術的に可能だ。弊社クリスタルメソッド株式会社が開発するDeepAI(バーチャルヒューマン・AIアバターソリューション)においても、対話AIの基盤選定にあたってはデータの流通経路を設計段階から定義することを前提としている。

セキュリティリスクの詳細な評価については DeepSeek リスク を参照されたい。

API可用性と「Server Busy」問題

無料チャットおよびAPIは混雑時にフェアユースのスロットリングが適用され、「Server Busy」状態になる場合がある。プロダクション環境でのSLA(稼働率保証)が必要な用途では、OpenRouterやTogether AI等のサードパーティLLMルーター経由でのアクセス分散、またはフォールバック先モデルの設定をあらかじめ設計に組み込む必要がある。

コンテンツフィルタリングの特性

DeepSeekは中国の政治・歴史に関するトピック等、特定の話題において他社モデルと異なる応答パターンを示すことがある。ユーザー向けサービスへの組み込みを検討する場合は、想定されるクエリパターンを網羅した事前テストを実施し、出力の一貫性を確認することが不可欠だ。

ハルシネーションへの運用対応

高精度なモデルであってもハルシネーションのリスクはゼロではない。大規模言語モデルの特性として、訓練データのカットオフ以降の情報や固有名詞・数値の正確性は保証されない点は文化庁の言語資源に関する資料でも指摘されている(出典:大規模言語モデルと言語資源・文化庁)。AIによる出力を最終意思決定に直接用いる業務フローは避け、必ず一次情報での確認を組み込んだ運用ルールを設計することを推奨する。

DeepSeek V4のAPI実装――導入担当者向け実装要点

DeepSeekはOpenAI ChatCompletions互換のAPIインターフェースを提供しており、既存のOpenAI SDK資産をほぼそのまま流用できる。baseURLをDeepSeekのエンドポイントに差し替え、APIキー(platform.deepseek.com で取得)を設定するだけで動作する。

// Node.js / OpenAI SDK v4 でのDeepSeek V4利用例
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'YOUR_DEEPSEEK_API_KEY',
  baseURL: 'https://api.deepseek.com'
});

const response = await client.chat.completions.create({
  model: 'deepseek-v4-flash',  // 軽量主力。旗艦はdeepseek-v4-pro
  messages: [{ role: 'user', content: 'こんにちは' }]
});

実装上の注意点を二点挙げる。第一に、旧API名(deepseek-chat / deepseek-reasoner)は2026年7月24日廃止予定のため、新規実装ではdeepseek-v4-flashまたはdeepseek-v4-proを使用すること。第二に、deepseek-v4-proを本番投入する場合は、プロモ価格($0.87/M出力トークン)終了後の標準価格($3.48/M出力トークン)への切り替わりを考慮した予算設計が必要だ(出典:DeepSeek API公式料金ページ)。

APIの詳細な実装ガイドは DeepSeek API で解説している。V4-Proの旗艦としての推論能力をR1と比較したい場合は DeepSeek R1 も参照されたい。日本語処理の品質評価については DeepSeek 日本語対応 に詳しい。他社主要モデルとの性能・料金比較は DeepSeek 比較 を参照されたい。

DeepSeek V4を活用したコード生成ワークフローのイメージ:実務環境でのPythonコード生成とレビュープロセス
DeepSeek V4を活用したコード生成ワークフローのイメージ

DeepSeek V4の導入判断――用途別の適合評価

性能・コスト・リスクを総合すると、DeepSeek V4が最も高い費用対効果をもたらすのは以下の条件に当てはまる用途だ。

適合度 用途・条件 推奨モデル
コード生成・レビュー・リファクタリング(機密情報を含まない) V4-Flash / V4-Pro
100ページ超の長文ドキュメント要約・Q&A(技術仕様書・契約書等) V4-Flash / V4-Pro
数学・統計・データ分析パイプラインの設計補助 V4-Pro
ビジネス文書の翻訳・分類・定型的な日本語タスク V4-Flash
自社インフラ上でのローカルデプロイ(データを外部送信しない要件) V4-Flash(量子化)
要確認 金融・医療・行政の機密データをAPIに送信するユースケース 規制・ポリシー確認必須
感情的ニュアンス・文化的文脈を重視するクリエイティブ日本語生成 他モデルとの比較検討を推奨

コストを優先しつつフロンティア級の性能が必要な開発・分析用途には、deepseek-v4-flashが最初の検討候補となる。精度最優先で推論モードも活用したい用途はdeepseek-v4-proを選択しつつ、プロモ価格終了後の標準料金(入力$1.74・出力$3.48/Mトークン)を織り込んだTCOを算定することが現実的な稟議対応となる。

なお、弊社クリスタルメソッド株式会社が開発するDeepAIは、実在人物の容姿・表情・声・振る舞いをデジタル空間で再現するバーチャルヒューマン/AIアバターソリューションであり、接客・研修・面接練習・広報などの用途で活用されている。対話AIの基盤としてDeepSeekを含む複数のLLMの特性評価を継続的に行っており、用途とデータ取り扱い要件に応じたモデル選定の重要性を実感している。ソリューションの詳細に関心がある場合は ブログ一覧 からご覧いただきたい。


参考文献

監修

河合 継(クリスタルメソッド株式会社 代表取締役)

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について編集方針

AIブログ購読

 
クリスタルメソッドがお届けする
AIブログの更新通知を受け取る

Study about AI

AIについて学ぶ

  • 生成AIオンプレミス導入と規制リスク——Anthropic輸出規制が示す自社インフラ回帰の必然

    生成AIオンプレミス導入と規制リスク——Anthropic輸出規制が示す自社インフラ回帰の必然

    Anthropicの輸出規制命令——生成AIオンプレミス導入が「規制リスク対策」に変わった瞬間 2026年6月、米国政府はAnthropicに対し、新モデル「M...

  • EU AI規制 企業対応の実務——ENISAとAnthropicの協議が示す日本企業への含意

    EU AI規制 企業対応の実務——ENISAとAnthropicの協議が示す日本企業への含意

    ENISAがAnthropicと直接協議——EU AI規制の監視が生成AIへ本格移行 欧州サイバーセキュリティ機関ENISA(European Union Ag...

  • Claude障害が招く業務影響と対策——AI依存リスクの経営管理指針

    Claude障害が招く業務影響と対策——AI依存リスクの経営管理指針

    Claude障害の実態:2026年6月インシデントが示すもの 2026年6月18日、AnthropicのAIチャットボット「Claude」(claude.ai)...

View more