blog

DeepSeekとは?使い方・仕組み・技術的特徴をやさしく解説【2026年版】

監修

河合 継(クリスタルメソッド株式会社 代表取締役)

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について編集方針

本ページは「DeepSeekとは何か」——開発元や成り立ち、MoEなどの仕組み、安く高性能を実現できた理由といった基礎理解に特化して解説します。ChatGPT・Gemini・Claudeなど他モデルとの性能・コスト・安全性の比較や、用途別の選び方を知りたい方は、全体像をまとめたDeepSeekを徹底比較|ChatGPT・Gemini・Claudeとの違いもあわせてご覧ください。

目次

DeepSeekとは?中国発AIが世界を驚かせた理由と全貌

DeepSeek(ディープシーク)は、2023年に中国の量子ファンド系企業が設立したAI研究機関が開発した大規模言語モデル(LLM)シリーズです。2025年初頭に公開された「DeepSeek-R1」が数学・推論性能で世界に衝撃を与えたのに続き、2026年4月には長文脈推論・コーディング・エージェント用途に対応した「DeepSeek-V4」シリーズが現行のフラッグシップとして登場しています。米国の半導体輸出規制という逆境のもとで生まれたこれらのモデルは、なぜここまで注目を集めたのか。本記事ではDeepSeekの基本情報から技術的な特徴、使い方、安全性に至るまで、必要な情報をすべて網羅的に解説します。

DeepSeekの基本情報:どこが作った何者なのか

DeepSeekを理解するうえでまず押さえるべきは、その出自と組織の背景です。

設立の経緯と親会社

DeepSeekは幻方科技(High-Flyer Quant)という中国の量子ファンド(アルゴリズム取引専門の資産運用会社)を母体に、2023年に独立したAI研究部門として設立されました。High-Flyerは中国随一のクオンツ運用会社であり、大量の計算資源と高度な数理能力を持つ組織です。創業者の梁文鋒(Liang Wenfeng)は、AIへの先行投資として研究部門を切り出す形でDeepSeekを立ち上げました。

特筆すべきは、DeepSeekが商業利益を最優先とせず、基礎研究と技術公開(オープンウェイト)にフォーカスしている点です。開発したモデルの重みをHugging Faceなどで無償公開するというスタンスは、研究機関に近い姿勢であり、スタートアップとしては異例です。

本社所在地と規模

本社は中国・杭州に置かれています。従業員数は公開情報が限られていますが、研究者を中心とした数百人規模の組織とされており、Meta(数千人規模のAI部門)やOpenAIと比較しても小規模です。その小さなチームで世界トップレベルのモデルを生み出し続けていることが、業界に大きな衝撃を与え続けている理由の一つです。

DeepSeekのモデル系譜:V1からV4まで

DeepSeekはリリースのたびに性能と効率性を大きく向上させてきました。以下に主要モデルの変遷を整理します。

モデル名 公開時期 パラメータ規模 主な特徴
DeepSeek-V1 (67B) 2023年末 670億 コードと数学に特化した初期モデル。Llama-2を超える性能を一部ベンチマークで実証
DeepSeek-Coder 2024年初頭 1.3B〜33B コーディング特化。HumanEvalなどで当時最高水準を達成
DeepSeek-V2 2024年5月 236B(MoE) MoEアーキテクチャ採用。推論コストを大幅削減しながら高性能を維持
DeepSeek-V3 2024年12月 671B(MoE) GPT-4oに匹敵する総合性能。学習コスト約557万ドルと報告され業界を驚かせる
DeepSeek-R1 2025年1月 671B(MoE) 強化学習による推論特化。数学・コーディング・論理でOpenAI o1と同等以上の性能。引き続き高評価
DeepSeek-R1(蒸留版) 2025年1月 1.5B〜70B 小型モデルへの知識蒸留。7Bや14Bでも高い推論能力を実現
DeepSeek-V3.1 2025年8月 671B(MoE) ハイブリッド推論アーキテクチャを導入したV3系の中間世代
DeepSeek-V3.2 2025年12月 671B(MoE) V3系の最終世代。V4系への橋渡しとなった改良版
DeepSeek-V4-Pro 2026年4月 総1.6T(活性49B、MoE) 現行フラッグシップ。1Mトークン長文脈・最大384K出力・推論(thinking)モード対応。長文脈推論・コーディング・エージェント用途に対応
DeepSeek-V4-Flash 2026年4月 総284B(活性13B、MoE) 現行の低コスト・高速主力。1Mトークン長文脈・最大384K出力。thinking/non-thinking両モード対応。消費者向けチャットの既定モデル

DeepSeekの核心技術:なぜ「安く・賢く」作れたのか

DeepSeekの最大の驚きは性能そのものよりも、圧倒的なコスト効率です。その背景には複数の技術的革新が組み合わさっています。

MoEアーキテクチャ(Mixture of Experts)

DeepSeek-V2以降のモデルはすべてMoE(専門家の混合)という構造を採用しています。全パラメータを常時使うのではなく、入力に応じて必要な「専門家モジュール」だけを選択的に起動する仕組みです。現行フラッグシップのDeepSeek-V4-Proは総パラメータ1.6Tという超大規模構成を持ちながら、1トークン生成時に実際に使用するのは約49Bにとどまります。低コスト版のV4-Flashは総284Bで活性13Bという構成です。これにより計算量を大幅に削減しながら、大規模モデルに匹敵する知識容量を持つことができます。

MoEの仕組み(概念図)
入力トークン
ルーター
(どの専門家を使うか判定)
専門家A(選択)
専門家B(非選択)
専門家C(選択)
専門家D(非選択)
出力(統合)

全専門家(パラメータ全体)のうち、必要な一部だけを実行するため計算コストを大幅削減できる。V4-Proは総1.6Tのうち活性49B、V4-Flashは総284Bのうち活性13Bで動作する。

Multi-head Latent Attention(MLA)

DeepSeek-V2で導入されたMLA(多頭潜在注意機構)は、Transformerの注意機構を圧縮・最適化した独自技術です。KVキャッシュ(推論時のメモリ使用量に直結する部分)を従来比で大幅に削減し、長文処理時のメモリ効率と推論速度を向上させました。V4シリーズでもこの技術が継承・発展しており、最大1Mトークンの長文脈推論への対応強化に貢献しています。

強化学習(GRPO)によるR1の推論能力

DeepSeek-R1の最も革新的な点は、人間のフィードバックデータをほとんど使わずに推論能力を獲得したことです。DeepSeekチームが開発した「GRPO(Group Relative Policy Optimization)」という強化学習アルゴリズムにより、モデルは数学や論理問題への解答を繰り返す中で「考える」習慣を自律的に学習しました。答えが正しいかどうかという明確な報酬だけで、人間の教師データなしに推論の試行錯誤を覚えたのです。このアプローチはV4系の推論(thinking)モードの開発にも受け継がれています。

低コスト学習の実現

米国の輸出規制により、DeepSeekはNVIDIAの最高性能GPU(A100/H100)を入手できない状況に置かれていました。それでもDeepSeek-V3の学習コストを約557万ドルに抑えた実績を持ち(ただしこの数字は最終学習フェーズの費用であり、研究開発全体のコストではないという指摘もあります)、その後継となるV4シリーズでもMoEによる計算効率の追求が継続されています。GPT-4の学習には数億ドル規模がかかると推定される中、この効率重視の姿勢は変わっていません。

DeepSeek-R1の性能:主要ベンチマークでの位置づけ

DeepSeek-R1の発表時に公開されたベンチマーク結果は、世界のAI研究者を驚かせるものでした。R1は現在も推論特化モデルとして高い評価を維持しています。

ベンチマーク 評価内容 DeepSeek-R1 OpenAI o1 GPT-4o
AIME 2024 数学オリンピック問題 79.8% 79.2% 9.3%
MATH-500 高校〜大学数学 97.3% 96.4% 76.6%
Codeforces 競技プログラミング 96.3パーセンタイル 96.6パーセンタイル
GPQA Diamond 大学院レベル科学問題 71.5% 75.7% 53.6%
MMLU 多分野の知識問題 90.8% 91.8% 87.2%

数学・コーディングではOpenAI o1と事実上同等か一部で上回る結果を示しており、汎用知識(MMLU)でも高い水準を持っています。なお、2026年6月時点の現行主力はV4系であり、長文脈推論・コーディング・エージェント用途ではV4-Proがさらに高い総合性能を発揮します。

DeepSeekのAPIと料金:OpenAIと何が違うか

DeepSeekはAPIを通じて商用利用が可能で、その価格設定はOpenAI APIと比較して著しく低コストです。また、消費者向けチャット(chat.deepseek.com)および公式アプリは完全無料で利用でき、Plus/Proのような有料個人プランは存在しません(混雑時はフェアユースのスロットリングにより「Server Busy」となる場合があります)。以下は2026年6月時点の主要APIモデルの料金です(出典:DeepSeek API公式ドキュメント)。

モデル 入力:キャッシュヒット
(/1Mトークン)
入力:キャッシュミス
(/1Mトークン)
出力
(/1Mトークン)
DeepSeek-V4-Flash
deepseek-v4-flash
$0.0028
(約0.4円)
$0.14
(約21円)
$0.28
(約42円)
DeepSeek-V4-Pro
deepseek-v4-pro
※プロモ価格(75%割引)
$0.003625
(約0.5円)
$0.435
(約65円)
$0.87
(約130円)
DeepSeek-V4-Pro
(標準価格・割引終了後)
$1.74
(約261円)
$3.48
(約522円)
OpenAI GPT-4o(参考) $2.50 $10.00
OpenAI o1(参考) $15.00 $60.00

なお、DeepSeek-V4-Proの $0.435/$0.87 は75%割引のプロモーション価格です。割引終了後は標準価格(入力 $1.74 /出力 $3.48)が適用されます。それでもOpenAI o1と比較すると大幅に安価な水準です。また、V4-Pro・V4-FlashともにMITライセンスのオープンウェイトとして公開されているため、自社サーバーにデプロイすれば理論上APIコストをゼロにすることも可能です。

なお、旧API名 deepseek-chatdeepseek-reasoner は2026年7月24日(15:59 UTC)で廃止予定です。現行の正式なAPI名は deepseek-v4-flashdeepseek-v4-pro をご利用ください。

DeepSeekの使い方:チャット画面からローカル実行まで

DeepSeekにはいくつかのアクセス方法があり、目的に応じて使い分けられます。

Webチャット(chat.deepseek.com)

最も手軽な方法は公式サイト「chat.deepseek.com」からアカウントを作成してチャット形式で利用することです。完全無料で利用でき、有料プランへの加入は不要です。既定モデルはDeepSeek-V4-Flashで、InstantモードおよびExpertモードで提供されています(混雑時は「Server Busy」となる場合があります)。インターフェースはChatGPTに近いシンプルな設計で、日本語でのやり取りにも対応しています。

スマートフォンアプリ

iOS・Android向けの公式アプリが提供されており、モバイルからも同様の機能にアクセスできます。音声入力にも対応しています。

APIによる開発者向け利用

platform.deepseek.comからAPIキーを取得することで、OpenAI互換のAPIエンドポイント経由でアプリケーションに組み込めます。リクエスト形式がOpenAI APIと互換性があるため、既存のOpenAI実装を最小限の変更でDeepSeekに切り替えることも可能です。高性能が必要な用途には deepseek-v4-pro、コスト重視の用途には deepseek-v4-flash を使い分けることができます。

ローカル実行(Ollama/LM Studio)

モデルの重みがMITライセンスで公開されているため、OllamaやLM Studioなどのツールを使えば自分のPC上でDeepSeekを実行できます。蒸留版の小型モデル(7B・8B)であれば、16GB程度のVRAMを持つGPUで動作します。この方法ではデータが外部に送信されないため、機密性の高い用途にも対応できます。

利用方法の選び方(目安)
用途 推奨アクセス方法
日常的な質問・文章作成・学習 Webチャット or アプリ(完全無料)
自社サービスへの組み込み(高性能) DeepSeek-V4-Pro API(deepseek-v4-pro
自社サービスへの組み込み(低コスト重視) DeepSeek-V4-Flash API(deepseek-v4-flash
機密データを扱う業務 ローカル実行(Ollama等)
高性能な推論・数学・コード DeepSeek-V4-Pro(thinkingモード)またはDeepSeek-R1

DeepSeekのセキュリティと懸念点:正直に整理する

DeepSeekが急速に普及する一方で、いくつかの懸念事項も指摘されています。利用にあたって把握しておくべき点を整理します。

データの取り扱いとプライバシーポリシー

DeepSeekのプライバシーポリシーによると、チャット履歴や入力データは中国国内のサーバーに保存されます。中国の法律上、政府からデータ開示要求があった場合に対応する義務が企業に課されます。このため、個人情報・企業の機密情報・内部資料などを入力することは推奨されません。欧米の一部政府機関や企業では、この理由からDeepSeekの業務利用を制限・禁止する動きも見られます。

コンテンツフィルタリング(政治的センシティブトピック)

DeepSeekは中国の規制に従い、天安門事件・台湾独立・習近平批判などの政治的にセンシティブなトピックについては回答を拒否するか、中国政府の公式見解に沿った回答をするよう調整されています。これは学術・報道・分析目的で使用する際に留意が必要な点です。一方でローカル実行版では、これらの制限が異なる場合があります。

ジェイルブレイク耐性の課題

2025年1月の公開直後、セキュリティ研究者による検証で、DeepSeek-R1は一部のプロンプト操作(ジェイルブレイク)によってGPT-4oやClaudeより有害なコンテンツを生成しやすいという報告が出ました。その後の改良が進んでいますが、エンタープライズ利用時にはコンテンツポリシーの整備が引き続き不可欠です。

ローカル実行によるリスク回避

データプライバシーへの懸念を持ちながらもDeepSeekの性能を活用したい場合、前述のローカル実行が現実的な解決策です。モデルの重みをダウンロードしてオンプレミス環境で動かせば、入力データは外部ネットワークに送信されないため、セキュリティリスクを大幅に低減できます。

データのプライバシー保護を象徴する抽象的なコンセプトイメージ
データのプライバシー保護を象徴する抽象的なコンセプトイメージ

DeepSeekがAI業界に与えたインパクト

DeepSeek-R1の公開は、AI産業全体に複数の波紋を広げました。そのインパクトはV4シリーズの登場によってさらに継続しています。

NVIDIAショックと株価への影響

2025年1月下旬、DeepSeekの低コスト学習の報告を受け、NVIDIAの株価は一日で約17%下落し、時価総額が約5,900億ドル蒸発するという歴史的な事態が起きました。「高性能AIには大量の最新GPUが必要」という前提が崩れると市場が解釈したためです。その後NVIDIAの株価は一部回復しましたが、AIインフラへの投資判断に影響を与えた出来事として記録されています。

「効率化による民主化」という新たな潮流

DeepSeekが示したのは、巨大資本と最新ハードウェアを持たなくても世界トップレベルのAIを開発できる可能性です。V4シリーズでもこの姿勢は維持されており、スタートアップや研究機関でも高性能なモデルを開発・活用できる環境が整いつつあります。Meta・Mistral・Googleなどの主要プレイヤーもこのアプローチに注目し、学習効率の改善競争が加速しています。

オープンウェイト戦略の再評価

OpenAIやAnthropicがクローズドモデルを維持する中、DeepSeekはV4-Pro・V4-FlashともにMITライセンスでモデルの重みを公開するオープン戦略をとっています。Metaのオープンソース路線(Llamaシリーズ)と合わせて、オープンウェイトAIの競争力が改めて世界から注目される契機になりました。

DeepSeekと他の主要LLMとの比較

比較項目 DeepSeek-V4-Pro DeepSeek-R1 OpenAI o1 Claude 3.5 Sonnet Gemini 2.0 Flash
開発元の国 中国 中国 米国 米国 米国
オープンウェイト ◯(MITライセンス) ◯(モデル重み公開) ✕(クローズド) ✕(クローズド) ✕(クローズド)
推論能力(数学・論理) 非常に高い 非常に高い 非常に高い 高い 高い
長文脈推論・エージェント 対応(1Mトークン・強化) 高い 対応 対応 対応
ローカル実行 可能(重み公開) 可能(蒸留版) 不可 不可 一部可
日本語対応 対応 対応 対応 対応 対応
政治検閲 中国基準で実施 中国基準で実施 なし(RLHF制限あり) なし(Constitution AI制限あり) なし

DeepSeekの得意分野と苦手分野

DeepSeekを使いこなすには、何が得意で何が不得意かを正確に理解することが重要です。

得意なこと

  • 数学・定理証明・数式処理:AIME・MATHベンチマークで証明された通り、数学的推論は世界最高水準
  • コーディング・アルゴリズム設計:コンペ問題から業務コードのレビューまで高い精度。V4系でさらに強化
  • 論理的推論・多段階思考:V4-Pro・R1ともにthinking(推論)モードで長い推論問題に有効
  • 長文処理・要約:V4-Pro・V4-Flashともに最大1Mトークンの長文脈に対応し、大量テキストの整理が得意
  • エージェント型タスク:V4シリーズはエージェント用途を明示的にサポート
  • コスト効率の高い大量処理:API価格の低さから大量バッチ処理に向いている

苦手なこと・注意点

  • 最新情報の反映:学習データのカットオフ以降の出来事には対応できない
  • 政治・社会的センシティブトピック:中国の規制基準に従った制限がある
  • 画像生成:テキストとコード中心の設計であり、画像生成機能はない(画像入力は一部対応)
  • リアルタイム検索:デフォルトでは外部ウェブ検索を行わない(一部機能で検索連携あり)
数学的推論の能力を象徴する黒板と数式のイメージ
数学的推論の能力を象徴する黒板と数式のイメージ

DeepSeekの今後:2026年以降の展望

2026年6月時点でDeepSeekはV4シリーズ(V4-Pro・V4-Flash)を現行ラインナップとしながら、モデル開発を継続的に進めています。注目されるポイントは以下の通りです。

  • エージェント型AIの深化:V4シリーズがすでにエージェント用途を強化しており、ツール呼び出しや自律的なタスク実行能力のさらなる向上が期待される
  • マルチモーダル対応の強化:テキスト・コードに加え、画像・音声を統合的に処理するモデルへの発展
  • 蒸留技術の精緻化:大型モデルの能力をさらに小型モデルに移転し、エッジデバイスでの高性能推論を実現
  • 学習効率の限界探求:より少ないデータ・計算コストでの学習を追求するスケーリング則の再考

米国と中国のAI覇権競争という地政学的文脈の中で、DeepSeekは「制約が革新を生む」ことを証明し続けている存在です。輸出規制という障壁が、逆に創造的な技術革新を促したという逆説は、今後のAI開発のあり方に重要な示唆を与えています。

まとめ:DeepSeekを一言で言えば何者か

DeepSeekは、中国発のオープンウェイト大規模言語モデルシリーズであり、「世界最高水準の推論性能を、圧倒的なコスト効率で実現し続けている」ことでAI業界に継続的な影響を与えている存在です。

2026年6月時点の現行ラインナップは、長文脈推論・コーディング・エージェント用途に対応したフラッグシップのDeepSeek-V4-Pro(総1.6T・活性49B、API名:deepseek-v4-proと、低コスト・高速なDeepSeek-V4-Flash(総284B・活性13B、API名:deepseek-v4-flash、そして推論特化として引き続き高評価のDeepSeek-R1という構成です。いずれもMITライセンスのオープンウェイトとして公開されています。消費者向けチャット(chat.deepseek.com)は完全無料で利用でき、有料個人プランは存在しません。課金はAPIの従量制のみです。

技術面ではMoEアーキテクチャ、Multi-head Latent Attention、GRPOベースの強化学習という三つの柱が高効率を支えています。利用面では無料のWebチャット・低コストAPI・ローカル実行という三つの経路があり、個人から企業まで幅広い用途に対応します。一方でデータの中国サーバー保存と政治的検閲という固有のリスクも存在し、利用用途に応じた適切な判断が必要です。

AIをビジネスや研究に活用する人にとって、DeepSeekはコスト・性能の両面で無視できない選択肢になっています。まずは公式チャットで試し、用途と安全要件を確認したうえでAPI活用やローカル実行を検討するというステップが、現実的なアプローチです。

関連記事

関連記事

参考文献

    関連記事(DeepSeek)

    AIブログ購読

     
    クリスタルメソッドがお届けする
    AIブログの更新通知を受け取る

    Study about AI

    AIについて学ぶ

    • Meta インド データセンター AIインフラ——Reliance 168MW契約の深層と日本企業の実務対応

      Meta インド データセンター AIインフラ——Reliance 168MW契約の深層と日本企業の実務対応

      監修 河合 継(クリスタルメソッド株式会社 代表取締役) AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番...

    • ワーナー Sureel AI 音楽 著作権——買収の意味と日本企業への示唆

      ワーナー Sureel AI 音楽 著作権——買収の意味と日本企業への示唆

      監修 河合 継(クリスタルメソッド株式会社 代表取締役) AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番...

    • Vector Lakebase ベクターDB RAG——Zillizが示す統合AIデータ基盤の論点

      Vector Lakebase ベクターDB RAG——Zillizが示す統合AIデータ基盤の論点

      監修 河合 継(クリスタルメソッド株式会社 代表取締役) AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番...

    View more