blog

DeepSeek R1 とは?推論モデルの特徴・使い方【2026年版】

DeepSeek R1とは?次世代推論モデルの全貌

DeepSeek R1は、中国のAIスタートアップDeepSeekが2025年1月に公開した大規模言語モデル(LLM)です。数学・コーディング・論理推論といった複雑なタスクで、OpenAIのo1シリーズと肩を並べる性能を示しながら、開発コストと推論コストを大幅に抑えた点が世界中の開発者・研究者の注目を集めました。なお、2026年4月には後継の旗艦モデルとしてDeepSeek-V4-ProおよびDeepSeek-V4-Flashがリリースされており、現行の主力はV4系に移行しています。本記事では、R1のアーキテクチャ・性能・使い方・実務活用を徹底的に深掘りしつつ、現行モデルとの関係も整理します。DeepSeek全体の概要についてはDeepSeek とはをご参照ください。

DeepSeek R1が採用する段階的推論プロセスのイメージ
DeepSeek R1が採用する段階的推論プロセスのイメージ

DeepSeek R1が注目された背景

DeepSeek R1の登場は、AIコミュニティに「コスト効率革命」をもたらしました。従来、OpenAI o1クラスの推論モデルを動かすには膨大なGPUリソースが必要とされていましたが、DeepSeekはMixture-of-Experts(MoE)構造と独自の強化学習レシピによってその常識を覆しました。

特に衝撃的だったのは、モデル学習にかかったコストがGPT-4の推定開発費の数十分の一とされる点です。実際に当社でも複数のLLMを並行検証していますが、同等タスクでの応答精度とコストのバランスという観点で、R1は2025年初頭の時点でトップクラスの費用対効果を示しました。

DeepSeek V3との違い

DeepSeekのモデル系譜を整理すると、R1の位置づけが明確になります。

モデル 主な特徴 得意タスク 推論スタイル
DeepSeek V3 汎用Chat・コーディング特化、6710億パラメータMoE 対話・コード生成・文章作成 標準(思考ステップ非公開)
DeepSeek R1 段階的推論(CoT)特化、強化学習で訓練 数学・論理・コーディング・科学 思考プロセスを公開して出力
DeepSeek R1-Zero SFT前段なし・RL単独訓練の実験モデル 研究・ベースライン検証 思考プロセス公開

V3が「賢い汎用アシスタント」であるのに対し、R1は「ステップバイステップで考える専門家」と位置づけると理解しやすいでしょう。R1はプロンプトへの応答として推論過程(thinking token)を明示的に出力するため、答えに至るロジックをユーザーが検証できます。なお、この推論モード対応は現行のV4-ProおよびV4-Flashにも引き継がれており、V4系でも同様のthinking機能を利用できます。

DeepSeek R1のアーキテクチャと技術的仕組み

R1の技術的な革新は大きく3つに分けられます。

1. Mixture-of-Experts(MoE)による効率化

R1はV3と同じMoEベースの基盤を持ちます。総パラメータ数は約6710億ですが、推論時に活性化されるのはトークンごとに選ばれた約370億パラメータのみです。これにより、フルサイズのDenseモデル(例:GPT-4相当)と比べて計算量を大幅に削減しながら高精度を維持できます。現行旗艦のDeepSeek-V4-Pro(1.6Tパラメータ・アクティブ約49B)でもこのMoE設計はさらに進化した形で継承されています。

2. 純粋な強化学習(RL)による推論能力獲得

R1の前段モデルであるR1-Zeroは、教師ありファインチューニング(SFT)を一切行わず、RLのみで数学・コーディングの推論能力を獲得しました。報酬モデルとして「答えの正誤」と「フォーマット遵守」だけを使ったシンプルな設計で、Chain-of-Thought(CoT)的な長い思考プロセスが自然に出現したことが論文で報告されています。

最終版R1では、R1-Zeroの挙動をベースにSFTデータとRLを組み合わせた多段階パイプラインを採用し、可読性と汎用性を高めています。

3. 思考プロセスの可視化(Extended Thinking)

R1はプロンプトに対して「まず考える→次に答える」という2段階で応答します。APIでは<think>...</think>タグ内に推論過程が入り、その後に最終回答が続きます。この設計により、

  • 答えが間違っていてもどのステップで誤ったかが分かる
  • プロンプトの問題設定が曖昧な場合に、モデルが自己補完して解釈を示す
  • 教育・研究用途でロジック学習に活用できる

という実務上のメリットがあります。当社の検証でも、複雑な要件定義タスクをR1に投げると、見落としがちな前提条件をthinkingステップで列挙してくれるケースが多く、ジュニア担当者のレビューツールとして有用でした。

DeepSeek R1の性能ベンチマーク

公式論文および独立機関によるベンチマーク結果をまとめます(2025年1月時点)。

ベンチマーク DeepSeek R1 OpenAI o1 Claude 3.5 Sonnet
AIME 2024(数学) 79.8% 79.2% 16.0%
MATH-500(数学) 97.3% 96.4% 78.3%
Codeforces(コーディング) 96.3パーセンタイル 96.6パーセンタイル
MMLU(知識・推論) 90.8% 91.8% 88.3%
GPQA Diamond(科学) 71.5% 75.7% 65.0%

数学タスクではo1をわずかに上回る場面もあり、科学・知識系ではo1がやや優位という傾向です。しかしAPI単価を考慮したコスト当たりの性能では、R1が圧倒的に優位です(詳細はDeepSeek 料金を参照)。

DeepSeek R1の蒸留モデル(Distilled)とは

R1の大きな特長の一つが、オープンソースで提供されている蒸留版(Distilled)モデル群です。フルスケールのR1(671B MoE)の推論パターンをQwen2.5・LLaMA 3シリーズなどのDenseモデルに移植し、手元のGPUでも動かせるサイズに落とし込んでいます。

モデル名 パラメータ数 ベースモデル 動作目安
DeepSeek-R1-Distill-Qwen-1.5B 1.5B Qwen2.5-1.5B CPU・軽量GPU
DeepSeek-R1-Distill-Qwen-7B 7B Qwen2.5-7B VRAM 8GB~
DeepSeek-R1-Distill-Qwen-14B 14B Qwen2.5-14B VRAM 16GB~
DeepSeek-R1-Distill-Qwen-32B 32B Qwen2.5-32B VRAM 24GB×2~
DeepSeek-R1-Distill-LLaMA-8B 8B LLaMA-3.1-8B VRAM 8GB~
DeepSeek-R1-Distill-LLaMA-70B 70B LLaMA-3.3-70B VRAM 80GB×2~

当社では14Bと32Bの蒸留モデルをオンプレ環境で評価しましたが、14Bでも標準的なコーディング補助や文書要約では実用水準に達しており、データをクラウドに出せない案件でのローカルLLM候補として有力です。32Bになると複数ステップの推論精度が顕著に上がり、法的・財務的な複合条件分析でも信頼性の高い回答を得られました。

DeepSeek R1の使い方:3つのアクセス経路

R1を実際に使う方法は大きく3つあります。なお、公式チャットサービスの既定モデルは現行のDeepSeek-V4-Flashに移行していますが、R1の推論機能を体験したい場合は以下の各経路から利用できます。

① DeepSeek公式サービス

chat.deepseek.com またはモバイルアプリから無料で利用可能(個人向け有料プランは存在しない)。ブラウザ上でthinkingプロセスを確認しながら対話できる。混雑時は「Server Busy」になる場合あり。

② DeepSeek API

OpenAI互換エンドポイントで呼び出し可能。旧API名deepseek-reasonerは2026年7月24日に廃止予定のため、新モデル名deepseek-v4-flash(thinkingモード)またはdeepseek-v4-proへの移行を推奨。

③ ローカル実行(蒸留モデル)

Hugging FaceからDLしてollama・vLLM・llama.cppで起動。データをローカルに留めたい企業・研究者向け。

API利用の基本コード例(Python)

OpenAI Python SDKを使えば、数行の変更でthinking機能を持つDeepSeekモデルを呼び出せます。旧モデル名deepseek-reasonerは2026年7月24日廃止予定のため、現行API名への移行を推奨します。

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_DEEPSEEK_API_KEY",
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-v4-flash",  # thinking モード対応の現行モデル名
    messages=[
        {"role": "user", "content": "以下の積分を解いてください:∫x²e^x dx"}
    ]
)

# 推論プロセス(thinking)
print(response.choices[0].message.reasoning_content)

# 最終回答
print(response.choices[0].message.content)

reasoning_contentフィールドにthinkingトークンが、contentに最終回答が格納されます。最新の料金体系についてはDeepSeek 料金で詳しく解説しています。

ollamaでのローカル起動(蒸留モデル)

# モデルのダウンロードと起動(14Bの場合)
ollama run deepseek-r1:14b

# プロンプトを送信するだけで推論プロセスが <think> タグ付きで表示される

ollamaは自動でGPU/CPUを切り替えるため、GPUがない環境でも(低速ながら)動作します。

DeepSeek R1の得意分野と苦手分野

実務検証を通じて把握した、R1の強弱を整理します。

得意なタスク

  • 数学・証明問題:複数ステップの計算・証明で誤りが少なく、途中式も自動で提示
  • アルゴリズム実装・デバッグ:コードの論理エラーを推論プロセスで段階的に特定
  • 複合条件の論理推論:「もし〜ならば〜だが、例外として〜」のような入れ子条件を正確に処理
  • 要件定義・仕様書レビュー:前提の矛盾や抜け漏れをthinkingステップで指摘
  • 科学文献の読解・要約:専門的な数式・化学式を含む文書でも精度を維持

注意が必要なタスク

  • リアルタイム情報の取得:学習データのカットオフ以降の情報は持たない(RAGやWeb検索との組み合わせが必要)
  • 長大なコンテキストの一貫性:大規模コンテキストでは後半部の参照精度が低下する場合がある
  • 日本語の微妙なニュアンス:英語・中国語と比較して日本語の詩的表現・方言には弱い傾向
  • センシティブなトピック:中国の規制に準拠した制限がかかるドメインが存在する(政治・歴史系)
  • レイテンシ:thinkingトークン分だけ最初のトークン出力が遅れるため、UXに敏感なリアルタイム用途には注意

DeepSeek R1のプロンプト設計のコツ

R1は汎用的なChatモデルと異なる特性を持つため、プロンプト設計にも固有のコツがあります。なお、以下のコツはthinking機能を持つ現行のV4-Flash / V4-Proにも概ね適用できます。

1. System Promptはシンプルに

公式ドキュメントでも推奨されているとおり、R1のSystem Promptには余分な指示を詰め込まないことが重要です。「あなたは〇〇の専門家です。常に〜してください」のような多条件System Promptは、thinkingプロセスを阻害し精度を下げる場合があります。

2. Few-shotよりZero-shotが有効

R1はRL訓練で汎化能力が高いため、例を大量に与えるよりも「目的→制約→期待出力形式」を明確に書くZero-shotプロンプトの方が安定します。当社の検証でも、Few-shot例を3件入れるより指示を明文化した方が一貫して高品質でした。

3. 推論ステップを誘発するキーワード

日本語プロンプトでは「ステップごとに考えて」「根拠を明示して」「前提を整理してから」などの一言を加えると、thinkingの質が上がりやすいです。英語では“Think step by step before answering.”が定番です。

4. thinkingを無効化したい場合

APIでthinkingをスキップしたい場合は、non-thinkingモードに対応したモデル(deepseek-v4-flashのnon-thinkingモードなど)を利用してください。レスポンス速度優先の用途ではthinkingを無効化した軽量モデルの方が適しています。

R1の推論能力を引き出すプロンプト設計のイメージ
R1の推論能力を引き出すプロンプト設計のイメージ

他のモデル・サービスとの比較ポイント

R1をどのモデルと比較すべきか、選定ポイントを整理します。各モデルの詳細な性能・コスト比較はDeepSeek 比較をご参照ください。

  • vs OpenAI o1/o3:数学・コーディングでは同等の性能帯。コストはDeepSeek APIが大幅に低い。ただしエンタープライズサポート・セキュリティ契約ではOpenAIが充実
  • vs Claude 3.5/3.7 Sonnet:文章作成・長文ライティングはClaude優位、数学・推論はR1優位
  • vs Gemini 2.0 Flash Thinking:マルチモーダル(画像・音声入力)ではGemini優位、純粋テキスト推論はR1と同等以上
  • vs ローカルLLM(LLaMA 3.3など):R1の蒸留モデルは同サイズ帯のLLaMAをコーディング・数学で上回る傾向

DeepSeek R1の無料利用と制限

公式Webアプリ(chat.deepseek.com)はアカウント登録後に完全無料で利用できます。個人向けの有料サブスクリプション(Plus/Pro等)は存在せず、消費者チャットは一貫して無料提供です(混雑時「Server Busy」になるフェアユース制限あり)。無料版の具体的な制限事項についてはDeepSeek 無料版で詳しく解説しています。

API利用は従量課金制のみで、課金が発生するのはAPI利用時に限られます。2026年6月時点の主要モデルのAPI料金は以下のとおりです(出典:DeepSeek API Docs — Pricing)。

モデル 入力(キャッシュヒット) 入力(キャッシュミス) 出力
deepseek-v4-flash $0.0028 / 100万トークン $0.14 / 100万トークン $0.28 / 100万トークン
deepseek-v4-pro(プロモ価格) $0.003625 / 100万トークン $0.435 / 100万トークン※ $0.87 / 100万トークン※

※ deepseek-v4-pro の $0.435/$0.87 は75%割引のプロモーション価格。割引終了後の標準価格は入力 $1.74 / 出力 $3.48。本番運用前に公式料金ページで最新情報を確認してください。

DeepSeek R1の安全性・プライバシーに関する注意点

R1(およびDeepSeek全般)を業務利用する際に確認すべきリスクがあります。

  • データの保存場所:DeepSeekの公式APIは中国法人が運営しており、送信データが中国国内のサーバーを経由します。機密情報・個人情報を含むプロンプトの送信には注意が必要です。
  • 規制対応:業種・国によっては第三者クラウドへのデータ送信に制限がある場合があります(金融・医療・公共機関など)。蒸留モデルのオンプレ運用が安全策として有効です。
  • コンテンツポリシー:中国の法律に基づく制限が一部のトピックに適用されます。グローバル展開するサービスでの利用時はポリシー差異を把握しておく必要があります。
  • サードパーティ経由の利用:Azure AI・Amazon Bedrock・Perplexityなど複数のプラットフォームでDeepSeekモデルが提供されており、既存のクラウド契約・セキュリティ設定のまま利用できるケースもあります。

DeepSeek R1の実務活用事例

当社の検証・実運用から得られた具体的なユースケースを紹介します。

ソフトウェア開発支援

複雑なSQL最適化やアルゴリズム設計で、thinkingステップが「なぜこのインデックスが有効か」を説明しながら最終クエリを出力するため、レビュー時間が大幅に短縮されました。特にO(n²)→O(n log n)へのアルゴリズム改善提案の質は、GPT-4oと同等以上でした。

法務・契約書レビュー補助

「以下の契約書条項に矛盾・抜け漏れがあれば指摘してください」という指示に対し、thinkingステップで各条項を相互参照しながら問題点を洗い出す挙動が確認できました。ただし法的判断はあくまで専門家の確認必須です。

教育・学習コンテンツ生成

数学・物理の解説コンテンツ生成では、段階的な解き方が自動で出力されるため、問題解説動画のスクリプト作成に活用できます。生徒が「なぜその手順になるか」を学べる説明文の質が高く評価されました。

データ分析・統計処理スクリプト

PythonのPandas・NumPyを使ったデータ前処理スクリプトの生成では、エッジケース(欠損値・型の不一致など)をthinkingステップで先回りして考慮したコードを出力するため、動作確認工数が減少しました。

まとめ

DeepSeek R1は、Mixture-of-Expertsと強化学習を組み合わせた革新的なアーキテクチャにより、数学・コーディング・論理推論でOpenAI o1クラスの性能を低コストで実現した推論特化モデルです。思考プロセスを公開するExtended Thinking設計は、品質検証・教育・複合推論タスクで特に高い価値を発揮します。

671BのフルモデルからローカルGPUで動く1.5B蒸留版まで揃っており、クラウドAPIからオンプレ展開まで多様なユースケースに対応できます。一方、2026年6月現在の主力APIモデルはDeepSeek-V4-ProおよびV4-Flashに移行しており、旧API名(deepseek-reasoner等)は2026年7月24日に廃止予定です。新規開発では現行モデル名を使用することを強く推奨します。データプライバシーへの配慮と得意・不得意タスクの把握が実務導入の前提となる点も変わりません。

DeepSeek全体のサービス概要はDeepSeek とは、コストシミュレーションはDeepSeek 料金、他モデルとの詳細比較はDeepSeek 比較、無料利用の制限詳細はDeepSeek 無料版をあわせてご確認ください。

関連記事

参考文献

    監修

    河合 継(クリスタルメソッド株式会社 代表取締役)

    AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
    運営会社について編集方針

    AIブログ購読

     
    クリスタルメソッドがお届けする
    AIブログの更新通知を受け取る

    Study about AI

    AIについて学ぶ

    • Meta インド データセンター AIインフラ——Reliance 168MW契約の深層と日本企業の実務対応

      Meta インド データセンター AIインフラ——Reliance 168MW契約の深層と日本企業の実務対応

      Meta インド データセンター AIインフラ——168MW契約の要点と背景 2026年6月9日、MetaはリライアンスIインダストリーズ(Reliance I...

    • ワーナー Sureel AI 音楽 著作権——買収の意味と日本企業への示唆

      ワーナー Sureel AI 音楽 著作権——買収の意味と日本企業への示唆

      ワーナー Sureel AI 音楽 著作権——買収の要点と業界的意義 2026年6月10日、Warner Music Group(以下WMG)はAIスタートアッ...

    • Vector Lakebase ベクターDB RAG——Zillizが示す統合AIデータ基盤の論点

      Vector Lakebase ベクターDB RAG——Zillizが示す統合AIデータ基盤の論点

      Vector Lakebaseとは何か——RAGデータ基盤をめぐる問い直し 2026年6月10日、ZillizはマネージドサービスZilliz Cloudをベー...

    View more