blog

DeepSeek 使い方完全ガイド:チャットからAPI実装まで

DeepSeek 使い方完全ガイド:チャットからAPI実装まで

DeepSeek 使い方の全体像:チャットとAPIの2ルートを正確に把握する

DeepSeekを実務に導入する際、まずアクセス経路が二つに大別される点を整理しておく必要がある。一つは消費者向けWebチャット(chat.deepseek.com)、もう一つは開発者向けAPI(platform.deepseek.com)だ。前者は完全無料かつアカウント作成だけで利用できる。後者はOpenAI ChatCompletions互換インターフェースを採用しており、既存のOpenAIクライアントのbase_urlapi_keyを差し替えるだけで切り替えられる設計だ。

2026年6月時点の現行主力モデルはDeepSeek-V4系(V4-ProおよびV4-Flash)であり、2025年に広く話題となったR1やV3はすでに旧世代に位置づけられる。R1を「最新モデル」として扱っている情報は古い。本記事はDeepSeek公式APIドキュメント(api-docs.deepseek.com/quick_start/pricing、2026-06-08確認)を一次情報の基準とする。

DeepSeekの2つのアクセス経路:Webチャット(無料)とAPI(従量課金)の構成図 利用者 エンジニア/一般ユーザー Webチャット(無料) chat.deepseek.com API(従量課金) platform.deepseek.com DeepSeek-V4-Flash (既定・低コスト) DeepSeek-V4-Pro (旗艦・高精度)
図1:DeepSeekの2つのアクセス経路。Webチャットは完全無料でV4-Flashが既定モデル。APIは従量課金制でV4-FlashとV4-Proを使い分けられる。

総務省の令和7年版情報通信白書は、生成AIが産業・行政・教育の各分野に急速に浸透しつつある現状を示しており(総務省「AIの爆発的な進展の動向」、soumu.go.jp)、DeepSeekのような高コスト効率モデルの登場はその普及を一層加速させる要因の一つとみられる。エンジニアとして正確な仕様・コスト・リスクを把握した上で導入判断を下すことが求められる。

DeepSeek 使い方(基礎編):Webチャットで始める具体的な手順

最も手軽なDeepSeekの使い方は、公式Webチャット(deepseek.com)を利用することだ。以下に実際の操作手順を示す。

アカウント作成から最初のチャットまでの4ステップ

  1. ブラウザで chat.deepseek.com を開く:スマートフォンアプリ版も同様のフローで利用できる。
  2. サインアップ:メールアドレスまたはGoogleアカウントで登録し、メール認証を完了する。登録自体に費用は一切かからない。
  3. モードを選択する:チャット画面では「Instant」と「Expert」の2モードが用意されている。Instantは高速応答向け(V4-Flash の non-thinkingモード)、Expertは複雑な推論・思考チェーンを必要とするタスク向け(V4-Flash の thinkingモード)に対応している。
  4. 日本語で直接入力する:翻訳を介す必要はなく、日本語でそのまま質問できる。日本語の応答品質についてはDeepSeekの日本語対応状況でさらに詳しく解説している。

消費者向けチャットの仕様と制約

消費者向けチャットには有料の個人プラン(Plus・Pro等)は存在しない。2026年6月時点で完全無料であることをDeepSeek公式ドキュメント(2026-06-08確認)が示している。ただし以下の制約は把握しておく必要がある。

  • スロットリング:混雑時には「Server Busy」と表示され、応答が遅延または拒否される。本番システムへの単独組み込みには向かない。
  • 既定モデルはV4-Flash:284Bパラメータ(アクティブ約13B)のMoEアーキテクチャ、最大入力1Mトークン・最大出力384Kトークンという仕様を持つ。無料枠での詳細や制限についてはDeepSeekの無料利用について詳しく解説した記事も参照してほしい。
  • データプライバシー:入力内容はDeepSeek側のサーバーに送信される。機密情報・個人情報の入力は避けること(後述のリスクセクションも参照)。

V4-Flashが既定モデルとして採用されている設計上の理由

V4-Flashは284Bの総パラメータを持ちながら、MoEアーキテクチャによりアクティブパラメータを約13Bに抑えている。推論コストの低さと応答速度を優先した結果として、消費者向けチャットの既定モデルとなっている。1Mトークンのコンテキストウィンドウを持つため、大容量のコードベースや長文ドキュメントをそのまま貼り付けて質問できる点は実用上の利点だ。より高度な推論が必要な場面では、旗艦モデルのV4-Pro(1.6Tパラメータ、アクティブ約49B)をAPIから呼び出す構成とするのが現実的な設計となる。モデルの詳細な仕様・アーキテクチャについてはDeepSeek-V4の詳細解説記事を参照してほしい。

DeepSeek 使い方(実装編):APIを使った開発者向け完全ガイド

エンジニアがDeepSeekをプロダクトへ組み込む場合、APIが主戦場となる。DeepSeek APIはOpenAI ChatCompletions互換インターフェースを採用しており、既存のOpenAIクライアントを最小限の変更で転用できる設計だ。Anthropic互換インターフェースも提供されているため、既存の実装資産との親和性は高い。

APIキー取得と初期設定の手順

  1. platform.deepseek.com にサインアップし、APIキーを発行する。
  2. APIエンドポイント:https://api.deepseek.com
  3. 認証:HTTPヘッダー Authorization: Bearer <YOUR_API_KEY> を付与する。
  4. 課金はトークン使用量に対する従量制であり、消費者向けチャットとは完全に独立した課金体系となる。

Pythonによる実装例(V4-Flash / non-thinkingモード)

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_DEEPSEEK_API_KEY",
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-v4-flash",  # 現行の正式モデル名
    messages=[
        {"role": "system", "content": "あなたは優秀なソフトウェアエンジニアです。"},
        {"role": "user", "content": "Pythonでシングルトンパターンを実装してください。"}
    ],
    max_tokens=2048
)

print(response.choices[0].message.content)

旧来のモデル名 deepseek-chat および deepseek-reasoner2026年7月24日 15:59 UTC をもって廃止予定である(DeepSeek API Docs Change Log、api-docs.deepseek.com/updates、2026-06-08確認)。現在は経過措置としてそれぞれV4-Flash の non-thinking / thinkingモードへマッピングされているが、新規実装では必ず deepseek-v4-flash または deepseek-v4-pro を使用すること。既存コードベースの移行は廃止期限前に完了させることを強く推奨する。

推論(thinking)モードの活用とトレードオフ

V4-FlashおよびV4-Proはともにthinkingモードに対応しており、多段階推論・アルゴリズム設計・複雑な数学問題において精度向上が期待できる。thinkingモードではモデルが内部で思考チェーンを展開してから最終回答を出力するため、以下のトレードオフが生じる。

  • レイテンシの増加:思考チェーンの分だけ応答時間が延びる。リアルタイム性が求められる用途では non-thinkingモードを選択する。
  • トークン消費量の増加:思考チェーン部分のトークンもカウントされるため、コストが上昇する可能性がある。
  • 精度の向上:推論の透明性が上がり、論理的なミスを検出しやすくなる。

バッチ処理・非同期タスクにはthinkingモード、会話型インターフェースには non-thinkingモード、という使い分けが一般的なアプローチとなる。APIの詳しい実装パターンや注意点についてはDeepSeek API活用ガイドで詳しく解説している。

DeepSeek 使い方の前提として理解する:料金・モデル比較と予算計画

コストを正確に見積もるため、現行モデルの料金を整理する。以下の数値はDeepSeek公式APIドキュメント(api-docs.deepseek.com/quick_start/pricing、2026-06-08確認)に基づく。

DeepSeek V4系APIモデルの料金比較(2026年6月時点、価格はUSD/100万トークン)
モデル名 パラメータ
(総数 / アクティブ)
コンテキスト長 入力
(キャッシュヒット)
入力
(キャッシュミス)
出力 備考
deepseek-v4-flash 284B / 約13B 1Mトークン $0.0028 $0.14 $0.28 軽量・低コスト。Webチャットの既定モデル。thinkingモード対応
deepseek-v4-pro 1.6T / 約49B 1Mトークン $0.003625 $0.435(プロモ価格) $0.87(プロモ価格) 標準価格:入力$1.74 / 出力$3.48。75%割引プロモ適用中。旗艦モデル

V4-Proの入力$0.435・出力$0.87は75%割引の期間限定プロモーション価格であり、割引終了後は入力$1.74・出力$3.48の標準価格に戻る点に注意が必要だ。プロダクション環境の予算計画は必ず標準価格を基準に立てること。プロモーション終了後にコストが約4倍になるリスクを前提に、ROI試算を行う必要がある。詳細な料金計算はDeepSeek料金の詳細解説で確認できる。他社モデルとのコスト・性能比較についてはDeepSeekと競合モデルの比較記事も参考にしてほしい。

キャッシュヒット率の設計によるコスト最適化

V4-Flashのキャッシュヒット時の入力コスト($0.0028/100万トークン)はキャッシュミス時($0.14/100万トークン)の約50分の1だ。大量のトークンをバッチ処理する用途では、プロンプトのプレフィックス部分を固定化してキャッシュヒット率を高める設計が直接的なコスト削減につながる。システムプロンプトや長文コンテキストの前半部分を共通化するアーキテクチャを検討したい。

DeepSeek 使い方の応用:ユースケース別の活用戦略

コード生成・自動レビューへの適用

DeepSeek-V4-Flashはコスト効率が高く、CIパイプライン上での自動コードレビューや補完候補生成に適している。たとえば、Pull Requestのdiffを入力してレビューコメントを自動生成するフローでは、キャッシュヒット設計と組み合わせることで従来のGPT系APIより大幅な費用削減が期待できる。アーキテクチャ設計の相談や複雑なバグ解析にはV4-Proのthinkingモードを選択するとよい。

長文ドキュメント処理(1Mトークンコンテキストの活用)

V4系は両モデルとも1Mトークンのコンテキストウィンドウを持つ。数百ページのPDF相当のテキストを一度に投入して要約・質問応答を行うユースケースに対応できる。ただし長コンテキストでは入力トークン数が膨大になるため、事前のコストシミュレーションが必須だ。実際の利用パターンにおけるキャッシュヒット率を計測した上で、V4-FlashとV4-Proのどちらを選択するかを決定することを推奨する。

マルチターン対話システムへの組み込み

OpenAI ChatCompletions互換APIを使えば、LangChainやLlamaIndex等の既存フレームワークとの統合が容易だ。base_urlhttps://api.deepseek.com に変更し、モデル名を deepseek-v4-flash に設定するだけで多くのケースで動作する。Anthropic互換インターフェースも提供されており、Claudeからの移行を検討している場合にも選択肢となる。

オープンウェイトによる自己ホスト環境の構築

V4-ProおよびV4-FlashはMITライセンスでHugging Face・GitHubに公開されており(DeepSeek-V4-Pro on Hugging Face、2026-06-08確認)、自社インフラへのデプロイ・商用利用が可能だ。データが外部に出ないため、機密情報を扱う用途ではパブリックAPIより自己ホストが有利となる場合がある。ただし1.6Tパラメータ級のモデルを実用的な速度で動かすには相応のGPUリソース(HBM容量・帯域幅)が必要であり、クラウドAPIとの運用コスト比較は慎重に行う必要がある。V4-Flashの284Bモデルの方が自己ホストの現実解として検討しやすいだろう。

バーチャルヒューマン・AIアバターとの組み合わせ

弊社(クリスタルメソッド)が開発するバーチャルヒューマン/AIアバターソリューション「DeepAI」は、実在の人物の容姿・表情・声・振る舞いをデジタル空間で再現し、リップシンク・表情生成・音声合成・対話AIなどを組み合わせて接客・研修・面接練習・広報等に活用するソリューションだ。DeepSeek-V4系LLMを対話AIのバックエンドとして組み合わせることで、よりコスト効率の高いバーチャルヒューマンシステムを構築できる可能性があり、用途に応じたLLMの使い分けはアーキテクチャ設計上の重要な検討事項となる。

DeepSeek 使い方を支える前提:セキュリティリスクと導入判断の基準

DeepSeekをチーム・組織レベルで導入する前に、以下のリスク要因を整理しておく必要がある。

データ主権とプライバシーリスク

DeepSeekは中国籍企業が開発・運営するサービスであり、パブリックAPIへの入力データは中国のサーバーに送信される。機密情報・個人情報・知的財産を含むデータをパブリックAPIに投入することは避けるべきだ。総務省の令和7年版情報通信白書は、生成AIの急速な普及に伴うデータ管理・セキュリティリスクへの対応が重要課題であることを示しており(総務省「AIの爆発的な進展の動向」、soumu.go.jp)、外部APIへのデータ送信ポリシーは組織として明文化しておくことを推奨する。セキュリティリスクの詳細な評価はDeepSeekのリスクと注意点を解説した記事でまとめている。

可用性・SLAの制約

消費者向けチャットは混雑時にスロットリングが発生し、APIについてもSLAの公開情報は現時点で限定的だ。ミッションクリティカルなシステムへの単独依存は避け、フォールバック先のAPIを用意するフェイルオーバー設計を検討すること。

プロモーション価格の終了リスクと移行コスト

V4-Proの現在の出力コスト$0.87は75%割引のプロモーション価格であり、終了後は$3.48まで上昇する。採用決定時のROI試算を標準価格で行うことは前述の通りだが、その価格水準でも導入価値があるかを判断基準とすることが合理的だ。

旧APIの廃止とマイグレーション

deepseek-chatdeepseek-reasonerは2026年7月24日に廃止される。既存のコードベースに旧モデル名が含まれている場合、今すぐ移行作業を開始することを推奨する。置き換え先はそれぞれ deepseek-v4-flash(non-thinkingモード)と deepseek-v4-flash(thinkingモード)または deepseek-v4-pro となる。

ハルシネーションへの対処

V4系においても、事実確認が必要な出力には人間によるレビューを挟む設計が必要だ。thinkingモードは推論の精度を向上させるが、ハルシネーションを完全に排除するものではない。文部科学省の資料でも、生成AIの出力結果を無批判に受け入れないリテラシー教育の重要性が指摘されている(文部科学省 資料1-1、mext.go.jp)。プロダクション環境では出力の事後検証ステップを設計に組み込むことを強く推奨する。


DeepSeekに関するその他の技術解説はクリスタルメソッドのAI技術ブログでまとめて確認できる。また旧世代のDeepSeek-R1の仕様や位置づけを確認したい場合はDeepSeek-R1の解説記事を参照してほしい。

なお、弊社(クリスタルメソッド)が開発する「DeepAI」は、実在の人物の容姿・表情・声・振る舞いをデジタル空間で再現するバーチャルヒューマン/AIアバターソリューションだ。リップシンク・表情生成・音声合成・対話AIなどを組み合わせ、接客・研修・面接練習・広報等の幅広い用途に活用できる。詳細は製品ページよりお問い合わせいただきたい。

参考文献

監修

河合 継(クリスタルメソッド株式会社 代表取締役)

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について編集方針

AIブログ購読

 
クリスタルメソッドがお届けする
AIブログの更新通知を受け取る

Study about AI

AIについて学ぶ

  • AI規制・州法ルール形成の最前線——米国の現実から日本企業が学ぶ教訓

    AI規制・州法ルール形成の最前線——米国の現実から日本企業が学ぶ教訓

    AI規制・州法ルール形成の現在地——連邦停滞が生む「パッチワーク」構造 2026年6月4日、米下院のJay Obernolte議員(共和・カリフォルニア州)とL...

  • Supermicro AIサーバー調達・受注390億ドルが日本企業に示す戦略的含意

    Supermicro AIサーバー調達・受注390億ドルが日本企業に示す戦略的含意

    Supermicro AIサーバー受注390億ドル・70億ドル調達計画の要点 Super Micro Computer(ティッカー: SMCI、以下Superm...

  • AI広告・合成パフォーマー開示規制の全米初施行——日本企業が今取るべき対応

    AI広告・合成パフォーマー開示規制の全米初施行——日本企業が今取るべき対応

    NY州「AI合成パフォーマー」広告開示規制——全米初の法律が施行 2026年6月9日、ニューヨーク州でAI生成の「synthetic performers(合成...

View more