blog
AIブログ
deepseek 料金|2026年版ガイド
DeepSeekの料金体系を徹底解説|無料プランからAPI課金まで完全ガイド
DeepSeekは中国のAIスタートアップDeepSeek社が開発した大規模言語モデルで、2024年末から2025年にかけて「GPT-4レベルの性能をはるかに低いコストで実現した」として世界中から注目を集めました。2026年6月時点では最新世代のDeepSeek-V4系(V4-ProおよびV4-Flash)がリリースされており、長文脈推論・コーディング・エージェント用途に最適化されています。特に気になるのが料金の安さです。ChatGPTやClaudeといった競合サービスと比べてどこが無料で、どこから有料になるのか、APIを使う場合はいくら課金されるのか——本記事ではDeepSeekの料金体系を、チャット利用・API利用・キャッシュ割引・企業導入コストまで網羅的に解説します。
DeepSeekの料金の基本構造:まず「無料」で何ができるか
DeepSeekの最大の特徴は、チャットサービスが完全に無料という点です。chat.deepseek.comにアクセスしてアカウントを作成すれば、DeepSeek-V4-Flashを中心とした現行モデルを追加費用なしで利用できます。なお、消費者向けチャットにはChatGPT PlusやClaude Proのような有料の個人サブスクリプションプランは存在しません。課金はAPIの従量制のみです。
- DeepSeek Chat(chat.deepseek.com / 公式アプリ):完全無料。ブラウザ・スマホアプリから利用可能。混雑時は「Server Busy」表示によるスロットリングあり。
- APIアクセス:有料(トークン単位の従量課金)。
- モデルのオープンウェイト版:MITライセンスで無料ダウンロード・ローカル実行可能。ただし自前のGPUインフラが必要。
つまりDeepSeekの料金は「チャット利用は無料、API利用は有料、自前インフラでのオープンウェイト運用は無料だがコストは自己負担」という三層構造で理解するのが正確です。
チャット利用
無料
アカウント登録のみ
API利用
従量課金
トークン単位・残高制
オープンウェイト運用
モデル無料
インフラコストは自己負担
DeepSeek-V4とは:最新モデルの構成と特徴
2026年6月時点のDeepSeek現行世代はDeepSeek-V4系です。2026年4月24日にリリースされた本世代は、長文脈推論・コーディング・エージェントタスクへの対応強化を主眼に置いており、用途別に2つのバリアントが提供されています。
DeepSeek-V4-Pro
総パラメータ:1.6T(1兆6,000億)MoE
活性化パラメータ:約49B
コンテキスト:最大1Mトークン(出力最大384K)
位置付け:現行フラッグシップ。高精度な長文脈推論・コーディング・マルチステップエージェント向け。thinking(推論)モード対応
DeepSeek-V4-Flash
総パラメータ:284B MoE
活性化パラメータ:約13B
コンテキスト:最大1Mトークン(出力最大384K)
位置付け:軽量・低コストの主力。thinking/non-thinking両モード対応。消費者向けチャットの既定モデル(Instant/Expertモードで提供)
どちらもMoE(Mixture of Experts)アーキテクチャを採用しており、総パラメータ数は大きい一方で推論時に活性化されるパラメータは限定的です。これがDeepSeekの高性能・低コストを両立させる核心的な設計思想です。両モデルともMITライセンスでHugging Face / GitHubに公開されており、自己ホスト・商用利用が可能です。
DeepSeek APIの料金一覧(2026年最新)
APIを利用する場合、DeepSeekのプラットフォーム(platform.deepseek.com)で残高をチャージし、使用量に応じて消費します。料金は入力トークン(Input)と出力トークン(Output)で別建てとなっており、入力の方が安く設定されています。
さらに重要なのが「キャッシュヒット(Cache Hit)」割引です。同じプレフィックス(システムプロンプトや前段のコンテキスト)が繰り返し使用される場合、DeepSeekのサーバーがキャッシュから読み込むため、大幅に安い単価が適用されます。これはAPI利用コストを実際に大きく下げる要素です。
DeepSeek-V4-Pro の料金
V4-Proは現行フラッグシップです。下記の価格は75%割引のプロモーション価格であり、プロモーション終了後の標準価格は入力(キャッシュミス)$1.74/出力$3.48となります。実装時はプロモ終了後の価格変動を考慮した設計を推奨します。出典:DeepSeek API Pricing
| トークン種別 | 料金(1Mトークンあたり) | 備考 |
|---|---|---|
| 入力(キャッシュヒット) | $0.003625 | 同一プレフィックスの再利用時 |
| 入力(キャッシュミス) | $0.435 ※プロモ価格 | 初回リクエストや新規コンテキスト。標準価格は$1.74 |
| 出力 | $0.87 ※プロモ価格 | 生成トークン全体に適用。標準価格は$3.48 |
DeepSeek-V4-Flash の料金
V4-Flashは低コスト・高速処理を重視した軽量主力モデルです。消費者向けチャットの既定モデルでもあり、大量のバッチ処理や軽量タスクにおいて特に優れたコストパフォーマンスを発揮します。
| トークン種別 | 料金(1Mトークンあたり) | 備考 |
|---|---|---|
| 入力(キャッシュヒット) | $0.0028 | 同一プレフィックスの再利用時 |
| 入力(キャッシュミス) | $0.14 | 初回リクエストや新規コンテキスト |
| 出力 | $0.28 | 生成トークン全体に適用 |
旧APIエンドポイント(legacy)について
旧来のAPIエンドポイント名 deepseek-chat および deepseek-reasoner は2026年7月24日(15:59 UTC)をもって廃止予定です。現在は経過措置として、それぞれV4-FlashのNon-thinkingモード/Thinkingモードにマッピングされています。新規開発では現行のAPI名 deepseek-v4-flash・deepseek-v4-pro を使用してください。
| 旧エンドポイント名 | 現行マッピング先 | 廃止予定日 |
|---|---|---|
deepseek-chat |
deepseek-v4-flash(Non-thinkingモード) |
2026-07-24 |
deepseek-reasoner |
deepseek-v4-flash(Thinkingモード) |
2026-07-24 |
ChatGPT・Claudeとの料金比較
DeepSeekの料金的なインパクトを理解するには、主要競合との比較が欠かせません。以下は2026年時点の代表的なモデルの入出力料金の比較です(いずれも1Mトークンあたり・USD)。DeepSeek-V4-Proの値はプロモーション価格を記載しています。
| モデル | 入力料金(キャッシュミス) | 出力料金 | 特徴 |
|---|---|---|---|
| DeepSeek-V4-Pro | $0.435 ※プロモ | $0.87 ※プロモ | 現行フラッグシップ・長文脈推論・エージェント |
| DeepSeek-V4-Flash | $0.14 | $0.28 | 軽量・低コスト主力(チャット既定モデル) |
| GPT-4o(OpenAI) | $2.50 | $10.00 | マルチモーダル対応 |
| GPT-4o mini(OpenAI) | $0.15 | $0.60 | 軽量・低コスト版 |
| o1(OpenAI) | $15.00 | $60.00 | 推論特化(競合) |
| Claude 3.5 Sonnet(Anthropic) | $3.00 | $15.00 | コーディング・長文処理に強み |
| Gemini 1.5 Pro(Google) | $1.25 | $5.00 | 長コンテキスト対応 |
この比較からわかる重要な事実がいくつかあります。
- DeepSeek-V4-Pro(プロモ価格)はGPT-4oの約1/6のコストで同水準のタスクをこなせるケースがある。プロモ終了後の標準価格(入力$1.74/出力$3.48)でも競争力は維持される。
- DeepSeek-V4-FlashはGPT-4o miniとほぼ同価格帯でありながら、最大1Mトークンの長コンテキストとthinkingモードに対応しており、軽量・高速処理向けの強力な選択肢となっている。
- V4-Proのthinkingモードは、OpenAIのo1(推論モデル)と比較しても大幅に低コストであり、推論タスクにおけるコスト破壊力が特に大きい。

APIの支払い方法と残高管理の仕組み
DeepSeekのAPIはプリペイド(前払い)残高制を採用しています。後払いのサブスクリプションではなく、先に残高をチャージしてから消費する方式です。
チャージ手順の概要
- platform.deepseek.comにログイン
- 「Top Up」(残高チャージ)メニューから金額を選択
- クレジットカード(Visa・Mastercardなど)で決済
- チャージ完了後、APIキーを取得して利用開始
残高は使用量に応じてリアルタイムで消費されます。残高が不足するとAPIがエラーを返すため、本番環境では残高アラート設定を活用することを強く推奨します。
レート制限(Rate Limits)について
無制限にAPIを叩けるわけではなく、アカウントのティアによってRPM(1分あたりのリクエスト数)・TPM(1分あたりのトークン数)・RPD(1日あたりのリクエスト数)に制限があります。初期状態では比較的低い制限が設定されており、残高チャージ額や利用実績に応じて上限が引き上げられる仕組みになっています。大規模な商用利用を検討する場合は、事前にDeepSeekサポートへの問い合わせが必要になる場合があります。
無料で利用できるオープンウェイト版の実態とコスト
DeepSeek-V4-ProおよびV4-FlashのモデルウェイトはMITライセンスでHugging Faceなどに公開されており、ダウンロードしてローカルまたはプライベートクラウド上で動かすことができます。この場合、DeepSeekへのAPI料金は一切発生しません。ただしオープンウェイトだからといって「完全に無料」というわけではなく、実行インフラのコストが別途かかります。
主なモデルサイズと必要インフラの目安
| モデル | パラメータ数 | 必要GPU VRAM(推論時の目安) | 用途 |
|---|---|---|---|
| DeepSeek-R1-Distill-Qwen-7B | 7B | 約8〜16GB | 個人・小規模利用 |
| DeepSeek-R1-Distill-Qwen-32B | 32B | 約48〜80GB(複数GPU推奨) | 中規模開発・研究 |
| DeepSeek-V4-Flash(フル) | 284B(MoE・活性約13B) | 複数A100/H100クラス推奨 | 中〜大規模商用・研究機関 |
| DeepSeek-V4-Pro(フル) | 1.6T(MoE・活性約49B) | 複数H100/H800クラス必須 | 大規模商用・研究機関 |
7Bや14Bクラスの蒸留(Distill)モデルであれば、コンシューマー向けGPU(RTX 4090など)やクラウドGPUインスタンス(A10G等)でも動作します。一方、フルサイズのDeepSeek-V4-Pro(総1.6T・MoEアーキテクチャ)を自前で動かすには、複数のH100クラスGPUが必要となり、クラウドで用意する場合でも月数万〜数十万円規模のインフラコストがかかります。V4-Flash(総284B・MITライセンス公開済み)は比較的少ないリソースで運用できますが、それでも相応のGPU環境が前提となります。
「APIよりオープンウェイトの方が安い」とは限らないという点は、特に小〜中規模利用者に重要なポイントです。利用量が少ない段階では、DeepSeek APIの従量課金の方がトータルコストを抑えられることがほとんどです。
サードパーティ経由でDeepSeekを使う場合の料金
DeepSeekのモデルはDeepSeek公式API以外に、複数のクラウドプラットフォームやAPIアグリゲーターを通じても利用できます。それぞれ料金設定が異なります。
| プラットフォーム | 提供形態 | 料金傾向 | 向いているケース |
|---|---|---|---|
| DeepSeek 公式API | platform.deepseek.com | 最安値帯・プリペイド制 | コスト最優先の開発者 |
| Amazon Bedrock | AWSマネージドAPI | 公式より若干高め | AWS環境に統合したい企業 |
| Azure AI Foundry | Microsoftクラウド経由 | 公式より若干高め | Azure環境・Entra ID連携 |
| OpenRouter | APIアグリゲーター | 公式と同等〜やや高め | 複数モデルを統一APIで使いたい場合 |
| Together AI / Fireworks AI | 推論特化クラウド | 競争的価格帯 | 高スループットが必要な場合 |
企業利用でAWSやAzureにすでにコミットメント(前払い枠)がある場合、それらのプラットフォーム経由の方が実質コストを低く抑えられる場合もあります。ただし単純な料金比較ではDeepSeek公式APIが最も安いのが一般的です。
DeepSeekを安く使うための実践的なコスト最適化
DeepSeek APIを実際のシステムに組み込む際、料金を最小化するために意識すべきポイントをまとめます。
1. プロンプトキャッシュを積極的に活用する
DeepSeekのキャッシュヒット割引(V4-Proで入力が$0.435→$0.003625、V4-Flashでは$0.14→$0.0028)は非常に強力です。システムプロンプトや長い前文を固定化し、可変部分をメッセージの後方に置く設計にするだけで、入力コストを大幅に削減できます。チャットボットや文書処理パイプラインでは特に効果的です。
2. タスクに合ったモデルを選ぶ
すべてのタスクにV4-Proを使う必要はありません。一般的なテキスト生成・要約・分類・翻訳にはV4-Flashで十分なケースがほとんどです。V4-Proは長文脈処理・複雑なエージェントタスク・高度なコーディングに、V4-ProまたはV4-FlashのThinkingモードは数学・論理・コード推論など複数ステップの思考が必要な場合に限定することで、コストを大幅に抑えられます。
3. 出力トークン数を上限制御する
APIパラメータのmax_tokensを適切に設定し、不必要に長い回答を生成させないようにします。特にThinkingモードは思考過程も課金対象になるため、タスクに応じた上限設定が重要です。
4. バッチ処理でレート制限を活用する
リアルタイム性が不要な処理(大量文書の一括処理など)は、レート制限内でバッチ処理する設計にすることで、インフラコストを抑えながら安定して運用できます。
5. 蒸留モデルのローカル運用を検討する
利用頻度が非常に高く、かつGPUインフラがすでに存在する場合は、7B〜14Bクラスの蒸留モデルをローカルで動かすことで、APIコストをゼロにできる可能性があります。ただしクオリティトレードオフを事前に評価することが必須です。

企業・法人利用における追加コストと注意点
DeepSeekを業務システムに本格導入する場合、APIの従量課金以外にも考慮すべきコスト・リスクがあります。
データプライバシーとコンプライアンスコスト
DeepSeekは中国企業が運営しており、サーバーは中国国内にも存在します。個人情報・機密情報を含むデータをDeepSeek公式APIに送信することに対して、GDPRや日本の個人情報保護法の観点から懸念を示す組織もあります。このリスクに対応するため、以下のような追加コストが発生する場合があります。
- AWSやAzure経由のマネージドDeepSeek APIを使うことで、データが国内・EU内リージョンに留まる構成を採用する(コストは上がる)
- オープンウェイトモデルをオンプレミス・プライベートクラウドで運用してデータを外部に出さない(インフラコストが発生)
- 法務・情報セキュリティ部門によるリスク評価コスト
サービス可用性リスク
DeepSeekは2025年初頭、急激なトラフィック増加によりAPIアクセスが不安定になる事態が発生しました。商用システムでの利用では、APIダウン時のフォールバック先(例:OpenAIやAzure OpenAIへの切り替え)を設計しておくことが重要です。このフォールバック設計の工数も広義のコストとして計上すべきです。
エンタープライズプランについて
2026年6月時点では、DeepSeekは明示的な「エンタープライズプラン」や「SLA保証付きプラン」を公式には提供していません。大規模利用やSLA保証が必要な場合は、AWSやAzureなどの大手クラウドプロバイダー経由でDeepSeekモデルを利用する方が現実的です。
まとめ
DeepSeekの料金体系は、大きく「チャット利用は完全無料・API利用は従量課金・オープンウェイト版はインフラ自己負担で無料」の三層構造です。消費者向けチャットには有料の個人サブスクリプションプランは存在せず、課金はAPIの従量制のみです。2026年6月時点の現行世代はDeepSeek-V4系で、フラッグシップのV4-Pro(総1.6T・活性約49B・1Mコンテキスト)と軽量主力のV4-Flash(総284B・活性約13B・1Mコンテキスト)の2バリアントが2026年4月24日にリリースされています。API料金はV4-Proが入力$0.435(プロモ価格、標準$1.74)/出力$0.87(標準$3.48)、V4-Flashが入力$0.14/出力$0.28(いずれも1Mトークンあたり・キャッシュミス時)と、GPT-4oやClaude 3.5 Sonnetと比較して大幅に低コストです。
一方で、キャッシュヒット割引の活用・モデル選定の最適化・プリペイド残高管理・V
参考文献
関連記事
監修
河合 継(クリスタルメソッド株式会社 代表取締役)
AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について | 編集方針
Study about AI
AIについて学ぶ
-
Meta インド データセンター AIインフラ——Reliance 168MW契約の深層と日本企業の実務対応
Meta インド データセンター AIインフラ——168MW契約の要点と背景 2026年6月9日、MetaはリライアンスIインダストリーズ(Reliance I...
-
ワーナー Sureel AI 音楽 著作権——買収の意味と日本企業への示唆
ワーナー Sureel AI 音楽 著作権——買収の要点と業界的意義 2026年6月10日、Warner Music Group(以下WMG)はAIスタートアッ...
-
Vector Lakebase ベクターDB RAG——Zillizが示す統合AIデータ基盤の論点
Vector Lakebaseとは何か——RAGデータ基盤をめぐる問い直し 2026年6月10日、ZillizはマネージドサービスZilliz Cloudをベー...