blog
AIブログ
claude code api 料金|2026年版ガイド
Claude Code API料金を徹底解説|従量課金の仕組みから実務コスト管理まで
Claude Codeは、Anthropicが提供するターミナルベースのAIコーディングエージェントです。単なるコード補完ではなく、ファイルの読み書き・コマンド実行・Git操作まで自律的に行う強力なツールですが、APIを通じた従量課金モデルを採用しているため、使い方次第でコストが大きく変わります。本記事では、Claude Code API料金の仕組み・モデル別単価・実際の消費トークン量・コスト最適化の実践テクニックまでを一本で網羅します。自社でClaude Codeを日常業務に組み込んでいる実務経験をもとに、できるだけ具体的な数字と設定例を交えながら解説します。
Claude CodeのAPIコスト構造の基本
Claude Codeは大きく分けて2つの動作モードがあり、料金の発生源が異なります。
- Claudeサブスクリプション(claude.ai Pro/Max)経由の利用:月額定額のサブスクリプションに含まれる使用枠を消費する。APIキーを自分で持つ必要がない。
- Anthropic APIキーを直接使用する利用:自分のAnthropicアカウントのAPIクレジットを消費する。完全な従量課金。
本記事が主に扱うのは後者のAPI直接利用です。ここでのコストは「入力トークン数 × 入力単価」+「出力トークン数 × 出力単価」で計算されます。Claude Codeが内部でやり取りするメッセージすべてがトークンとしてカウントされるため、単純な「1往復」のチャットとは全く異なるスケールのトークンが消費されます。
トークン料金の計算式
+(出力トークン数 ÷ 1,000,000)× 出力単価
+(キャッシュ書き込みトークン数 ÷ 1,000,000)× キャッシュ書き込み単価
+(キャッシュ読み込みトークン数 ÷ 1,000,000)× キャッシュ読み込み単価
モデル別API単価一覧(2025年時点)
Claude Codeが使用するモデルは主にClaude 3.5 Sonnet / Claude 3.7 Sonnet / Claude Opus 4などですが、設定によって切り替えが可能です。以下はAnthropicが公式に公開している代表モデルの料金です(単価はすべて100万トークンあたりのUSD)。
| モデル名 | 入力 ($/1M tokens) |
出力 ($/1M tokens) |
キャッシュ書き込み ($/1M tokens) |
キャッシュ読み込み ($/1M tokens) |
|---|---|---|---|---|
| Claude Opus 4 | $15.00 | $75.00 | $18.75 | $1.50 |
| Claude Sonnet 4 | $3.00 | $15.00 | $3.75 | $0.30 |
| Claude 3.7 Sonnet | $3.00 | $15.00 | $3.75 | $0.30 |
| Claude 3.5 Haiku | $0.80 | $4.00 | $1.00 | $0.08 |
Claude Codeのデフォルトモデルはclaude-sonnet-4(またはclaude-3-7-sonnet-20250219)です。高精度が必要なリファクタリングや設計タスクにはOpus 4、軽量なスクリプト生成や反復作業にはHaikuを使うと、コストを大幅に抑えられます。実務ではANTHROPIC_MODEL環境変数でデフォルトモデルを切り替えています。
Claude Codeが実際に消費するトークン量
Claude Codeの最大の特徴は、1回のユーザー指示に対して内部で複数回のAPIコールを発生させることです。通常のチャットと違い、以下のような処理が積み重なります。
- ファイルツリーの読み込み・検索(コンテキスト付与)
- ファイル内容の読み取り(大規模コードベースでは数万〜数十万トークン)
- 計画立案フェーズの思考トークン(Extended Thinking使用時)
- ツール呼び出し結果のフィードバックループ
- 最終回答の生成
自社での計測では、中規模のリファクタリングタスク(300行程度のファイル複数本)で1セッションあたり50,000〜150,000トークンを消費するケースが多く、Sonnetモデルで換算すると1タスク約$0.15〜$0.45ほどになります。一見安く見えますが、1日に10〜20タスクをこなすと月額数十ドルのコストが積み上がります。
タスク種類別の目安トークン消費量
| タスク種類 | 消費トークン目安 | Sonnet換算コスト | 特記事項 |
|---|---|---|---|
| 小さなバグ修正・単一ファイル | 5,000〜20,000 | $0.02〜$0.08 | 最もコスパ良好 |
| 中規模リファクタリング(3〜10ファイル) | 50,000〜150,000 | $0.20〜$0.60 | 実務で最多ケース |
| 新機能実装(設計〜テスト含む) | 100,000〜400,000 | $0.50〜$2.00 | Extended Thinking使用でさらに増加 |
| 大規模コードベース探索・解析 | 200,000〜600,000+ | $1.00〜$4.00+ | キャッシュ活用が必須 |
| Opus 4での同等タスク | 同上 | Sonnet比 約5倍 | 重要タスクに絞って使用推奨 |
Prompt Cachingによるコスト削減の仕組み
Claude CodeはAnthropicのPrompt Caching(プロンプトキャッシング)機能を自動的に活用します。これは、会話の中で繰り返し参照される長いコンテキスト(システムプロンプト・ファイル内容など)をキャッシュしておき、次回以降のAPIコールで再利用する機能です。
実務的なポイントとして、キャッシュは同一セッション内で最も効果を発揮します。Claude Codeを一度起動したまま複数のタスクを続けて行う(セッションを切らない)ことで、すでに読み込んだファイル群がキャッシュされ、以降のAPIコールでは入力トークンが大幅に安くなります。反対に、タスクのたびに/exitで終了して再起動を繰り返すと、毎回ゼロからキャッシュを構築するためコストが増加します。
なお、キャッシュの有効期限はAnthropicのデフォルトで5分間です。長い作業の合間に長時間放置するとキャッシュが失効するため注意が必要です。
サブスクリプションプランとAPIの使い分け
コスト観点でもう一つ重要なのが、claudeサブスクリプション経由で使うか、自前のAPIキーで使うかの選択です。
| プラン | 月額料金 | Claude Codeの利用制限 | APIキー不要? |
|---|---|---|---|
| Claude Pro | $20/月 | 使用枠あり・上限に達すると制限 | ✅ 不要 |
| Claude Max(5×) | $100/月 | Proの5倍の使用枠 | ✅ 不要 |
| Claude Max(20×) | $200/月 | Proの20倍の使用枠・ほぼ無制限 | ✅ 不要 |
| Anthropic API(従量課金) | 使った分のみ | レートリミット内であれば無制限 | ❌ APIキー必要 |
自社の実務経験から言うと、個人・少人数チームでの利用はMax $200プランが最もコスパが高くなるケースが多いです。ヘビーユースで月間APIコストが$200を超えるなら、サブスクリプションに切り替えたほうが安くなります。逆に、断続的な利用・チーム内で複数APIキーを管理したい・モデルを細かく切り替えたい場合は従量課金が柔軟です。
Maxプランが有利になるAPI消費量の目安
Sonnetモデルを前提に、月あたりのAPIコスト換算でMaxプランの月額を超える目安を計算すると次のようになります。
| 1日のタスク量 | 月間トークン消費目安 | Sonnetでの月額APIコスト | 推奨プラン |
|---|---|---|---|
| 軽め(5タスク) | 〜75M tokens | 〜$30 | Pro($20)または API |
| 標準(15タスク) | 〜200M tokens | 〜$80 | Max 5×($100) |
| ヘビー(30タスク以上) | 〜500M tokens+ | 〜$200+ | Max 20×($200) |
コストを増やす落とし穴と実務での注意点
Claude Codeを使いはじめると意外なところでトークンを大量消費しているケースがあります。実際に経験した主なコスト増加要因を挙げます。
① Extended Thinking(拡張思考)の意図せぬ有効化
Claude 3.7 SonnetやClaude Sonnet 4ではExtended Thinking(思考トークン)機能が使えます。これはモデルが内部で段階的に推論するプロセスをトークンとして消費するもので、有効にすると1タスクで思考トークンだけで数万〜数十万トークンが発生します。複雑な設計タスクでは精度が上がりますが、単純なバグ修正では不必要なコストになります。設定で--thinking-budgetを明示的に制限するか、タスクに応じて使い分けることを推奨します。
② コンテキストウィンドウの無駄な拡大
Claude Codeはcatコマンドやファイル読み込みツールで関係のないファイルを大量に読み込む場合があります。CLAUDEファイル(CLAUDE.md)にプロジェクトの構造や「このディレクトリは読まなくて良い」という指示を書いておくことで、不要なファイル読み込みを抑制できます。自社ではCLAUDE.mdに以下のような記述を入れています。
③ 長いコンテキストの引き継ぎによる肥大化
セッションを長く継続することはキャッシュ効率を上げる一方で、会話履歴が蓄積されるとコンテキストウィンドウが膨らみます。数時間にわたる長大なセッションでは、/compactコマンドで会話履歴を要約圧縮することでトークン消費を抑えられます。実務では1〜2時間ごとに/compactを入れる運用にしています。
④ サブエージェントの並列実行
Claude Codeのエージェントモード(--parallelや内部的なサブタスク分割)では、複数のサブエージェントが並行してAPIコールを発生させます。並列化はスピードを上げますが、コストも並列数に比例して増加します。コスト重視の運用では並列実行を慎重に使う必要があります。
コスト最適化のための実践設定
以下は自社で実際に取り入れているコスト削減の設定・運用です。
モデルを用途別に切り替える
環境変数またはコマンドラインオプションでモデルを指定できます。
使用量のモニタリング
Anthropic APIの利用状況はAnthropicコンソール(console.anthropic.com)のUsageページでリアルタイムに確認できます。プロジェクト別・APIキー別に消費量を分けることも可能なため、Claude Code専用のAPIキーを発行してモニタリングすることを推奨します。また、コンソールから使用量上限(Spend Limits)を設定することで、月間コストの暴走を防げます。
–print(非インタラクティブ)モードの活用
CI/CDパイプラインでClaude Codeを実行する場合、--printフラグを使ったバッチモードを利用することで、対話のオーバーヘッドを排除できます。自社ではGitHub ActionsでPR自動レビューにClaude Codeを組み込んでいますが、claude --print "このPRのコードをレビューして"形式で呼び出すことで、不要な会話ラウンドトリップなしに出力を取得しています。

Amazon BedrockやGoogle Cloud Vertex AI経由の料金との比較
Claude CodeはAnthropicのAPIだけでなく、Amazon Bedrock経由またはGoogle Cloud Vertex AI経由でも利用できます。ANTHROPIC_API_KEYの代わりにそれぞれのクラウド認証情報を使う構成です。
| プロバイダー | メリット | デメリット・注意点 |
|---|---|---|
| Anthropic直接API | 最新モデルにいち早くアクセス可・シンプル | セキュリティポリシー上、外部APIを使えない企業環境には不向き |
| Amazon Bedrock | AWS IAM統合・VPC内での利用可能・エンタープライズ向きコンプライアンス | モデル提供が若干遅れるケースあり・Bedrockの別途利用料体系 |
| Google Vertex AI | GCP統合環境での利用・Google Cloudの課金一本化が可能 | 設定がやや複雑・Vertex AI側のトークン料金が若干異なる場合あり |
料金体系はプロバイダーによって若干異なりますが、Sonnetクラスのモデルでは概ねAnthropicの直接API料金と近い水準になっています。エンタープライズ環境でのセキュリティ要件・既存クラウド契約の割引(EDP契約など)を考慮して選択してください。
まとめ
Claude Code API料金の要点を整理します。
- 料金構造:入力・出力トークンの従量課金。Prompt Cachingでキャッシュ読み込みは入力単価の10%になり、長いセッションで大きなコスト削減効果を発揮する。
- モデル選択:デフォルトのSonnet系で大半のタスクはカバーできる。Opusはコストが約5倍のため、重要度の高いタスクに絞って使う。
- サブスクリプションvs従量課金:ヘビーユーザーはMax $200プランが結果的に安くなるケースが多い。月間APIコスト試算を先に行うことが重要。
- コスト最適化:CLAUDE.mdによる不要ファイル読み込み抑制・
/compact定期実行・Extended Thinking予算の明示設定・用途別モデル切り替えが効果的。 - モニタリング:Anthropicコンソールで専用APIキーを発行し、Spend Limitsを設定しておくことでコスト暴走を防げる。
Claude Codeは正しく使えば人間エンジニアの作業を何倍にも加速しますが、コスト意識なしに使うと思わぬ請求につながります。タスクの重要度・規模に応じてモデルと利用形態を使い分け、Prompt Cachingを最大限に活用することが、長期的に費用対効果の高い運用につながります。
関連記事
Study about AI
AIについて学ぶ
-
claude code 権限設定|2026年版ガイド
Claude Code 権限設定の完全ガイド|実務で使える設定例と運用ノウハウ Claude Codeを業務で活用する際、最初の壁になるのが権限設定です。ファイ...
-
claude code 拡張機能|2026年版ガイド
Claude Code 拡張機能とは——できることと全体像 Claude Codeは、AnthropicのAIアシスタント「Claude」をターミナル上で動かす...
-
claude code 学習させない設定|2026年版ガイド
Claude Codeに学習させない設定とは何か Claude Codeを業務で使っていると「自分が入力したコードや会話内容がAnthropicのAI学習に使わ...