blog

AIブログ

claude code api 料金｜2026年版ガイド

Claude Code API料金を徹底解説｜従量課金の仕組みから実務コスト管理まで

Claude Codeは、Anthropicが提供するターミナルベースのAIコーディングエージェントです。単なるコード補完ではなく、ファイルの読み書き・コマンド実行・Git操作まで自律的に行う強力なツールですが、APIを通じた従量課金モデルを採用しているため、使い方次第でコストが大きく変わります。本記事では、Claude Code API料金の仕組み・モデル別単価・実際の消費トークン量・コスト最適化の実践テクニックまでを一本で網羅します。自社でClaude Codeを日常業務に組み込んでいる実務経験をもとに、できるだけ具体的な数字と設定例を交えながら解説します。

Claude CodeのAPIコスト構造の基本

Claude Codeは大きく分けて2つの動作モードがあり、料金の発生源が異なります。

Claudeサブスクリプション（claude.ai Pro/Max）経由の利用：月額定額のサブスクリプションに含まれる使用枠を消費する。APIキーを自分で持つ必要がない。
Anthropic APIキーを直接使用する利用：自分のAnthropicアカウントのAPIクレジットを消費する。完全な従量課金。

本記事が主に扱うのは後者のAPI直接利用です。ここでのコストは「入力トークン数 × 入力単価」＋「出力トークン数 × 出力単価」で計算されます。Claude Codeが内部でやり取りするメッセージすべてがトークンとしてカウントされるため、単純な「1往復」のチャットとは全く異なるスケールのトークンが消費されます。

トークン料金の計算式

料金計算の基本式

    合計コスト ＝（入力トークン数 ÷ 1,000,000）× 入力単価

    　　　　　　＋（出力トークン数 ÷ 1,000,000）× 出力単価

    　　　　　　＋（キャッシュ書き込みトークン数 ÷ 1,000,000）× キャッシュ書き込み単価

    　　　　　　＋（キャッシュ読み込みトークン数 ÷ 1,000,000）× キャッシュ読み込み単価
  
※単価はモデルによって異なる。キャッシュは後述のPrompt Caching機能を使った場合のみ発生。

モデル別API単価一覧（2026年6月時点）

Claude Codeが使用するモデルは主にClaude Opus 4.8 / Claude Sonnet 4.6 / Claude Haiku 4.5などですが、設定によって切り替えが可能です。以下はAnthropicが公式に公開している代表モデルの料金です（単価はすべて100万トークンあたりのUSD）。

モデル名	入力（$/1M tokens）	出力（$/1M tokens）	キャッシュ書き込み（$/1M tokens）	キャッシュ読み込み（$/1M tokens）
Claude Opus 4.8	$5.00	$25.00	$6.25	$0.50
Claude Sonnet 5（現行Sonnet）	$3.00	$15.00	$3.75	$0.30
Claude Sonnet 4.6	$3.00	$15.00	$3.75	$0.30
Claude Haiku 4.5	$1.00	$5.00	$1.25	$0.10

Claude Sonnet 5 の導入価格：Anthropicは Sonnet 5 に 入力 $2.00 / 出力 $10.00（100万トークンあたり）の導入価格を 2026年8月31日まで適用しており、9月1日以降は上表の通常価格 $3.00 / $15.00 に戻る。モデルIDは claude-sonnet-5 で、拡張思考（extended thinking）は廃止され adaptive thinking と effort で制御する。Sonnet 4.6 は旧世代へ移行した。

Claude Codeのでは現行のClaudeモデル（claude-opus-4-8 / claude-sonnet-4-6 / claude-haiku-4-5）が利用できます。高精度が必要なリファクタリングや設計タスクにはOpus 4.8、軽量なスクリプト生成や反復作業にはHaiku 4.5を使うと、コストを大幅に抑えられます。実務ではANTHROPIC_MODEL環境変数でデフォルトモデルを切り替えています。

Claude Codeが実際に消費するトークン量

Claude Codeの最大の特徴は、1回のユーザー指示に対して内部で複数回のAPIコールを発生させることです。通常のチャットと違い、以下のような処理が積み重なります。

ファイルツリーの読み込み・検索（コンテキスト付与）
ファイル内容の読み取り（大規模コードベースでは数万〜数十万トークン）
計画立案フェーズの思考トークン（Extended Thinking使用時）
ツール呼び出し結果のフィードバックループ
最終回答の生成

自社での計測では、中規模のリファクタリングタスク（300行程度のファイル複数本）で1セッションあたり50,000〜150,000トークンを消費するケースが多く、Sonnetモデルで換算すると1タスク約$0.15〜$0.45ほどになります。一見安く見えますが、1日に10〜20タスクをこなすと月額数十ドルのコストが積み上がります。

タスク種類別の目安トークン消費量

タスク種類	消費トークン目安	Sonnet換算コスト	特記事項
小さなバグ修正・単一ファイル	5,000〜20,000	$0.02〜$0.08	最もコスパ良好
中規模リファクタリング（3〜10ファイル）	50,000〜150,000	$0.20〜$0.60	実務で最多ケース
新機能実装（設計〜テスト含む）	100,000〜400,000	$0.50〜$2.00	Extended Thinking使用でさらに増加
大規模コードベース探索・解析	200,000〜600,000+	$1.00〜$4.00+	キャッシュ活用が必須
Opus 4.8での同等タスク	同上	Sonnet比約1.7倍	重要タスクに絞って使用推奨

Prompt Cachingによるコスト削減の仕組み

Claude CodeはAnthropicのPrompt Caching（プロンプトキャッシング）機能を自動的に活用します。これは、会話の中で繰り返し参照される長いコンテキスト（システムプロンプト・ファイル内容など）をキャッシュしておき、次回以降のAPIコールで再利用する機能です。

キャッシュなし（通常入力）

$3.00

/1M tokens（Sonnet）

毎回フルで課金

→

キャッシュ読み込み

$0.30

/1M tokens（Sonnet）

通常入力の10%のコスト

＝

長セッションでの効果

最大90%

入力コスト削減

長いコンテキストほど恩恵大

実務的なポイントとして、キャッシュは同一セッション内で最も効果を発揮します。Claude Codeを一度起動したまま複数のタスクを続けて行う（セッションを切らない）ことで、すでに読み込んだファイル群がキャッシュされ、以降のAPIコールでは入力トークンが大幅に安くなります。反対に、タスクのたびに/exitで終了して再起動を繰り返すと、毎回ゼロからキャッシュを構築するためコストが増加します。

なお、キャッシュの有効期限はAnthropicのデフォルトで5分間です。長い作業の合間に長時間放置するとキャッシュが失効するため注意が必要です。

Claude Code・AIエージェントの業務導入をご検討の方は、自社での開発実例を公開しているクリスタルメソッドの無料相談をご利用ください。

サブスクリプションプランとAPIの使い分け

コスト観点でもう一つ重要なのが、claudeサブスクリプション経由で使うか、自前のAPIキーで使うかの選択です。

プラン	月額料金	Claude Codeの利用制限	APIキー不要？
Claude Pro	$20/月	使用枠あり・上限に達すると制限	✅ 不要
Claude Max（5×）	$100/月	Proの5倍の使用枠	✅ 不要
Claude Max（20×）	$200/月	Proの20倍の使用枠・ほぼ無制限	✅ 不要
Anthropic API（従量課金）	使った分のみ	レートリミット内であれば無制限	❌ APIキー必要

自社の実務経験から言うと、個人・少人数チームでの利用はMax $200プランが最もコスパが高くなるケースが多いです。ヘビーユースで月間APIコストが$200を超えるなら、サブスクリプションに切り替えたほうが安くなります。逆に、断続的な利用・チーム内で複数APIキーを管理したい・モデルを細かく切り替えたい場合は従量課金が柔軟です。

Maxプランが有利になるAPI消費量の目安

Sonnetモデルを前提に、月あたりのAPIコスト換算でMaxプランの月額を超える目安を計算すると次のようになります。

1日のタスク量	月間トークン消費目安	Sonnetでの月額APIコスト	推奨プラン
軽め（5タスク）	〜75M tokens	〜$30	Pro（$20）または API
標準（15タスク）	〜200M tokens	〜$80	Max 5×（$100）
ヘビー（30タスク以上）	〜500M tokens+	〜$200+	Max 20×（$200）

コストを増やす落とし穴と実務での注意点

Claude Codeを使いはじめると意外なところでトークンを大量消費しているケースがあります。実際に経験した主なコスト増加要因を挙げます。

① Extended Thinking（拡張思考）の意図せぬ有効化

Claude Sonnet 4.6やHaiku 4.5ではExtended Thinking（思考トークン）機能が使えます。これはモデルが内部で段階的に推論するプロセスをトークンとして消費するもので、有効にすると1タスクで思考トークンだけで数万〜数十万トークンが発生します。複雑な設計タスクでは精度が上がりますが、単純なバグ修正では不必要なコストになります。設定で--thinking-budgetを明示的に制限するか、タスクに応じて使い分けることを推奨します。

② コンテキストウィンドウの無駄な拡大

Claude Codeはcatコマンドやファイル読み込みツールで関係のないファイルを大量に読み込む場合があります。CLAUDEファイル（CLAUDE.md）にプロジェクトの構造や「このディレクトリは読まなくて良い」という指示を書いておくことで、不要なファイル読み込みを抑制できます。自社ではCLAUDE.mdに以下のような記述を入れています。

# Project Context
## Directories to AVOID reading
– node_modules/
– .git/
– dist/
– coverage/
## Key files to start with
– src/index.ts (entry point)
– src/types/ (type definitions)

③ 長いコンテキストの引き継ぎによる肥大化

セッションを長く継続することはキャッシュ効率を上げる一方で、会話履歴が蓄積されるとコンテキストウィンドウが膨らみます。数時間にわたる長大なセッションでは、/compactコマンドで会話履歴を要約圧縮することでトークン消費を抑えられます。実務では1〜2時間ごとに/compactを入れる運用にしています。

④ サブエージェントの並列実行

Claude Codeのエージェントモード（--parallelや内部的なサブタスク分割）では、複数のサブエージェントが並行してAPIコールを発生させます。並列化はスピードを上げますが、コストも並列数に比例して増加します。コスト重視の運用では並列実行を慎重に使う必要があります。

1年運用してわかった「コストが膨らむ瞬間」（一次情報）

監修者・河合継はClaude Codeを3.5の時代から1年以上、実務で運用してきた。単価表だけでは見えない、実際にコストが膨らんだ場面を補足する（金額そのものは変動するため、ここでは構造に絞る）。

セッションを延ばすほど、同じ依頼でも高くつく。会話が長引くと過去のやり取りが積み上がり、入力トークンが膨らむ。区切りで履歴をリセット・要約する習慣が、いちばん効いたコスト対策だった。
並列・自走はトークンを一気に使う。同時に多数を走らせたり長く自走させたりすると、消費が跳ねる。便利さに見合うかを規模で見積もり、止め時を決めてから回すと無駄が減った。
「上位モデルで重い思考」を常用しない。難所には効くが、定型作業まで最上位で回すと費用がかさむ。タスクに応じて軽いモデル・浅い思考に落とすメリハリが、月の総額を大きく左右した。

コスト最適化のための実践設定

以下は自社で実際に取り入れているコスト削減の設定・運用です。

モデルを用途別に切り替える

環境変数またはコマンドラインオプションでモデルを指定できます。

# 軽量タスク用（コスト重視）
export ANTHROPIC_MODEL=claude-haiku-4-5
# 標準タスク用（バランス重視）
export ANTHROPIC_MODEL=claude-sonnet-4-6
# 重要タスク用（精度重視）
export ANTHROPIC_MODEL=claude-opus-4-8

使用量のモニタリング

Anthropic APIの利用状況はAnthropicコンソール（console.anthropic.com）のUsageページでリアルタイムに確認できます。プロジェクト別・APIキー別に消費量を分けることも可能なため、Claude Code専用のAPIキーを発行してモニタリングすることを推奨します。また、コンソールから使用量上限（Spend Limits）を設定することで、月間コストの暴走を防げます。

–print（非インタラクティブ）モードの活用

CI/CDパイプラインでClaude Codeを実行する場合、--printフラグを使ったバッチモードを利用することで、対話のオーバーヘッドを排除できます。自社ではGitHub ActionsでPR自動レビューにClaude Codeを組み込んでいますが、claude --print "このPRのコードをレビューして"形式で呼び出すことで、不要な会話ラウンドトリップなしに出力を取得しています。

Amazon BedrockやGoogle Cloud Vertex AI経由の料金との比較

Claude CodeはAnthropicのAPIだけでなく、Amazon Bedrock経由またはGoogle Cloud Vertex AI経由でも利用できます。ANTHROPIC_API_KEYの代わりにそれぞれのクラウド認証情報を使う構成です。

プロバイダー	メリット	デメリット・注意点
Anthropic直接API	最新モデルにいち早くアクセス可・シンプル	セキュリティポリシー上、外部APIを使えない企業環境には不向き
Amazon Bedrock	AWS IAM統合・VPC内での利用可能・エンタープライズ向きコンプライアンス	モデル提供が若干遅れるケースあり・Bedrockの別途利用料体系
Google Vertex AI	GCP統合環境での利用・Google Cloudの課金一本化が可能	設定がやや複雑・Vertex AI側のトークン料金が若干異なる場合あり

料金体系はプロバイダーによって若干異なりますが、Sonnetクラスのモデルでは概ねAnthropicの直接API料金と近い水準になっています。エンタープライズ環境でのセキュリティ要件・既存クラウド契約の割引（EDP契約など）を考慮して選択してください。

まとめ

Claude Code API料金の要点を整理します。

料金構造：入力・出力トークンの従量課金。Prompt Cachingでキャッシュ読み込みは入力単価の10%になり、長いセッションで大きなコスト削減効果を発揮する。
モデル選択：デフォルトのSonnet系で大半のタスクはカバーできる。Opusはコストが約1.7倍のため、重要度の高いタスクに絞って使う。
サブスクリプションvs従量課金：ヘビーユーザーはMax $200プランが結果的に安くなるケースが多い。月間APIコスト試算を先に行うことが重要。
コスト最適化：CLAUDE.mdによる不要ファイル読み込み抑制・/compact定期実行・Extended Thinking予算の明示設定・用途別モデル切り替えが効果的。
モニタリング：Anthropicコンソールで専用APIキーを発行し、Spend Limitsを設定しておくことでコスト暴走を防げる。

Claude Codeは正しく使えば人間エンジニアの作業を何倍にも加速しますが、コスト意識なしに使うと思わぬ請求につながります。タスクの重要度・規模に応じてモデルと利用形態を使い分け、Prompt Cachingを最大限に活用することが、長期的に費用対効果の高い運用につながります。

監修

河合継（クリスタルメソッド株式会社代表取締役）

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について｜編集方針

Claude Code・AIエージェントの業務活用をご検討の方へ

クリスタルメソッドは、Claude Codeを実務投入している開発会社として、AIエージェント・社員AIの導入と開発効率化を支援しています。自社サイトの表示速度をAI社員（Claude Code）で12.89秒→2.03秒に短縮した実例も事例記事として公開しています。「自社の開発・業務にAIをどう組み込むか」といったご相談を承っています。

無料相談・お問い合わせ：ご相談はこちら

Study about AI

AIについて学ぶ

教育 AI 活用事例から学ぶ企業研修のDXとAnthropic無償提供が示すプロンプトの重要性

## 1. Anthropicによる教育者向けClaude無償提供ニュースの要点 2026年1月、AIスタートアップのAnthropicは、国際NGO「Teac...
AI人事評価のリスクと違法性の境界線とは？Meta社リストラ訴訟から学ぶ防衛策

近年、企業の意思決定プロセスにおいてAI（人工知能）の活用が急速に進んでいます。特に人事評価や採用、人員整理といった領域でのAI導入は、業務効率化や客観性の担保...
AIエージェントの相互運用性と規制がもたらす経営インパクト—米上院法案から紐解く日本企業の針路

自律的にタスクを遂行するAIエージェントの台頭に伴い、異なるシステムやプラットフォーム間でこれらを安全に連携させる「相互運用性」と、それを支える「規制」のあり方...