blog

Gemini API 料金の完全ガイド|モデル別単価・無料枠・最適化手法

Gemini API 料金の完全ガイド|モデル別単価・無料枠・最適化手法のイメージ

Gemini API 料金の構造を理解する:課金の3軸とエントリーポイント

Gemini API のコストは「モデルの種類」「モダリティ(テキスト/画像/音声/動画)」「コンテキスト長(200Kトークンを境に段階変動)」の3軸で決まる。この3要素を理解せずに本番設計に踏み込むと、想定外の請求が発生するリスクがある。

課金経路は大きく2つある。Google AI for Developers(AI Studio)経由は個人開発者・スタートアップに向いた構成であり、Google Cloud Vertex AI経由はエンタープライズのSLA・VPC連携・監査ログが必要な組織向けだ。2026年3月以降、Gemini APIの使用料金は300ドルのGoogle Cloudクレジットと統合される形に変更されており、請求フローが従来とは異なる(出典:課金 | Gemini API – Google AI for Developers)。どちらの経路を選ぶかは、セキュリティ要件・請求統合の方針・SLAの必要水準によって判断する。

さらに、2026年4月1日からは課金キャップの強制適用が開始された。それ以前は上限値が画面上に表示されていても実際には機能しないケースがあったが、現在は設定した予算上限に達した時点でAPIコールが即時遮断される(出典:Gemini API 課金制限2026年4月1日施行ガイド – Qiita)。本番運用では必ず上限を設定し、Cloud Monitoringのアラートと組み合わせた体制を整えることが前提条件となる。

Gemini API 料金の決定フローモデル選択Flash / Pro / Ultraモダリティテキスト/画像/音声/動画コンテキスト長200K超で単価倍増課金額確定入力+出力合計無料枠:RPM / TPM / RPD 以内は $0(Google AI Studio 経由。モデルによって有無が異なる)2026年4月1日〜:課金キャップ強制適用。上限超過でAPIコール即時遮断
図:Gemini API の料金決定フロー。モデル・モダリティ・コンテキスト長の3要素が課金額を規定し、2026年4月以降は課金キャップが強制適用される。

Gemini API 料金:モデル別・モダリティ別の入出力単価一覧(2026年6月時点)

以下の表は、Google AI for Developers 公式ドキュメントに基づく2026年6月時点の主要モデル料金だ。単価はすべて百万トークン(1M tokens)あたりのUSD表示であり、円換算は参考値として付記している(出典:Gemini Developer API の料金 – Google AI for Developers)。料金は変動する可能性があるため、実装前に必ず公式ページで最新値を確認すること。

モデル 無料枠 入力単価
($/1M tokens)
出力単価
($/1M tokens)
主な用途・特徴
Gemini 3.5 Flash
現行の既定モデル(2026-05-19リリース)
あり(制限付き) $1.50
(約225円)
$9.00
(約1,350円)
高速・低コスト。コーディング・エージェント系ベンチマークで3.1 Proを上回る
Gemini 3.1 Pro
1Mトークン長コンテキスト
なし $2.00(〜200K)
$4.00(超過)
$12.00(〜200K)
$24.00(超過)
高精度タスク・長文書処理。Google AI Pro に含まれる
Gemini 3 Flash あり(制限付き) $0.50
(約75円)
$3.00
(約450円)
軽量・汎用。コスト重視のプロダクション向け
Gemini 3.1 Flash-Lite あり $0.25(テキスト/画像/動画)
$0.50(音声)
$1.50
(約225円)
最低コスト。大量スループット・シンプルな分類・抽出に最適
Gemini 3 Flash-Lite あり(制限付き) $0.25
(約38円)
$1.50
(約225円)
軽量ライト版。単純タスクの大量処理向け

出典:Gemini Developer API の料金 – Google AI for DevelopersGemini APIの料金は?無料で使える範囲や使い方 – SHIFT AI(2026年6月時点)。円換算は参考値。

モデル選択の軸を整理すると、スループット最優先かつ単純タスクには Flash-Lite($0.25/$1.50)、コスト・性能バランス重視には 3 Flash($0.50/$3.00)、エージェント・コーディング系で速度も求めるなら 3.5 Flash($1.50/$9.00)、長大な文書処理・高精度推論が必要なら 3.1 Pro($2.00/$12.00〜)、という選択肢になる。なお Gemini 1.5 / 2.5 系はレガシー扱いとなっており、新規実装では現行モデルへの移行を前提とした設計を推奨する。

Vertex AI 経由では、グローバル以外のエンドポイントに対し Gemini 3 以降のモデルファミリーの料金が2026年7月1日より有効となるため、リージョン設計と合わせた移行前後の単価確認が欠かせない(出典:Agent Platform での AI モデルの構築とデプロイの費用 – Google Cloud)。

他のLLM APIとの詳細な料金比較はGemini料金の詳細比較およびClaude Code API料金との比較に整理しているので参照されたい。

Gemini API の無料枠:制限の実態と本番移行の判断基準

Google AI Studio(AI for Developers)経由では、一定条件下でGemini APIを無料で利用できる。制限はRPM(Requests Per Minute)・TPM(Tokens Per Minute)・RPD(Requests Per Day)の3指標で管理されており、モデルごとに異なる設定値が定められている。たとえば Gemini 3.1 Flash-Lite には無料枠が存在するが、Gemini 3.1 Pro Preview には無料枠がない(出典:Gemini APIの料金は?無料で使える範囲や使い方 – SHIFT AI)。

無料枠を使う際に実装レベルで押さえておくべき点は以下の通りだ。

  • HTTP 429 エラーへの対処:レート制限に達するとHTTP 429が返却される。指数バックオフ(Exponential Backoff)によるリトライロジックを実装していないと、スパイク発生時に処理が止まる。
  • 無料枠でのデータ利用ポリシー:Google のサービス利用規約上、無料枠での入力データはモデル改善に使用される場合がある。個人情報・営業秘密・機密設計情報を含むリクエストは、有料プランかつ適切なデータ処理補足条項(DPA)のもとで扱うことが必須だ。
  • 課金キャップの強制適用(2026年4月1日〜):上限到達時点でAPIが即時停止する。本番では上限値を余裕をもって設定し、Cloud Monitoringアラートと組み合わせて予算消化率を継続監視する体制が前提となる。
  • フリートライアルクレジットの消費順序:Google Cloud の課金アカウントと紐付けた後、フリートライアルクレジットが残存している場合はそちらが優先消費される。クレジット残量を見誤ると予期しないタイミングで有料切り替えが発生する。

無料枠はあくまでプロトタイピング・機能評価の用途に限定するべきであり、本番トラフィックを流すためのものではない。月間コスト試算の方法や無料枠を活用した段階的な検証フローについては、Gemini無料枠の活用方法で詳しく解説している。

消費者向けサブスクリプション(Google AI Plus $7.99/月・Google AI Pro $19.99/月・Google AI Ultra $99.99/月)はAPI利用とは完全に別の料金体系だ(出典:Gemini subscriptions – GoogleGoogle AI subscriptions – Google公式ブログ)。Google AI Pro に加入していても、開発者向けAPIのトークン課金は別途発生する。この2つを混同したまま予算設計すると、エンジニアリングコストの見積もりに重大な誤差が生じる。

Gemini API 料金を最適化するアーキテクチャ設計の指針

コスト削減において最も即効性が高いのは「モデルの選択」だ。単純なテキスト分類・要約・抽出に Gemini 3.1 Pro を使う理由はなく、Flash-Lite で十分なケースが大半を占める。ただし、精度要件とコストのトレードオフは実際のタスクで検証しなければわからないため、まずAI Studioで比較評価を行い、その結果をもとにモデルを固定する手順が現実的だ。

ルーティングアーキテクチャは中〜大規模な実装で特に有効だ。軽量モデル(Flash-Lite等)でまずリクエストの複雑度・意図を分類し、単純処理はそのまま軽量モデルで完結させ、高度な推論が必要と判断されたリクエストのみ上位モデルに転送する設計は、全体コストを大幅に抑えられる。

Batch API の活用も検討に値する。Google Cloud Vertex AI の Batch API では非同期処理による単価割引が適用されるケースがあり、夜間のデータ加工・大量文書のインデックス生成・オフライン評価パイプラインといったリアルタイム応答が不要な処理には積極的に活用すべきだ(出典:Agent Platform での AI モデルの構築とデプロイの費用 – Google Cloud)。

コンテキスト長の管理は Gemini 3.1 Pro を使う場合の最重要コスト変数だ。200Kトークンを超えた瞬間に入力単価が倍増する($2.00→$4.00)。RAGアーキテクチャでベクトル検索を組み合わせ、プロンプトに注入する情報を必要最小限に絞る設計は、この段階課金を避けるうえで直接的に効く。

出力トークン数の制御も見落としがちなコスト因子だ。出力単価は入力単価より高く設定されていることが多い(3.1 Pro の例では入力$2.00に対し出力$12.00)。プロンプト設計の段階から、「JSON形式で最大5項目」「200字以内で要約」など出力量を明示的に制限する指示を入れると、余分なトークン生成を抑制できる。

音声入力のモダリティ変換も実装上のコスト最適化手法だ。Gemini 3.1 Flash-Lite では音声入力が $0.50/1M tokens と、テキスト・画像・動画($0.25/1M)の2倍の単価になる。コール量が多いアプリケーションでは、事前にWhisper等で文字起こしを行い、テキストとして送信する設計のほうがトータルコストで有利になるケースがある。この判断は音声の長さ・処理量・文字起こしAPIのコストも含めて総合的に試算する必要がある。

Gemini CLI を使った開発検証フローについてはGemini CLI活用ガイドで詳しく説明している。Deep ResearchやCanvasなどの高度機能の実装事例についてはGemini Deep ResearchGemini Canvasを、モデルごとの性能差の詳細はGeminiモデル比較を参照されたい。また、Gemini全体の活用方針についてはGemini活用の総合ガイドにまとめている。

弊社が開発するDeepAIは、実在の人物の容姿・表情・声・振る舞いをデジタル空間で再現するバーチャルヒューマン/AIアバターソリューションであり、リップシンクや対話AI・RAGを組み合わせた接客・研修・広報用途への活用を推進している。LLM APIとのコスト設計・統合アーキテクチャを検討されている場合は、弊社ソリューションページもあわせてご確認いただきたい。


まとめ

  • Gemini API の料金はモデル・モダリティ・コンテキスト長の3軸で決まる
  • 現行既定モデルは Gemini 3.5 Flash(入力$1.50・出力$9.00/1M)、最低コストは Flash-Lite(入力$0.25・出力$1.50/1M)
  • Gemini 1.5/2.5 はレガシー。新規実装では現行モデルを選択する
  • 無料枠はプロトタイピング専用。本番では課金キャップの設定とモニタリングアラートが必須
  • コスト最適化にはモデルルーティング・Batch API・コンテキスト管理・出力量制御の4つが有効
  • 消費者向けサブスクリプション(Plus/Pro/Ultra)とAPIトークン課金は完全に別体系であり、混同しない

参考文献

関連記事

監修

河合 継(クリスタルメソッド株式会社 代表取締役)

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について編集方針

AIブログ購読

 
クリスタルメソッドがお届けする
AIブログの更新通知を受け取る

Study about AI

AIについて学ぶ

  • Claude企業導入「AI専門センター」戦略——Wipro事例から日本企業が学ぶべきこと

    Claude企業導入「AI専門センター」戦略——Wipro事例から日本企業が学ぶべきこと

    WiproのClaude専用AI専門センター開設——何が起きたか 2026年6月16日、インドIT大手Wipro(NYSE: WIT)は、AnthropicのC...

  • Cursor SpaceX買収が示すAIコーディングツール企業導入の転換点

    Cursor SpaceX買収が示すAIコーディングツール企業導入の転換点

    Cursor SpaceX買収の要点――何が起きたのか 2026年4月、SpaceX(xAI統合済み)はAIコーディングスタートアップ「Cursor」(運営会社...

  • Claude Max 利用制限の契約トラブルを企業導入前に防ぐ——Anthropic提訴が示すリスク

    Claude Max 利用制限の契約トラブルを企業導入前に防ぐ——Anthropic提訴が示すリスク

    Claude Max 利用制限訴訟の要点——何が問題とされたのか 2026年6月、AnthropicはClaude AIのMaxサブスクリプションプランの使用上...

View more