blog
AIブログ
Gemmaの料金は?無料で使う方法を解説【2026年版】
監修
河合 継(クリスタルメソッド株式会社 代表取締役)
AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について | 編集方針
Gemmaの料金と無料利用を完全解説|ライセンス・実コスト・活用方法まで
「Gemmaは無料で使えるのか」「商用利用にはコストがかかるのか」「どのプラットフォームで動かせばいいのか」——Googleが開発したオープンモデルGemmaの料金・ライセンス体系は、同社の商用APIサービスであるGemini APIとは根本的に異なります。結論から言えば、Gemmaのモデルウェイト自体は無償で公開されており、個人・商用を問わず利用できます。ただし「完全無料」と断言するには注意点があります。クラウドサービス上で動かす場合の計算コスト、利用規約上の制約、バージョンごとの違いなど、実際の導入前に把握しておくべき情報を本記事で網羅的に解説します。
Gemmaとは何か――基本を押さえる
Gemmaは、GoogleがGeminiと同じ研究・技術を基盤として開発したオープンウェイトの言語モデル群です。2024年2月の初版リリース以降、Gemma 2(2024年6月〜)、Gemma 3(2025年3月〜)と世代が更新され、2026年6月時点ではGemma 4が現行世代です(2026年3月31日リリース)。
Gemma 4はネイティブ・マルチモーダル(テキスト・画像・動画・音声)対応、最大256Kトークンの長文脈(中型以上)、140言語超の多言語サポートを備えた世代です。ラインナップはエッジ向けの軽量モデル(E2B・E4B)から高性能サーバー向けの旗艦モデル(31B Dense)まで幅広くカバーしています。また、Gemma 4では初めてApache 2.0ライセンスが採用されており、従来世代(Gemma 3以前)の独自「Gemma Terms of Use」から大きく前進しました。
| モデル名 | パラメータ規模 | 主な用途 | コンテキスト長 | ライセンス |
|---|---|---|---|---|
| Gemma 4 E2B | Effective 2B | モバイル・エッジ・ブラウザ向け超軽量推論 | 128K | Apache 2.0(無料) |
| Gemma 4 E4B | Effective 4B | モバイル・エッジ・ブラウザ向け軽量推論 | 128K | Apache 2.0(無料) |
| Gemma 4 12B Unified | 120億 | マルチモーダルの主力(テキスト・画像・動画・音声) | 256K | Apache 2.0(無料) |
| Gemma 4 26B A4B(MoE) | 260億(MoE) | 高スループット推論向け | 256K | Apache 2.0(無料) |
| Gemma 4 31B Dense | 310億 | 最大級の旗艦(サーバー〜ローカル両対応) | 256K | Apache 2.0(無料) |
旧世代のGemma 1・Gemma 2・Gemma 3はレガシーとして model card は残りますが、現行の主力ではありません。Gemma 4の全モデルはネイティブ・マルチモーダルに対応しており、量子化(INT4/INT8)を使うことで必要VRAMを大幅に削減できます。
GemmaはオープンモデルであってオープンソースではないOSSとの違い
Gemmaの料金・無料利用を理解するには、まずそのライセンス形態を正確に把握する必要があります。GemmaはGoogleが「オープンウェイト」と表現しており、モデルウェイト(重みパラメータ)が公開されているという点でオープンソースのLLMと似ています。現行のGemma 4はApache 2.0ライセンスで提供されており、Googleとの別途契約・特別許諾なしに商用利用・ファインチューニング後の再配布も可能です。なお、Gemma 3以前の旧世代は独自の「Gemma Terms of Use(Gemma利用規約)」での提供であった点に注意してください。
Gemma 4(Apache 2.0)の核心:何が無料で、何が制限されるか
Gemma 4のApache 2.0ライセンスおよびGemmaポリシーの主要なポイントは以下のとおりです。
- 個人・研究・開発利用:完全無料。モデルをダウンロードし、ローカルで動かし、研究論文を書くといった用途は費用不要。
- 商用利用:原則として無料で可能。Apache 2.0採用により、Googleとの特別契約不要で商用利用・再配布・ファインチューニングが可能。
- モデルの改変・ファインチューニング・再配布:可能。Apache 2.0の範囲内で自由に行える。
- 他のAIモデルの学習・改善への使用禁止:GemmaのアウトプットをGPT・Claude・LLaMAなど他社・他プロジェクトのモデル学習データとして使うことは利用ポリシー上禁止。
- 有害コンテンツ生成目的での使用禁止:違法コンテンツ、差別・暴力の助長、マルウェア生成、虚偽情報の大規模拡散など。
- 「Google」「Gemini」「Gemma」ブランドの無断使用禁止:派生モデルや製品名にGoogleのブランド名をそのまま使用することはできません。
つまりモデルそのものの利用料金は発生しません。スタートアップ・中小企業・個人開発者の大半にとって、Gemma 4は実質的に無料で商用利用できるモデルです。ただし「完全なオープンソース」ではなく「オープンウェイト」である点は理解しておく必要があります。重みファイルは公開されていますが、学習データや学習コード全体が公開されているわけではありません。
Gemma 3以前は独自の「Gemma Terms of Use」のもとでMAU 2億人超のサービスには別途契約が必要でした。Gemma 4からはApache 2.0が採用され、こうした規模制限なしにより自由な商用利用・再配布が可能となりました。これはオープンウェイトモデルのライセンス面における大きな前進です。
Gemmaのモデルウェイト取得にかかる費用はゼロ
Gemmaのウェイトは、主に以下の3つのルートから無料で入手できます。
アカウント作成・ライセンスへの同意後、モデルページ(google/gemma-4-12b など)からダウンロード。Transformersとの統合が容易で最も広く使われる配布経路。
Googleが運営するデータサイエンスプラットフォーム。アカウント登録と同意のみで全バリアントを無料ダウンロード可能。週30時間のGPU(T4/P100)も無料で利用できる。
ブラウザからすぐ試せる推論環境。一定の無料クォータが設定されており、コード不要で手軽に動作確認が可能。API経由での大量利用は有料プランが必要。
ウェイトのダウンロード自体に課金は一切ありません。ただしファイルサイズは大きく(例:Gemma 4 31B Dense のbfloat16版は相応のストレージを要します)、自前サーバーや開発PCのストレージ・帯域幅コストは自己負担となります。
Gemmaを無料で使える主なプラットフォームと比較
Gemmaを無料で使うルートは大きく分けて「ローカル実行」と「クラウド無料枠」の2系統があります。それぞれコスト・使いやすさ・制限が異なります。
| プラットフォーム | 費用 | GPU/計算資源 | 商用利用 | オフライン | おすすめ対象 |
|---|---|---|---|---|---|
| Ollama(ローカル) | 完全無料 | 自前CPU/GPU | ○ | ○ | プライバシー重視・個人開発 |
| LM Studio(ローカル) | 完全無料 | 自前CPU/GPU | ○ | ○ | 非エンジニア・GUI好み |
| Hugging Face(ダウンロード) | 無料 | 自前 | ○(Apache 2.0) | ○ | エンジニア・研究者 |
| Google AI Studio | 無料枠あり | クラウド | △(枠超過は有料) | × | 手軽に試したい人 |
| Google Colab(無料) | 無料(時間制限) | T4 GPU(共有) | ○ | × | 学習・検証 |
| Kaggle Notebooks | 無料(週30時間GPU) | T4/P100 | ○ | × | データサイエンティスト |
| Vertex AI(Google Cloud) | 従量課金(有料) | クラウドGPU | ○ | × | エンタープライズ |
Ollamaを使ってGemmaを無料でローカル起動する手順
最もシンプルにGemmaを無料で体験するには、Ollamaが最適です。Windows・macOS・Linuxで動作します。
コマンド1行で起動
ollama run gemma4:12bmacOS/Linux/Windows対応
API経由でアプリ連携も可
GUIで直感的に操作
モデル検索・ダウンロードも内蔵
OpenAI互換APIを提供
Windows/macOS対応
軽量・高速なC++実装
量子化(Q4/Q8)で低メモリ動作
組み込み・高カスタマイズ向け
全OS対応
- Ollamaをインストール:公式サイト(ollama.com)からインストーラーをダウンロードして実行。macOSならHomebrewで
brew install ollamaでも可。 - Gemmaモデルを起動:ターミナルを開き、
ollama run gemma4:12bを入力。初回はモデルファイルのダウンロードが発生。 - チャット開始:ダウンロード完了後、そのままターミナル上でチャットが開始されます。日本語での入力・回答も可能。
- API経由でアプリと連携(任意):OllamaはローカルでREST APIを提供(デフォルト:http://localhost:11434)。OpenAI互換APIとして既存アプリからも呼び出せます。
- モデルサイズを変える(任意):PC性能に応じて
gemma4:e4b(軽量エッジ向け)やgemma4:31b(最大旗艦)に切り替え可能。
Gemma 4 E2B/E4B → モバイル・エッジ向け設計のため低メモリ環境でも動作
Gemma 4 12B Unified → マルチモーダル主力。量子化版で標準的なGPU環境に収容可能
Gemma 4 26B A4B(MoE) → 高スループット推論向け。MoE構造で実効パラメータを抑制
Gemma 4 31B Dense → GPU(VRAM 32GB以上)または大型サーバー向け
これらのローカルツールはインターネット不要でGemmaを動かせるため、プライバシー重視の用途や社内データ処理に特に適しています。
Google ColabでGemmaを無料実行する手順
GPUを自前で持っていない場合、Google Colabの無料T4 GPUを使ってGemmaを動かせます。
- Google Colabにアクセスし、新規ノートブックを作成(Googleアカウント必要)。
- ランタイムのタイプを「T4 GPU」に変更(ランタイム → ランタイムのタイプを変更)。
- 以下のコードでライブラリをインストールし、モデルをロード。
# ライブラリのインストール
!pip install -q transformers accelerate
# Hugging Faceへのログイン(トークンが必要)
from huggingface_hub import login
login(token="YOUR_HF_TOKEN") # HFのアクセストークンを入力
# モデル読み込みと推論
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
model_id = "google/gemma-4-12b-it"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
model_id, torch_dtype=torch.bfloat16, device_map="auto"
)
# テキスト生成
inputs = tokenizer("AIとは何ですか?", return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=200)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
Hugging Faceのアクセストークンは、Hugging Faceアカウントの設定ページから無料で発行できます。Gemma 4はApache 2.0ライセンスのため、モデルページでの規約同意も従来より簡便です。
クラウドサービス経由で利用する場合の実質コスト
モデルウェイトは無料ですが、それを動かすインフラには費用がかかります。主要な利用パターンごとに整理します。
Google Cloud(Vertex AI)でのGemma利用料金
Vertex AI Model Gardenを通じてGemmaをホスティングする場合、モデルライセンス料は発生しませんが、GPUインスタンスの稼働時間に対するコンピューティング費用が発生します。
| 構成例 | GPUタイプ | 概算時間コスト(USD) | 備考 |
|---|---|---|---|
| Gemma 4 E2B / E4B | NVIDIA T4(16GB)×1 | $0.35〜$0.50/時間程度 | 軽量エッジ向け。推論のみなら小型インスタンスで対応可 |
| Gemma 4 12B Unified(量子化) | NVIDIA L4(24GB)×1 | $0.7〜$1.0/時間程度 | マルチモーダル主力。量子化で1枚に収容可 |
| Gemma 4 26B A4B(MoE) | NVIDIA L4(24GB)×1〜2 | $0.7〜$1.4/時間程度 | MoE構造で高スループット。量子化によるコスト削減が有効 |
| Gemma 4 31B Dense(フルprecision) | NVIDIA A100(40GB)×1〜2 | $2.9〜$5.8/時間程度 | 最大旗艦。長時間常時稼働はコスト注意 |
※上記はVertex AIの参考価格に基づく概算です。リージョン・インスタンスタイプ・割引契約(Committed Use)の有無によって変動します。最新の正確な料金はGoogle Cloud公式の料金ページでご確認ください。
Amazon SageMaker / AWS上でのGemma
AWSではAmazon SageMaker JumpStartからGemmaモデルをデプロイできます。料金体系はVertex AIと同様にインスタンス稼働時間課金となります。ml.g5.2xlarge(NVIDIA A10G 24GB)を使った場合、Gemma 4の軽量〜中型モデルで$1.2〜$1.5/時間程度が目安です。
Google AI Studioの無料枠と従量課金
Google AI Studioでは、Gemmaを含む一部モデルをAPI経由で試せる無料枠(Free tier)が提供されています。主な制約は以下のとおりです。
- レート制限(1分あたりのリクエスト数・トークン数)が厳しく、プロダクション利用には向かない
- 無料枠でのリクエストデータはGoogleのモデル改善に利用される可能性がある(利用規約に明記)
- Pay-as-you-go(従量課金)に切り替えると制限が緩和される
評価・プロトタイピング目的には十分な無料枠ですが、商用サービスへの組み込みや大量リクエスト処理には有料プランへの移行を検討する必要があります。
マネージドAPIでのGemma 4料金(従量課金)の詳細
Vertex AIやサードパーティプロバイダ経由でGemma 4モデルをAPI利用する場合の課金体系は、入力トークン数・出力トークン数に応じた従量課金となっています。OpenRouterでの公開情報を参考に示します。
| モデル | ブレンド単価目安(USD) | 備考 |
|---|---|---|
| Gemma 4 E2B / E4B(API経由) | $0.10前後/100万トークン程度 | 最軽量・最安価。エッジ/モバイル相当 |
| Gemma 4 12B Unified(API経由) | $0.20〜$0.40前後/100万トークン程度 | マルチモーダル主力。精度と費用のバランス |
| Gemma 4 26B A4B(API経由) | $0.10〜$0.70前後/100万トークン程度 | MoE構造。プロバイダによって幅あり(出典:OpenRouter) |
| Gemma 4 31B Dense(API経由) | プロバイダ依存(要確認) | 最大旗艦。最新料金は各プロバイダ公式を参照 |
※上記価格はOpenRouterをはじめとするサードパーティプロバイダの公開情報を元にした参考値です(USD基準、約15〜105円相当)。プロモーション・為替レート・プラン変更により変動します。契約前に必ず公式料金ページを確認してください。
これらの価格はOpenAI GPT-4o(入力$2.50/100万トークン〜)やAnthropicのClaude 3.5 Sonnet(入力$3.00/100万トークン〜)と比較すると大幅に安価です。軽量モデルで十分なユースケースであれば、コスト効率の高い選択肢となります。
Groq・Together AI等サードパーティAPIでのGemma料金
Googleの公式サービス以外にも、高速推論に特化したサードパーティプラットフォームがGemmaをAPI提供しています。
| プラットフォーム | 提供モデル例 | 入力単価目安 | 特徴 |
|---|---|---|---|
| Groq | Gemma 4 系他 | $0.10/100万トークン程度 | LPUによる超高速推論・無料枠あり |
| Together AI | Gemma 4 各サイズ | $0.27〜$0.90/100万トークン程度 | ファインチューニングAPIも提供 |
| Fireworks AI | Gemma 4 各サイズ | $0.20/100万トークン程度〜 | 低レイテンシ・エンタープライズ向け |
| OpenRouter | Gemma 4 複数バリアント | プロバイダ依存(仲介価格) | 単一APIで複数モデルを切替可能 |
Groqの無料枠は開発者にとって特に魅力的で、一定のレート制限内であればGemmaを含む複数モデルをコスト無しで試せます。スタートアップや個人開発者がMVP(最小実用製品)の検証に活用するケースが増えています。
Gemmaと他のオープンモデルのライセンス・料金比較
「無料で使えるオープンモデル」はGemma以外にも存在します。代表的なものとの比較を整理します。