blog

AIブログ

Gemmaの料金は？無料で使う方法を解説【2026年版】

Gemmaの料金と無料利用を完全解説｜ライセンス・実コスト・活用方法まで

「Gemmaは無料で使えるのか」「商用利用にはコストがかかるのか」「どのプラットフォームで動かせばいいのか」——Googleが開発したオープンモデルGemmaの料金・ライセンス体系は、同社の商用APIサービスであるGemini APIとは根本的に異なります。結論から言えば、Gemmaのモデルウェイト自体は無償で公開されており、個人・商用を問わず利用できます。ただし「完全無料」と断言するには注意点があります。クラウドサービス上で動かす場合の計算コスト、利用規約上の制約、バージョンごとの違いなど、実際の導入前に把握しておくべき情報を本記事で網羅的に解説します。

Gemmaとは何か――基本を押さえる

Gemmaは、GoogleがGeminiと同じ研究・技術を基盤として開発したオープンウェイトの言語モデル群です。2024年2月の初版リリース以降、Gemma 2（2024年6月〜）、Gemma 3（2025年3月〜）と世代が更新され、2026年6月時点ではGemma 4が現行世代です（2026年3月31日リリース）。

Gemma 4はネイティブ・マルチモーダル（テキスト・画像・動画・音声）対応、最大256Kトークンの長文脈（中型以上）、140言語超の多言語サポートを備えた世代です。ラインナップはエッジ向けの軽量モデル（E2B・E4B）から高性能サーバー向けの旗艦モデル（31B Dense）まで幅広くカバーしています。また、Gemma 4では初めてApache 2.0ライセンスが採用されており、従来世代（Gemma 3以前）の独自「Gemma Terms of Use」から大きく前進しました。

モデル名	パラメータ規模	主な用途	コンテキスト長	ライセンス
Gemma 4 E2B	Effective 2B	モバイル・エッジ・ブラウザ向け超軽量推論	128K	Apache 2.0（無料）
Gemma 4 E4B	Effective 4B	モバイル・エッジ・ブラウザ向け軽量推論	128K	Apache 2.0（無料）
Gemma 4 12B Unified	120億	マルチモーダルの主力（テキスト・画像・動画・音声）	256K	Apache 2.0（無料）
Gemma 4 26B A4B（MoE）	260億（MoE）	高スループット推論向け	256K	Apache 2.0（無料）
Gemma 4 31B Dense	310億	最大級の旗艦（サーバー〜ローカル両対応）	256K	Apache 2.0（無料）

旧世代のGemma 1・Gemma 2・Gemma 3はレガシーとして model card は残りますが、現行の主力ではありません。Gemma 4の全モデルはネイティブ・マルチモーダルに対応しており、量子化（INT4/INT8）を使うことで必要VRAMを大幅に削減できます。

GemmaはオープンモデルであってオープンソースではないOSSとの違い

Gemmaの料金・無料利用を理解するには、まずそのライセンス形態を正確に把握する必要があります。GemmaはGoogleが「オープンウェイト」と表現しており、モデルウェイト（重みパラメータ）が公開されているという点でオープンソースのLLMと似ています。現行のGemma 4はApache 2.0ライセンスで提供されており、Googleとの別途契約・特別許諾なしに商用利用・ファインチューニング後の再配布も可能です。なお、Gemma 3以前の旧世代は独自の「Gemma Terms of Use（Gemma利用規約）」での提供であった点に注意してください。

Gemma 4（Apache 2.0）の核心：何が無料で、何が制限されるか

Gemma 4のApache 2.0ライセンスおよびGemmaポリシーの主要なポイントは以下のとおりです。

個人・研究・開発利用：完全無料。モデルをダウンロードし、ローカルで動かし、研究論文を書くといった用途は費用不要。
商用利用：原則として無料で可能。Apache 2.0採用により、Googleとの特別契約不要で商用利用・再配布・ファインチューニングが可能。
モデルの改変・ファインチューニング・再配布：可能。Apache 2.0の範囲内で自由に行える。
他のAIモデルの学習・改善への使用禁止：GemmaのアウトプットをGPT・Claude・LLaMAなど他社・他プロジェクトのモデル学習データとして使うことは利用ポリシー上禁止。
有害コンテンツ生成目的での使用禁止：違法コンテンツ、差別・暴力の助長、マルウェア生成、虚偽情報の大規模拡散など。
「Google」「Gemini」「Gemma」ブランドの無断使用禁止：派生モデルや製品名にGoogleのブランド名をそのまま使用することはできません。

つまりモデルそのものの利用料金は発生しません。スタートアップ・中小企業・個人開発者の大半にとって、Gemma 4は実質的に無料で商用利用できるモデルです。ただし「完全なオープンソース」ではなく「オープンウェイト」である点は理解しておく必要があります。重みファイルは公開されていますが、学習データや学習コード全体が公開されているわけではありません。

Gemma 4のApache 2.0採用で何が変わったか
Gemma 3以前は独自の「Gemma Terms of Use」のもとでMAU 2億人超のサービスには別途契約が必要でした。Gemma 4からはApache 2.0が採用され、こうした規模制限なしにより自由な商用利用・再配布が可能となりました。これはオープンウェイトモデルのライセンス面における大きな前進です。

Gemmaのモデルウェイト取得にかかる費用はゼロ

Gemmaのウェイトは、主に以下の3つのルートから無料で入手できます。

① Hugging Face

アカウント作成・ライセンスへの同意後、モデルページ（google/gemma-4-12b など）からダウンロード。Transformersとの統合が容易で最も広く使われる配布経路。

② Kaggle

Googleが運営するデータサイエンスプラットフォーム。アカウント登録と同意のみで全バリアントを無料ダウンロード可能。週30時間のGPU（T4/P100）も無料で利用できる。

③ Google AI Studio

ブラウザからすぐ試せる推論環境。一定の無料クォータが設定されており、コード不要で手軽に動作確認が可能。API経由での大量利用は有料プランが必要。

ウェイトのダウンロード自体に課金は一切ありません。ただしファイルサイズは大きく（例：Gemma 4 31B Dense のbfloat16版は相応のストレージを要します）、自前サーバーや開発PCのストレージ・帯域幅コストは自己負担となります。

Gemmaを無料で使える主なプラットフォームと比較

Gemmaを無料で使うルートは大きく分けて「ローカル実行」と「クラウド無料枠」の2系統があります。それぞれコスト・使いやすさ・制限が異なります。

プラットフォーム	費用	GPU/計算資源	商用利用	オフライン	おすすめ対象
Ollama（ローカル）	完全無料	自前CPU/GPU	○	○	プライバシー重視・個人開発
LM Studio（ローカル）	完全無料	自前CPU/GPU	○	○	非エンジニア・GUI好み
Hugging Face（ダウンロード）	無料	自前	○（Apache 2.0）	○	エンジニア・研究者
Google AI Studio	無料枠あり	クラウド	△（枠超過は有料）	×	手軽に試したい人
Google Colab（無料）	無料（時間制限）	T4 GPU（共有）	○	×	学習・検証
Kaggle Notebooks	無料（週30時間GPU）	T4/P100	○	×	データサイエンティスト
Vertex AI（Google Cloud）	従量課金（有料）	クラウドGPU	○	×	エンタープライズ

Ollamaを使ってGemmaを無料でローカル起動する手順

最もシンプルにGemmaを無料で体験するには、Ollamaが最適です。Windows・macOS・Linuxで動作します。

Ollama（CLI）
コマンド1行で起動
ollama run gemma4:12b
macOS/Linux/Windows対応
API経由でアプリ連携も可

LM Studio（GUI）
GUIで直感的に操作
モデル検索・ダウンロードも内蔵
OpenAI互換APIを提供
Windows/macOS対応

llama.cpp
軽量・高速なC++実装
量子化(Q4/Q8)で低メモリ動作
組み込み・高カスタマイズ向け
全OS対応

Ollamaをインストール：公式サイト（ollama.com）からインストーラーをダウンロードして実行。macOSならHomebrewでbrew install ollamaでも可。
Gemmaモデルを起動：ターミナルを開き、ollama run gemma4:12bを入力。初回はモデルファイルのダウンロードが発生。
チャット開始：ダウンロード完了後、そのままターミナル上でチャットが開始されます。日本語での入力・回答も可能。
API経由でアプリと連携（任意）：OllamaはローカルでREST APIを提供（デフォルト：http://localhost:11434）。OpenAI互換APIとして既存アプリからも呼び出せます。
モデルサイズを変える（任意）：PC性能に応じてgemma4:e4b（軽量エッジ向け）やgemma4:31b（最大旗艦）に切り替え可能。

メモリの目安（Ollama + CPU推論）
Gemma 4 E2B/E4B → モバイル・エッジ向け設計のため低メモリ環境でも動作
Gemma 4 12B Unified → マルチモーダル主力。量子化版で標準的なGPU環境に収容可能
Gemma 4 26B A4B（MoE） → 高スループット推論向け。MoE構造で実効パラメータを抑制
Gemma 4 31B Dense → GPU（VRAM 32GB以上）または大型サーバー向け

これらのローカルツールはインターネット不要でGemmaを動かせるため、プライバシー重視の用途や社内データ処理に特に適しています。

ローカルLLMの導入やRAG構築をご検討の方は、AI開発会社クリスタルメソッドの無料相談をご利用ください。

Google ColabでGemmaを無料実行する手順

GPUを自前で持っていない場合、Google Colabの無料T4 GPUを使ってGemmaを動かせます。

Google Colabにアクセスし、新規ノートブックを作成（Googleアカウント必要）。
ランタイムのタイプを「T4 GPU」に変更（ランタイム → ランタイムのタイプを変更）。
以下のコードでライブラリをインストールし、モデルをロード。

# ライブラリのインストール
!pip install -q transformers accelerate

# Hugging Faceへのログイン（トークンが必要）
from huggingface_hub import login
login(token="YOUR_HF_TOKEN")  # HFのアクセストークンを入力

# モデル読み込みと推論
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

model_id = "google/gemma-4-12b-it"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id, torch_dtype=torch.bfloat16, device_map="auto"
)

# テキスト生成
inputs = tokenizer("AIとは何ですか？", return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=200)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Hugging Faceのアクセストークンは、Hugging Faceアカウントの設定ページから無料で発行できます。Gemma 4はApache 2.0ライセンスのため、モデルページでの規約同意も従来より簡便です。

クラウドサービス経由で利用する場合の実質コスト

モデルウェイトは無料ですが、それを動かすインフラには費用がかかります。主要な利用パターンごとに整理します。

Google Cloud（Vertex AI）でのGemma利用料金

Vertex AI Model Gardenを通じてGemmaをホスティングする場合、モデルライセンス料は発生しませんが、GPUインスタンスの稼働時間に対するコンピューティング費用が発生します。

構成例	GPUタイプ	概算時間コスト（USD）	備考
Gemma 4 E2B / E4B	NVIDIA T4（16GB）×1	$0.35〜$0.50/時間程度	軽量エッジ向け。推論のみなら小型インスタンスで対応可
Gemma 4 12B Unified（量子化）	NVIDIA L4（24GB）×1	$0.7〜$1.0/時間程度	マルチモーダル主力。量子化で1枚に収容可
Gemma 4 26B A4B（MoE）	NVIDIA L4（24GB）×1〜2	$0.7〜$1.4/時間程度	MoE構造で高スループット。量子化によるコスト削減が有効
Gemma 4 31B Dense（フルprecision）	NVIDIA A100（40GB）×1〜2	$2.9〜$5.8/時間程度	最大旗艦。長時間常時稼働はコスト注意

※上記はVertex AIの参考価格に基づく概算です。リージョン・インスタンスタイプ・割引契約（Committed Use）の有無によって変動します。最新の正確な料金はGoogle Cloud公式の料金ページでご確認ください。

Amazon SageMaker / AWS上でのGemma

AWSではAmazon SageMaker JumpStartからGemmaモデルをデプロイできます。料金体系はVertex AIと同様にインスタンス稼働時間課金となります。ml.g5.2xlarge（NVIDIA A10G 24GB）を使った場合、Gemma 4の軽量〜中型モデルで$1.2〜$1.5/時間程度が目安です。

Google AI Studioの無料枠と従量課金

Google AI Studioでは、Gemmaを含む一部モデルをAPI経由で試せる無料枠（Free tier）が提供されています。主な制約は以下のとおりです。

レート制限（1分あたりのリクエスト数・トークン数）が厳しく、プロダクション利用には向かない
無料枠でのリクエストデータはGoogleのモデル改善に利用される可能性がある（利用規約に明記）
Pay-as-you-go（従量課金）に切り替えると制限が緩和される

評価・プロトタイピング目的には十分な無料枠ですが、商用サービスへの組み込みや大量リクエスト処理には有料プランへの移行を検討する必要があります。

マネージドAPIでのGemma 4料金（従量課金）の詳細

Vertex AIやサードパーティプロバイダ経由でGemma 4モデルをAPI利用する場合の課金体系は、入力トークン数・出力トークン数に応じた従量課金となっています。OpenRouterでの公開情報を参考に示します。

モデル	ブレンド単価目安（USD）	備考
Gemma 4 E2B / E4B（API経由）	$0.10前後/100万トークン程度	最軽量・最安価。エッジ/モバイル相当
Gemma 4 12B Unified（API経由）	$0.20〜$0.40前後/100万トークン程度	マルチモーダル主力。精度と費用のバランス
Gemma 4 26B A4B（API経由）	$0.10〜$0.70前後/100万トークン程度	MoE構造。プロバイダによって幅あり（出典：OpenRouter）
Gemma 4 31B Dense（API経由）	プロバイダ依存（要確認）	最大旗艦。最新料金は各プロバイダ公式を参照

※上記価格はOpenRouterをはじめとするサードパーティプロバイダの公開情報を元にした参考値です（USD基準、約15〜105円相当）。プロモーション・為替レート・プラン変更により変動します。契約前に必ず公式料金ページを確認してください。

これらの価格はOpenAI GPT-4o（入力$2.50/100万トークン〜）やAnthropicのClaude 3.5 Sonnet（入力$3.00/100万トークン〜）と比較すると大幅に安価です。軽量モデルで十分なユースケースであれば、コスト効率の高い選択肢となります。

Groq・Together AI等サードパーティAPIでのGemma料金

Googleの公式サービス以外にも、高速推論に特化したサードパーティプラットフォームがGemmaをAPI提供しています。

プラットフォーム	提供モデル例	入力単価目安	特徴
Groq	Gemma 4 系他	$0.10/100万トークン程度	LPUによる超高速推論・無料枠あり
Together AI	Gemma 4 各サイズ	$0.27〜$0.90/100万トークン程度	ファインチューニングAPIも提供
Fireworks AI	Gemma 4 各サイズ	$0.20/100万トークン程度〜	低レイテンシ・エンタープライズ向け
OpenRouter	Gemma 4 複数バリアント	プロバイダ依存（仲介価格）	単一APIで複数モデルを切替可能

Groqの無料枠は開発者にとって特に魅力的で、一定のレート制限内であればGemmaを含む複数モデルをコスト無しで試せます。スタートアップや個人開発者がMVP（最小実用製品）の検証に活用するケースが増えています。

Gemmaと他のオープンモデルのライセンス・料金比較

「無料で使えるオープンモデル」はGemma以外にも存在します。代表的なものとの比較を整理します。

モデル	開発元	ライセンス	商用利用	最大パラメータ	特徴
Gemma 4	Google	Apache 2.0	○（規模制限なし）	31B Dense	ネイティブ・マルチモーダル・最大256K文脈・140言語超
Llama 3.x	Meta	参考文献関連記事 gemma vs llama 比較 Gemma APIの使い方 Gemmaの日本語性能 Gemmaのファインチューニング gemma 使い方監修河合継（クリスタルメソッド株式会社代表取締役） AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。運営会社について｜編集方針 ※あわせて、Gemmaとはもご覧ください。 LLM・ローカルLLMの業務導入をご検討の方へクリスタルメソッドは、オープンモデル・ローカルLLMの選定からRAG構築・PoC・本番導入までのAI開発を支援しています。「機密データを外部に出さずにLLMを使いたい」「自社の業務に合うモデルを選びたい」といったご相談を承っています。無料相談・お問い合わせ：ご相談はこちら AIブログ購読　クリスタルメソッドがお届けする AIブログの更新通知を受け取る受信ボックスか迷惑メールフォルダを確認して購読手続きを完了してください。 Study about AI AIについて学ぶ生成AIの著作権と法的リスクを回避する安全対策｜米国xAI社提訴から学ぶ経営視点の実務 ## 生成AIの法的リスクを浮き彫りにしたxAI社への民事訴訟 2026年7月23日、米国の法律事務所Potts Law Firmは、xAI社（Grok AIの... AI ユーザー活用実態調査から紐解く日本企業の現在地と経営層が取るべき次の一手対話型AIの急速な普及に伴い、世界のユーザーが実際にどのような目的でAIを使い、どのような課題に直面しているのか、その具体的なデータの蓄積が進んでいます。Goo... AIモデル盗用セキュリティリスクとは？MoonshotのClaude 5蒸留疑惑から学ぶ企業の防衛策 AIモデル盗用セキュリティリスクとは？MoonshotのClaude 5蒸留疑惑から学ぶ企業の防衛策生成AIの急速な普及と高度化に伴い、企業の意思決定者は生産... View more AIで、業務の生産性を変革しませんか？無料デモ・資料請求は1分で完了。お気軽にお問い合わせください。無料デモを試すお問い合わせクリスタルメソッド株式会社〒162-0843 東京都新宿区市谷田町2-38-3 03-6265-4755 サービス AIロープレ AI面接 AI採用管理さくらスピーチ（SakuraSpeech）サービス一覧会社情報会社概要採用情報お知らせ販売パートナー募集お問い合わせコンテンツ AIブログ一覧 DeepAIアバターエージェントとは？感情認識AIの仕組みと活用事例 Deep AI サービス一覧販売パートナー募集サービス利用規約特定商取引法に基づく表記プライバシーポリシー安全性への取り組み会社概要 Copyright © 2026 クリスタルメソッド株式会社 (crystal-method Co.,Ltd.) All Rights Reserved. smart_toy 無料デモを試すデモ description 資料ダウンロード資料

モデル

開発元

ライセンス

商用利用

最大パラメータ

特徴

Gemma 4

Google

Apache 2.0

○（規模制限なし）

31B Dense

ネイティブ・マルチモーダル・最大256K文脈・140言語超

Llama 3.x

LLM・ローカルLLMの業務導入をご検討の方へ

クリスタルメソッドは、オープンモデル・ローカルLLMの選定からRAG構築・PoC・本番導入までのAI開発を支援しています。「機密データを外部に出さずにLLMを使いたい」「自社の業務に合うモデルを選びたい」といったご相談を承っています。

無料相談・お問い合わせ：ご相談はこちら

Study about AI

AIについて学ぶ

生成AIの著作権と法的リスクを回避する安全対策｜米国xAI社提訴から学ぶ経営視点の実務

## 生成AIの法的リスクを浮き彫りにしたxAI社への民事訴訟 2026年7月23日、米国の法律事務所Potts Law Firmは、xAI社（Grok AIの...
AI ユーザー活用実態調査から紐解く日本企業の現在地と経営層が取るべき次の一手

対話型AIの急速な普及に伴い、世界のユーザーが実際にどのような目的でAIを使い、どのような課題に直面しているのか、その具体的なデータの蓄積が進んでいます。Goo...
AIモデル盗用セキュリティリスクとは？MoonshotのClaude 5蒸留疑惑から学ぶ企業の防衛策

AIモデル盗用セキュリティリスクとは？MoonshotのClaude 5蒸留疑惑から学ぶ企業の防衛策生成AIの急速な普及と高度化に伴い、企業の意思決定者は生産...