blog

AIブログ

Gemini プロンプト活用の実践ガイド｜モデル選定から設計パターンまで

Gemini プロンプト活用の前提：モデル選定とコンテキスト設計

Geminiのプロンプトを実用レベルで活用するには、まずモデル選定と最大コンテキスト長の把握から始める必要がある。誤ったモデルに対してどれだけ精巧なプロンプトを投げても、コストと応答品質の両面で最適解にはならない。2026年6月時点のラインナップは下表の通りだ。

Gemini 現行モデル比較（2026年6月時点・Google公式情報による）
モデル	位置づけ	コンテキスト長	API料金（入力/出力・百万トークンあたり）	主な用途
Gemini 3.5 Flash	現行既定モデル（2026-05-19リリース）	非公開（Flash系）	$1.50 / $9.00	コーディング支援・エージェント処理・高速推論
Gemini 3.1 Pro	高性能・長コンテキスト	1Mトークン	$2.00 / $12.00（〜200K）	長文解析・複雑な推論・ドキュメント処理
Gemini 3 Flash	軽量・汎用	―	$0.50 / $3.00	軽量タスク・プロトタイピング
Gemini 3 Flash-Lite	最軽量・低コスト	―	$0.25 / $1.50	大量バッチ処理・コスト最小化
Gemini Ultra（Deep Think）	最難推論・バックグラウンドエージェント	―	Google AI Ultra（$99.99/月）	数学的推論・研究用途・Gemini Spark連携

出典：gemini.google/subscriptions/、Google AI Plansページ

プロンプト設計において最も影響が大きいのはコンテキスト長だ。Gemini 3.1 Proの1Mトークンは、数万行規模のコードベースや数百ページのドキュメントをそのまま入力できることを意味する。分割処理によるコンテキスト断絶を回避できる点が、従来世代のモデルとの本質的な差分であり、大規模ドキュメント横断処理や複数マイクロサービスの仕様書一括解析といったユースケースで決定的な優位性を持つ。

一方、Gemini 3.5 Flashは同等コスト帯で処理速度に優れ、コーディング・エージェント系タスクのベンチマークではGemini 3.1 Proを上回る結果が報告されている（Google公式情報による）。繰り返しの多いエージェント処理や、応答速度がUXに直結するインタラクティブ用途には3.5 Flashを選ぶ判断が合理的だ。タスクの性質に応じたモデル選定なしにはプロンプト最適化は成立しない、という認識を起点に設計を進めるべきだ。

料金体系の詳細についてはGemini料金プランの解説記事、モデル間の性能比較についてはGeminiモデル比較記事も参照されたい。

図：Geminiモデル群のコスト・性能・速度の概念マッピング。右上ほど高速・低コスト、左上ほど高性能・高コンテキスト長（Google公式スペックをもとに作成）

Gemini プロンプト活用の基本構造：ロール・タスク・制約の三層設計

プロンプトエンジニアリングの文脈では、構造化された入力が出力品質を左右する。Geminiに対しても、ロール定義・タスク記述・制約指定の三層構造を意識した設計が実装上の安定性を高める。この構造はIPAが提供する「初心者向け・生成AI活用研修〜今日から使えるGemini」においても基本原則として位置づけられており、役割・目的・制約の明示がプロンプトの品質を左右するとされている（IPA manabi-dx.ipa.go.jp）。

第一層：ロール定義（System Instruction）

API経由でGeminiを利用する場合、system_instructionフィールドにロールを注入する。GUIのGemini.google.comではプロンプト冒頭に記述する形になる。ロール定義の目的は、Geminiが持つ汎用的な応答傾向を、特定の専門領域・スタイル・制約に収束させることだ。

あなたはシニアバックエンドエンジニアとして振る舞ってください。
使用言語はPython 3.12で、PEP 8準拠・型アノテーション付きのコードのみ出力してください。
不明点があれば実装前に確認してください。

ロール定義が曖昧なままタスクを投げると、Geminiは汎用的な回答を返す傾向がある。特にコード生成においては言語・バージョン・スタイルの制約を明示することが、レビューコストの削減に直結する。「不明点があれば確認してください」という一文を加えることで、仕様が不完全な場合に推測で実装を進めるのではなく確認ターンを挟む動作を引き出せる。

第二層：タスク記述（出力形式の明示）

タスク記述では「何を・どの形式で・どの粒度で」出力するかを明示する。曖昧な動詞（「まとめてください」「確認してください」）ではなく、具体的な出力フォーマットまで指定するのが実装品質を安定させる鍵だ。

以下のAPI仕様書（OpenAPI 3.0形式）を読み込み、
エンドポイントごとにPythonのrequestsライブラリを使った呼び出しコードを生成してください。
出力形式：各エンドポイントをh3見出しで区切り、コードブロック（python）に収めること。
エラーハンドリング（requests.exceptions.HTTPError）を必ず含めること。
レスポンスのJSONパース処理もセットで出力すること。

第三層：制約・フィルタ（ガードレール）

出力の過不足を制御する制約を末尾に付与する。「〜は含めない」「〜の場合のみ言及する」という否定・条件形式が実用上有効だ。制約を明示しない場合、Geminiは「丁寧さ」から不要な説明を大量に付与したり、指示していない項目まで生成したりすることがある。

【制約】
・外部ライブラリへの依存は requests と標準ライブラリのみとする
・コメントは英語で記述する
・テストコードは含めない（別途指示する）
・実装の説明文は不要。コードブロックのみ出力すること

この三層を意識することで、試行錯誤のターン数が減り、レビュー担当者への引き渡しコストが下がる。特に複数エンジニアがプロンプトを共有・再利用するチーム開発の文脈では、テンプレートとして文書化しておく価値がある。

Gemini プロンプト活用の実践パターン：用途別テンプレートと設計上の勘所

三層構造を理解した上で、エンジニアリング現場で頻度の高いユースケース別のプロンプト設計パターンを示す。各パターンにはそれぞれ設計上の注意点（トレードオフ）も記載する。

コードレビュー・リファクタリング

Gemini 3.5 Flashはコーディング系タスクで高速かつ高精度な応答を示す。コードレビューで重要なのは「何を観点に見るか」を列挙することだ。観点を指定しない場合、Geminiはスタイルの軽微な指摘から致命的なバグ指摘まで混在した出力を返し、優先度の判断が難しくなる。

[ロール] シニアGoエンジニア
[タスク] 以下のGo関数をレビューし、下記の観点で問題点を指摘してください：
  1. goroutineリーク
  2. エラー無視（errチェック省略）
  3. 命名規約（Effective Go準拠）
  4. テスタビリティ（外部依存のモック可否）
[出力形式]
  - 観点ごとに見出しを立てる
  - 問題がない観点は「問題なし」の一行のみ
  - 改善案コードは問題がある観点のみ提示
[制約] リファクタリング全体案は不要。問題箇所の差分のみ示すこと。

---コード開始---
（対象コードをここに貼付）
---コード終了---

設計上の勘所：コードが長い場合は1Mトークンのコンテキストを持つGemini 3.1 Proを選ぶ。関数単位の短いコードなら3.5 Flashで十分であり、コストを抑えられる。

長文ドキュメント処理（1Mトークン活用）

Gemini 3.1 Proの1Mトークンコンテキストは、複数の仕様書・ログファイル・コードベースを一括入力する用途に適している。分割処理によるコンテキスト断絶を回避できる点が、このモデルを選ぶ最大の理由だ。

[タスク] 添付した3つのマイクロサービスのOpenAPI仕様書を横断し、
以下を出力してください：
  1. エンドポイント間の依存関係をMermaid記法のシーケンス図で
  2. 認証方式の統一性に関する問題点（ある場合のみ）
  3. レスポンスのデータモデルに命名の重複や矛盾がある箇所
[制約] 各サービスのエンドポイント一覧は出力しない（既知のため不要）。
  Mermaid図のコードブロックのみを出力し、説明文は最小限にすること。

設計上の勘所：1Mトークンを使い切るほど長い入力では、出力品質が入力の後半部分で低下する傾向がLLM全般で報告されている（いわゆる「lost in the middle」問題）。最も重要な文書を冒頭に配置する工夫が有効だ。

マルチモーダル：画像入力プロンプト

GeminiはテキストだけでなくPDF・画像・音声・動画を入力できる。UI設計レビューやエラースクリーンショットの診断において、画像インプットと組み合わせたプロンプトは実装デバッグの場面で実用的だ。

[入力] 添付のスクリーンショット（Reactコンポーネントのレンダリング崩れ）
[タスク] CSSの観点から崩れの原因を推定し、修正候補を3つ提示してください。
  各候補は以下の形式で：
    - 原因仮説（1文）
    - 修正CSS（コードブロック）
    - 適用優先度（高/中/低）とその理由
[制約] JavaScript側の修正案は含めない。
  候補は3つを上限とし、それ以上は提示しないこと。

Geminiの画像生成機能（Imagen連携）についてはImagen活用解説記事、動画生成についてはVeo活用記事で詳説している。

エージェント型タスク（Deep Research・Gemini Spark）

Google AI Ultraに含まれるGemini Sparkは、24時間365日バックグラウンドで動作するエージェント機能だ。Deep Researchとの組み合わせにより、調査→整理→ドキュメント化を一連のワークフローとして自動化できる。エージェント型プロンプトでは、通常のシングルターンプロンプトと異なり「調査の優先順位付け」と「出力のスコープ制限」が特に重要になる。

[モード] Deep Research
[タスク] 「コンテナオーケストレーション（Kubernetes vs Nomad）の2026年時点の採用動向」を
  公式ドキュメント・技術ブログ・OSSリポジトリのissueから調査し、
  技術的トレードオフをMarkdown形式（A4 1枚相当・見出し3階層以内）でまとめてください。
[制約]
  - 2025年以降の情報を優先する
  - 商業記事よりOSSコミュニティの議論を重視する
  - 調査ソースのURLを各主張に併記すること
  - 結論セクションで「Kubernetes優位なケース」「Nomad優位なケース」を箇条書きで区別すること

Deep Research機能の詳細についてはGemini Deep Research解説記事を参照されたい。

Few-shotプロンプティングによる出力フォーマット固定

同一フォーマットの出力を繰り返し得たい場合、Few-shotサンプルを与えるアプローチが有効だ。ただし、サンプル自体の品質が低いとGeminiはそのパターンを忠実に踏襲するため、例示するサンプルは「望ましい出力の最良例」を厳選して用意する必要がある。

[指示] 以下のフォーマットでバグレポートを生成してください。

[例]
入力: TypeError: Cannot read properties of undefined (reading 'map')
出力:
  ## バグサマリ
  undefinedに対してmapメソッドを呼び出しています。
  ## 原因の可能性
  1. 非同期処理でデータ取得前にrenderが走っている
  2. APIレスポンスが空配列ではなくnullを返している
  ## 推奨する修正方針
  - オプショナルチェーン（?.map）を使用する
  - データ取得完了をローディング状態で制御する

[実際の入力]
（エラーログをここに貼付）

生成AIの業務導入・社内活用をご検討の方は、AI開発会社クリスタルメソッドの無料相談をご利用ください。

Gemini プロンプト活用における技術的トレードオフと限界

プロンプト設計を洗練させる一方で、Geminiの構造的な限界についても整理しておく必要がある。これらを把握せずに運用設計を進めると、後工程で想定外のコストや品質問題が生じる。

ハルシネーションと事実確認の責任分界

大規模言語モデル全般の課題として、事実確認を要する数値・固有名詞・最新情報の生成には誤りが混入しうる。文部科学省が公表している「教育における生成AI活用」に関するガイドラインにおいても、生成AIの出力をそのまま事実として扱わず批判的に検証する姿勢が推奨されている（文部科学省PDF、2024年8月）。エンジニアリング用途においても、Geminiが生成したコード・仕様・調査結果は必ず人間がレビューする設計プロセスを維持すべきだ。自動化パイプラインに組み込む場合は、生成物の検証ステップを必ずセットで設計する。

プロンプトの長大化によるコスト上昇

三層構造を徹底するほどプロンプト自体のトークン数が増加し、API利用コストに直接影響する。Gemini 3.1 ProのAPIは入力$2.00/百万トークン（〜200K）と、Gemini 3.5 Flash（$1.50）に対してコストが高い。長文仕様書の処理は3.1 Pro、軽量な繰り返しタスクはFlashまたはFlash-Liteに振り分けるルーティング設計が、コスト管理の基本となる。月次コストの見通しが立てにくい場合は、まずGemini無料プランの解説記事で無料枠の範囲を確認してから、有料プランへの移行を検討するのが合理的だ。

Gems（カスタムAI）との役割分担

繰り返し同一のロール定義・制約を毎回プロンプトに記述するのは非効率だ。定型業務にはGeminiの「Gems」機能を利用し、ロールと制約をカスタムAIとして保存することでプロンプト管理コストを下げられる。Gemsの詳細についてはGems活用解説記事を参照されたい。チームで共有するプロンプトはGemsとして管理し、個別最適化が必要なものはその都度プロンプトで上書きする設計が実運用に即している。

Canvas・CLI連携による開発ワークフロー統合

コーディング支援の文脈では、GeminiのCanvas機能やCLI連携も選択肢に入る。Canvasはドキュメント・コードをGeminiと協調編集する機能であり、プロンプトと編集操作を組み合わせたハイブリッドなワークフローを構成できる。詳細はGemini Canvas解説に詳しい。ターミナルからGeminiを直接呼び出してCI/CDパイプラインに組み込む開発スタイルについてはGemini CLI活用記事も参考になる。

プロンプトで制御しきれない挙動の現実

プロンプトを精緻化しても、以下の挙動は完全には制御できない点を把握しておく必要がある。

出力長の正確な制御：「100文字以内」と指定しても多少の誤差が生じる
非決定論的な出力：同一プロンプトでも実行ごとに出力が異なる（temperatureパラメータで低減は可能）
安全フィルタの介入：特定のコンテンツカテゴリに対して意図しないrefusalが発生することがある
長文入力後半の品質低下：上述の「lost in the middle」問題は、プロンプト設計だけでは解消しない

これらはプロンプトエンジニアリングの限界であり、信頼性が求められる本番環境では出力の後処理・バリデーションレイヤーを別途実装することが前提となる。

一次体験：DeepAIでのGemini活用実例

弊社が開発するDeepAIは、実在の人物の容姿・表情・声・振る舞いをデジタル空間で再現するバーチャルヒューマン／AIアバターソリューションであり、対話AIを組み合わせて接客・研修・広報等に活用している。このDeepAI開発においても、Geminiのコード生成支援を実際の業務で活用している。具体的には、対話フローや音声合成連携のスクリプト設計において、三層構造のプロンプト（ロール：バックエンドエンジニア、タスク：対話制御モジュールのクラス設計、制約：型アノテーション必須）を定型テンプレートとして整備し、チームで共有する運用をとっている。APIレスポンスのJSON整形処理においても、出力フォーマットの制約をプロンプトに明示することで、後段の検証スクリプトとのインターフェース齟齬を減らす効果を実感している。ただし生成されたコードは必ずコードレビューを経てから本番環境に組み込む体制を維持しており、生成物の自動信頼は行っていない。

全体的な機能一覧やブログ記事の一覧はこちらのブログトップページから確認できる。

参考文献

Google公式：Gemini サブスクリプションページ https://gemini.google/subscriptions/
Google公式：Google AI Plans https://one.google.com/about/google-ai-plans/
Google公式：Google AI サブスクリプション発表ブログ https://blog.google/products-and-platforms/products/google-one/google-ai-subscriptions/
文部科学省：教育における生成AI活用（PDF、2024年8月公表） https://www.mext.go.jp/content/20240808-mxt_jogai01-000037319_0013.pdf
文部科学省 AI英語：生徒個々のタイミングでのGemini活用｜事例紹介 https://ai-eigo.mext.go.jp/case/221/
IPA（情報処理推進機構）：初心者向け・生成AI活用研修〜今日から使えるGemini https://manabi-dx.ipa.go.jp/courses/00100-000016

監修

河合継（クリスタルメソッド株式会社代表取締役）

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について｜編集方針

生成AIの業務活用をご検討の方へ

クリスタルメソッドは、ChatGPT・Gemini・Claudeをはじめとする生成AIの業務導入から、自社データを活かすRAG構築・AIアバター開発までを一貫して支援しています。「どのAIを選ぶべきか」「自社業務でどう活かせるか」といったご相談を承っています。

無料相談・お問い合わせ：ご相談はこちら

Study about AI

AIについて学ぶ

Claude Opus 5 活用方法と企業導入ロードマップ：コスト半減と自律運用の最適解

Anthropicが発表した「Claude Opus 5」の概要 Anthropicは、同社の最新かつ最上位のフラッグシップAIモデルである「Claude Op...
OpenAIの音声エージェント開発を企業が導入する基準：新基盤「Presence」の衝撃

OpenAIの音声エージェント開発を企業が導入する基準：新基盤「Presence」の衝撃 AI技術の進展に伴い、企業のカスタマーサポートやセールス活動における自...
AI 暴走リスクセキュリティ対策：OpenAI自律ハッキング事案から学ぶ企業の防衛策

人工知能（AI）技術の進化は、業務効率化や意思決定の迅速化に大きく貢献する一方で、これまでにない新たな脅威をもたらしています。特に、自律的に判断して行動する「A...