blog
AIブログ
Grok API の使い方|料金・始め方【2026年版】
監修
河合 継(クリスタルメソッド株式会社 代表取締役)
AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について | 編集方針
Grok APIとは何か:xAIが提供する高性能LLM APIの概要
Grok APIは、イーロン・マスク率いるxAIが開発・提供する大規模言語モデル「Grok」をAPI経由で利用できるサービスです。2024年後半から一般開発者向けに提供が開始され、2025年以降は機能拡充・価格改定が続いています。OpenAIのGPTシリーズやAnthropicのClaudeと同様のチャット補完API形式を採用しているため、既存システムへの組み込みもスムーズに行えます。
当社では複数のLLM APIを実務ベースで比較検証していますが、Grok APIは特に長文コンテキスト処理と最新情報へのアクセス性において独自の強みを発揮しています。本記事では、Grok APIのエンドポイント仕様・利用手順・モデル選定・実装のポイント・コスト計算まで、開発者が実際に使い始めるために必要な情報を網羅します。

Grok APIの基本仕様:エンドポイントとOpenAI互換設計
Grok APIの最大の設計上の特徴は、OpenAI互換のREST API形式を採用していることです。エンドポイントのベースURLを差し替えるだけで、OpenAI SDKをそのままGrokに転用できます。
ベースURLとリクエスト形式
APIのベースURLは以下の通りです。
主要エンドポイント:
POST /chat/completions ← チャット補完
GET /models ← 利用可能モデル一覧
POST /embeddings ← テキスト埋め込み(対応モデルのみ)
認証はHTTPヘッダーへのBearerトークン付与で行います。OpenAI Pythonライブラリを使う場合、base_urlとapi_keyを差し替えるだけで既存コードをほぼそのまま流用できます。
主要モデル一覧(2026年6月時点)
| モデルID | コンテキスト長 | 特徴 | 主な用途 |
|---|---|---|---|
| grok-4.3 | 100万トークン | 現行旗艦・既定モデル。動画入力対応 | 高度な推論・長文分析・コーディング |
| grok-4.20-0309-reasoning | 100万トークン | 上位推論モデル。低ハルシネーション率 | エージェント型ワークフロー・複雑推論 |
| grok-4.20-0309-non-reasoning | 100万トークン | Grok 4.20の非推論版 | 汎用タスク・レスポンス速度重視 |
| grok-4.20-multi-agent-0309 | 100万トークン | マルチエージェント処理向け | 複数エージェント協調システム |
| grok-build-0.1 | 256,000トークン | エージェント型コーディング特化。100+tokens/sec | ソフトウェア開発・コード生成 |
当社検証では、通常の文章生成・要約・分類タスクにはGrok 4.3で十分なケースが多く、強いエージェント的ツール呼び出しや多段推論が必要な場面ではGrok 4.20系を使い分けるアプローチが費用対効果に優れています。コーディング専用ならGrok Build 0.1が最速の選択肢です(出典:xAI Docs — Models)。
Grok APIの利用開始手順:アカウント作成からAPIキー取得まで
利用開始の流れはシンプルです。以下のステップで最初のAPIコールまで到達できます。
APIキーはソースコードへの直書きを避け、.envファイルや環境変数(XAI_API_KEY)経由で扱うことをお勧めします。Gitリポジトリへの漏洩事故は他のAPIと同様に発生しやすいため、.gitignoreとシークレットスキャナーの併用が実務上の標準です。
実装サンプル:Python・cURLでの基本的な使い方
OpenAI互換設計のため、実装は非常に直感的です。代表的な2パターンを示します。
Pythonでの実装(OpenAI SDKを流用)
import os
client = OpenAI(
base_url=“https://api.x.ai/v1”,
api_key=os.environ[“XAI_API_KEY”]
)
response = client.chat.completions.create(
model=“grok-4.3”,
messages=[
{“role”: “system”, “content”: “You are a helpful assistant.”},
{“role”: “user”, “content”: “Grok APIの特徴を3点で教えてください。”}
],
max_tokens=1024,
temperature=0.7
)
print(response.choices[0].message.content)
cURLでの実装
-H “Content-Type: application/json” \
-H “Authorization: Bearer $XAI_API_KEY” \
-d ‘{
“model”: “grok-4.3”,
“messages”: [
{“role”: “user”, “content”: “こんにちは、自己紹介してください。”}
],
“max_tokens”: 512
}’
ストリーミングレスポンス
長文出力やチャットUIでは、stream: true(Python SDKではstream=True)を有効にすることでServer-Sent Eventsによるストリーミングが利用できます。実務では応答待ちのUX改善に効果的で、当社のチャットボット実装でもデフォルトで有効にしています。
model=“grok-4.3”,
messages=[{“role”: “user”, “content”: “長文のブログ記事を書いてください。”}],
stream=True
) as stream:
for chunk in stream:
print(chunk.choices[0].delta.content or “”, end=“”, flush=True)
Grok APIの料金体系:トークン課金の計算方法
Grok APIはトークン消費量に基づく従量課金制です。入力(プロンプト)トークンと出力(補完)トークンで単価が異なります。公式料金は変更されることがありますので最新情報はxAIの公式ドキュメント(docs.x.ai)で確認してください。
| モデル | 入力(/1Mトークン) | 出力(/1Mトークン) | 備考 |
|---|---|---|---|
| grok-4.3 | $1.25 | $2.50 | 現行旗艦・既定。1Mコンテキスト |
| grok-4.20(reasoning / non-reasoning / multi-agent) | $1.25 | $2.50 | 上位推論・エージェント向け。1Mコンテキスト |
| grok-build-0.1 | $1.00 | $2.00 | コーディング特化。256kコンテキスト |
コスト試算の考え方
日本語テキストはByte Pair Encoding(BPE)の特性上、英語より多くのトークンを消費します。目安として日本語は1文字あたり約1〜2トークン(漢字・かなが混在する場合)と見積もることが多いです。1,000文字の日本語プロンプトは約1,000〜1,500トークン程度になります。
当社では月間APIコストを管理するために、以下のルールを設けています。
- 開発・テスト環境ではGrok 4.3を標準利用し、強い推論が必要な本番処理のみGrok 4.20系へ昇格
max_tokensに上限を必ず設定し、意図しない長文生成によるコスト超過を防止- コンソールのUsageダッシュボードで日次モニタリングを実施
- プロンプトキャッシュが利用できる場合は積極的に活用(繰り返しのシステムプロンプト削減)
主要パラメータの詳解:実装で押さえるべき設定値
APIを実運用に組み込む際、パラメータの意味を正しく理解しないとアウトプット品質が安定しません。
| パラメータ | 型・範囲 | 説明 | 実務での推奨 |
|---|---|---|---|
temperature |
float 0〜2 | 出力のランダム性。高いほど多様・低いほど決定論的 | 要約・分類→0.0〜0.3、創作→0.7〜1.0 |
max_tokens |
int | 最大出力トークン数。コスト管理にも直結 | タスクに合わせて必ず明示的に設定 |
top_p |
float 0〜1 | nucleus sampling。temperatureとの併用は非推奨 | 通常はtemperatureのみ調整し1.0固定推奨 |
frequency_penalty |
float -2〜2 | 同じトークンの繰り返しを抑制 | 長文で同表現が繰り返される場合に0.3〜0.5 |
presence_penalty |
float -2〜2 | 既出トークンへのペナルティ。話題の多様化に寄与 | 創作・ブレストで0.5程度 |
stop |
string/array | 指定文字列が出現したら出力を停止 | 構造化出力の終端制御に活用 |
response_format |
object | {"type":"json_object"}でJSON出力を強制 |
データ抽出・構造化タスクで必須 |
マルチモーダル機能:画像・動画入力の実装方法
現行旗艦のGrok 4.3はテキストと画像に加え、動画入力をネイティブにサポートしています。画像はBase64エンコードまたは公開URLで渡す形式です。
model=“grok-4.3”,
messages=[{
“role”: “user”,
“content”: [
{“type”: “image_url”,
“image_url”: {“url”: “https://example.com/chart.png”}},
{“type”: “text”,
“text”: “この画像のグラフが示すトレンドを解説してください。”}
]
}]
)
当社検証では、製品画像のキャプション自動生成やダッシュボードスクリーンショットの要約において、ビジョン機能が実務に耐えうる精度を示しました。ただし日本語テキストを含む画像のOCR精度はまだ改善の余地があり、高精度なOCRが必要な場合は専用サービスとの組み合わせを推奨します。なお画像生成(Grok Imagine)や動画生成(Grok Imagine Video)はAPIで別途提供されており、画像生成は$0.02〜$0.05/枚、動画生成は$0.050〜$0.080/秒が目安です(出典:xAI公式)。
Function Calling(ツール呼び出し)の活用
Grok APIはOpenAI互換のFunction Calling(toolsパラメータ)をサポートしています。LLMに外部ツールや自社APIを呼び出させるエージェント型アーキテクチャの構築に活用できます。特にGrok 4.20系はエージェント的なツール呼び出しと低ハルシネーション率を訴求しており、複雑なワークフローに適しています。
Function Callingを活用する際の実装ポイントは以下の通りです。
- ツール定義はJSON Schemaで正確に記述する。曖昧なdescriptionは誤ったツール選択の原因になる
tool_choiceを"auto"にすることで、Grokが最適なツール呼び出しを自律的に判断する- 並列ツール呼び出し(parallel_tool_calls)は複数の情報を同時取得する場合に有効
- セキュリティ上、ツール実行前に入力値のバリデーションをアプリ側で必ず実施する
エラーハンドリングとレートリミット対策
本番運用ではAPIエラーへの適切な対処が安定稼働の鍵です。Grok APIのエラーコードはHTTP標準に準拠しています。
| HTTPステータス | エラー種別 | 対処法 |
|---|---|---|
| 401 | 認証エラー | APIキーの再確認・再生成 |
| 422 | パラメータ不正 | リクエストボディのスキーマを確認 |
| 429 | レートリミット超過 | 指数バックオフでリトライ(Retry-Afterヘッダーを参照) |
| 500/503 | サーバーエラー | 一時的障害として指数バックオフでリトライ |
当社ではPythonのtenacityライブラリを使った指数バックオフリトライを標準実装しています。429エラーが頻発する場合はリクエストのバッチ処理や並列数の制御が根本対策になります。
Grok APIの強みと他モデルとの使い分け
Grok APIが実務で特に優位性を発揮するのは次のシナリオです。
- 最新情報の活用:Grokはxプラットフォーム(旧Twitter)のリアルタイムデータとの親和性が高く、最新トレンドに関する応答の鮮度が高い傾向があります
- 長文ドキュメント処理:Grok 4.3・Grok 4.20系は100万トークンのコンテキストウィンドウを持ち、長大な契約書・論文・ログファイルの一括処理が可能です
- コスト効率:Grok 4.3・Grok 4.20系はいずれも入力$1.25/出力$2.50(1Mトークンあたり)と、主要競合モデルに比べて競争力のある料金帯に位置しています
- OpenAI互換性による移行コストの低さ:既存のGPT-4系実装から短期間で移行可能
- 高速コーディング:Grok Build 0.1は100+tokens/secのエージェント型コーディング特化モデルであり、ソフトウェア開発用途に特に有効です
一方、各LLMの性能・コスト・機能の詳細な比較については、AIモデルの比較(LLM比較)の記事で深掘りしています。モデル選定に迷う場合はあわせて参照してください。

セキュリティとコンプライアンスの考慮点
APIを業務利用する際には以下の点を事前に確認・対策してください。
- データプライバシー:APIに送信したプロンプトがモデル学習に使われるかどうかは利用規約で確認が必要。個人情報・機密情報は原則送信しない設計にする
- プロンプトインジェクション対策:ユーザー入力をそのままシステムプロンプトに含める場合、悪意ある命令を無効化するサニタイズ処理が必要
- 出力の検証:LLMの出力は誤りを含む可能性があります。医療・法律・金融など高リスク領域では必ず人間によるレビューを挟む設計にしてください
- APIキー管理:定期ローテーション、最小権限の原則、アクセスログの監視を標準として実施する
まとめ:Grok APIを実務に取り込むためのポイント
Grok APIは、OpenAI互換設計による低い移行コスト、Grok 4.3の100万トークンロングコンテキスト、Grok 4.20系の強力な推論・エージェント機能、Grok Build 0.1によるコーディング特化という多層的な選択肢を備えた、実務投入しやすいLLM APIです。
実装上の要点を改めて整理すると次の通りです。
- APIキーは
XAI_API_KEY環境変数で管理し、コードへの直書きを禁止する - 汎用タスクにはGrok 4.3(入力$1.25/出力$2.50)、強い推論・エージェント処理にはGrok 4.20系、コーディング専用にはGrok Build 0.1という使い分けで費用と性能を最適化する
max_tokensを必ず明示し、コスト超過のリスクを管理する- 429エラーに備えた指数バックオフを実装し、本番安定稼働を担保する
- 構造化出力が必要なタスクには
response_format: json_objectとFunction Callingを積極活用する
LLM
参考文献
Study about AI
AIについて学ぶ
-
Meta インド データセンター AIインフラ——Reliance 168MW契約の深層と日本企業の実務対応
監修 河合 継(クリスタルメソッド株式会社 代表取締役) AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番...
-
ワーナー Sureel AI 音楽 著作権——買収の意味と日本企業への示唆
監修 河合 継(クリスタルメソッド株式会社 代表取締役) AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番...
-
Vector Lakebase ベクターDB RAG——Zillizが示す統合AIデータ基盤の論点
監修 河合 継(クリスタルメソッド株式会社 代表取締役) AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番...