blog

AIブログ

Perplexity API（Sonar）完全ガイド｜料金・モデル選択・実装【2026年版】

Perplexity APIが解決する課題――「知識カットオフ」の壁を越える検索連動型AI

Perplexity APIは、リアルタイムWeb検索と大規模言語モデルを一体化させた推論機能を、外部アプリケーションへ組み込むためのインターフェースである。通常のLLM APIが学習データの知識範囲内でしか回答できないのに対し、Perplexity APIは回答生成時にインターネット検索を実行し、最新情報を引用URL付きで返す。この「検索と生成の統合」が最大の差別化点だ。

Perplexityという会社の本質は、独自の汎用フラッグシップLLMで他社と競うことではない。検索特化の自社Sonarシリーズを中核に据え、主要他社モデルを切り替えられる「回答エンジン（AI検索）」がその正体である。開発者向けのSonar APIはこの回答エンジンの機能を外部システムへ開放したものと捉えると、モデル選択や料金体系の理解が一段と明確になる。

Perplexity APIのリクエスト・レスポンスフロー：Web検索とLLM生成が並行し、引用付き回答を返す

OpenAI互換のREST APIとして設計されているため、既存のOpenAIクライアントライブラリのベースURLを差し替えるだけで利用できる。エンドポイントは https://api.perplexity.ai/chat/completions の1本で、model・messages・temperature などのパラメータをJSONで渡す構造はほぼ同一だ。

他のAI APIとの比較を検討する際は、DeepSeek APIやMistral APIの解説記事も参照されたい。Web検索連動という特性を他社LLMのスペックと並べるうえで参考になる。

Perplexity APIのモデル選択――Sonarシリーズの構成と使い分け

Perplexity APIの中核は自社開発の「Sonarシリーズ」である。2026年6月時点の公式モデル一覧（出典：Perplexity公式モデル一覧、2026-06-08アクセス）に基づき、各モデルの特性を整理する。なお「pplx-7b」「pplx-70b」「pplx-online」等の旧モデル名は廃止済みであり、現行として記述しない。

モデル名	Web検索	コンテキスト	特徴	推奨用途
sonar	あり	128K	軽量・高速・低コスト	日常的な情報収集、社内チャットbot
sonar-pro	あり	約200K	高精度・マルチステップ推論・vision対応	競合調査・市場レポート生成
sonar-reasoning-pro	あり	約128K	Chain of Thought（CoT）推論＋Web検索	金融・法律など多段階分析が必要な専門領域
sonar-deep-research	あり	128K	複数ソースを自律探索・統合し長文レポートを生成	調査報告書・市場分析・デューデリジェンス
r1-1776	なし	128K	DeepSeek R1ベース・オフライン動作	機密データ処理・内部文書分析

モデル選択の実務的な判断軸は、速度・コスト・推論深度の三つだ。定型的な情報収集やチャットbotには sonar が費用対効果の面で優れる。競合調査や複数情報源の統合が必要なリサーチ用途には sonar-pro が主力となる。高度な多段階分析が必要な場面では sonar-reasoning-pro が回答品質を向上させるが、レスポンス時間が数秒長くなる点は導入前に許容できるか確認が必要だ。長文の調査報告書を自動生成したい場合は sonar-deep-research だが、後述するcitation課金が別途発生することを念頭に置く。

機械学習の基礎的な仕組みを理解しておくと、各モデルの推論特性の違いが把握しやすくなる。機械学習の基礎解説やディープラーニングの解説記事を参照されたい。

Perplexity API料金体系――トークン課金とリクエスト課金の両軸を把握する

Perplexity APIの費用構造を正確に理解するには、「トークン従量課金」と「Webリクエスト課金」が独立した課金軸であることを押さえる必要がある。「Sonarは$1だけ」という単純化は誤りで、実際の請求はこの二軸の合算だ。2026年6月時点の公式料金（USD）は以下の通り（出典：Perplexity API公式料金ページ、2026-06-08アクセス）。為替・価格改定により変動するため、導入前に必ず公式を確認されたい。

モデル	入力トークン（100万トークンあたり）	出力トークン（100万トークンあたり）	リクエスト課金（1,000リクエストあたり）	追加課金
sonar	$1.00	$1.00	$5〜$12（low〜high context）	なし
sonar-pro	$3.00	$15.00	$6〜$14（low〜high context）	なし
sonar-reasoning-pro	$2.00	$8.00	別途リクエスト課金あり	なし
sonar-deep-research	$2.00	$8.00	$5 per 1,000 queries	citation $2、reasoning $3（各1,000あたり）
r1-1776（オフライン）	$2.00	$8.00	なし	なし

sonar-deep-research はcitation課金が発生する唯一のモデルである（2026年6月時点。2025年以前はcitation課金が全モデル対象だったが、現在は当モデルのみに変更されている）。また、Pro Searchモード（API）を利用する場合は約$14〜$22 / 1,000 queriesのリクエスト課金が加算される。

コスト管理の実務ポイントを三点挙げる。第一に、システムプロンプトの簡潔化だ。毎リクエストで消費される入力トークンを削減するため、system promptは必要最小限に絞る。冗長な指示文は月間コストに直接反映される。第二に、モデルの用途分離だ。最新情報が不要なタスク（文章整形・要約・分類）には他社の軽量APIを活用し、Perplexity APIは「外部Web検索が必要な場面」に特化させる。第三に、max_tokens の明示だ。出力長の上限を指定しないと、モデルが必要以上に長い回答を生成してコストが膨らむ。用途に合わせて上限を設定する習慣をつけたい。

なお、ProプランユーザーはAPIダッシュボードから月$5分のAPIクレジットを受け取れる（Pro: 月額$20、年額$200）。小規模な検証用途であれば実質的な追加コストを抑えてスタートできる。Max（月額$200）はPerplexity Computer・Model Councilなど最上位機能が対象で、エンタープライズ向けの個人プランとして位置づけられている（出典：Perplexity Enterprise料金、2026-06-08アクセス）。

他の主要AIサービスのAPI料金との費用比較には、Claude Code APIの料金解説やGrok APIの解説も参照されたい。

生成AIの業務導入・社内活用をご検討の方は、AI開発会社クリスタルメソッドの無料相談をご利用ください。

Perplexity APIの実装――主要パラメータと実用コードパターン

Perplexity APIはOpenAI SDKのベースURLを差し替えるだけで利用できる。APIキーはPerplexityダッシュボード（Settings → API → Generate API Key）から発行し、必ず環境変数で管理する。コードにハードコードすることやGitリポジトリへの混入は深刻なセキュリティリスクとなる。

基本リクエスト（OpenAIライブラリ流用）

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ.get("PPLX_API_KEY"),
    base_url="https://api.perplexity.ai"
)

response = client.chat.completions.create(
    model="sonar-pro",
    messages=[
        {"role": "system", "content": "日本語で簡潔に回答してください。"},
        {"role": "user", "content": "2026年のAI規制の最新動向を教えてください。"}
    ],
    temperature=0.2,
    max_tokens=1024,
    extra_body={"return_citations": True}
)

print(response.choices[0].message.content)
if hasattr(response, "citations"):
    for i, url in enumerate(response.citations, 1):
        print(f"[{i}] {url}")

return_citations: true を指定すると、回答テキスト中に引用番号が挿入され、レスポンスの citations 配列に参照URLが格納される。出力の情報ソースをユーザーが確認できる透明性の高いアプリケーション構築に有効だ。

検索ドメインの絞り込みと新鮮度フィルタ

response = client.chat.completions.create(
    model="sonar-pro",
    messages=[{"role": "user", "content": "個人情報保護法の最新改正内容を教えてください。"}],
    extra_body={
        "return_citations": True,
        "search_domain_filter": ["ppc.go.jp", "meti.go.jp"],
        "search_recency_filter": "month"
    }
)

search_domain_filter で信頼性の高い情報源（政府サイト・公式ドメイン等）に絞ることで回答品質を安定させられる。search_recency_filter（day / week / month / year）は市況・規制情報を扱うシステムで特に重要だ。古い情報が混入するリスクを低減できる。

主要パラメータ一覧

パラメータ	型	デフォルト	説明
`model`	string	必須	使用するモデル名
`messages`	array	必須	会話履歴（system / user / assistant）
`temperature`	float	0.2	出力の多様性。0に近いほど安定・決定論的
`max_tokens`	integer	—	最大出力トークン数。コスト管理の要
`stream`	boolean	false	ストリーミング出力の有効化
`return_citations`	boolean	false	引用URLの返却（Sonarモデルのみ）
`search_domain_filter`	array	[]	検索対象ドメインの絞り込み・除外
`search_recency_filter`	string	—	検索結果の新鮮度絞り込み（day / week / month / year）
`return_images`	boolean	false	検索結果の画像URLを返却

エラーハンドリングとレート制限対応

本番環境では429（レート制限超過）エラーへの対処が不可欠だ。Exponential backoffを実装し、リクエスト間隔を指数的に広げる設計を標準として組み込む。

import time, random

def call_with_backoff(client, max_retries=5, **kwargs):
    for attempt in range(max_retries):
        try:
            return client.chat.completions.create(**kwargs)
        except Exception as e:
            if "429" in str(e) and attempt < max_retries - 1:
                wait = (2 ** attempt) + random.uniform(0, 1)
                time.sleep(wait)
            else:
                raise

主なHTTPエラーコードと対処は次の通り。400（不正リクエスト）はパラメータとモデル名の確認、401（認証エラー）はAPIキーの再発行、500・503はサーバー側の問題であり数秒後の再試行またはステータスページの確認が基本対応となる。

Perplexity APIを活用したリアルタイム情報収集・要約パイプラインの構成例 — Perplexity APIを用いた情報収集・要約パイプラインの構成例：検索、LLM生成、社内配信が連携する

導入判断のための実用ユースケースと限界

Perplexity APIが導入効果を発揮しやすいのは、「最新情報への追従」と「引用の透明性」が業務要件として明確に存在する場面だ。

リアルタイム情報収集・要約配信では、競合情報、業界ニュース、法改正情報などを日次で自動収集し社内に配信するパイプラインに適している。システムプロンプトで「箇条書き3点以内で要約」と指定することで、出力フォーマットを安定させやすい。search_recency_filter: "day" と組み合わせることで前日情報に限定した収集も実現できる。

RAGの外部検索レイヤーとして、社内ナレッジベースにない最新の外部情報が必要な場面でPerplexity APIを「外部検索エージェント」に位置づける構成も有効だ。LangChainやLlamaIndexと組み合わせ、社内ドキュメント検索と外部Web検索を並行実行してコンテキストへ統合するアーキテクチャが設計の選択肢になる。テキストマイニングの基礎についてはテキストマイニング解説記事も参考になる。

引用付きコンテンツ生成では、マーケティング・PR用の調査レポートのドラフト生成で引用URLが自動付与されるため、ファクトチェックの工数を抑えやすくなる。ただし生成テキストをそのまま公開することは推奨しない。引用URLを担当者が検証するプロセスは必須として設計に組み込む。

一方、Perplexity APIの限界についても明確に認識する必要がある。Web上に存在しない情報（社内の非公開データ、顧客固有の情報）はWeb検索では取得できない。機密データをプロンプトに含めることはPerplexityのサーバーへの送信を意味するため、データガバナンス上の審査が先行して必要だ。また、Web検索を経由した回答は最新情報を含む反面、誤った情報源を引用する可能性もある。重要な意思決定に使う場合は人間によるファクトチェックを必ず設計に含めること。高度なコーディング生成や複雑なマルチモーダル処理では、専門特化型のモデルが上回る場面がある。

強化学習を用いたAIエージェントの設計を検討している場合は、強化学習の解説記事も参照されたい。Perplexity APIをエージェントのツールの一つとして組み込む構成の参考になる。

弊社が開発するDeepAI（バーチャルヒューマン／AIアバターソリューション）では、実在の人物の容姿・表情・声・振る舞いをデジタル空間で再現し、接客・研修・面接練習・広報などの用途に活用している。自然言語処理系のAPIを組み合わせたアバターの対話品質向上は技術的な関心領域の一つであり、外部Web検索との統合は今後の選択肢として注視している。

AI技術をゼロから整理したい場合は、AI・ディープラーニング関連の記事一覧を起点にされたい。

セキュリティと運用管理の要点

APIを本番運用に載せる前に、以下の四点を組織内で確認・整備する。

機密情報の入力制御：ユーザーが入力したテキストはPerplexityのサーバーへ送信される。個人情報・機密データ・営業秘密を含むプロンプトは送信しないよう、アプリケーション層でフィルタリングを実装する。エンタープライズ用途ではデータ処理契約（DPA）の締結を確認すること。

プロンプトインジェクション対策：ユーザー入力をそのままプロンプトへ挿入する設計は危険だ。入力のサニタイズと、system promptでの権限境界の明確化が必要になる。

APIキーの管理とローテーション：キーは環境変数（.envファイル＋dotenv等）で管理し、定期的に再生成して古いキーを失効させる運用を取り入れる。

出力の検証プロセス：Web検索経由の回答は最新情報を含む反面、誤情報を引用するリスクを内包する。特に医療・法律・金融領域の情報提供用途では、人間によるレビューをワークフローに組み込む設計が不可欠だ。

AIの業務活用・導入をご検討の方へ

クリスタルメソッドは、各種LLM・ローカルAI・RAG・AIアバターを活用した業務へのAI導入を支援しています。「自社の業務でどう使えるか」をまずはお気軽にご相談ください。

無料相談・お問い合わせ：ご相談はこちら
基礎から知る：Perplexityとは

参考文献

Perplexity API モデル一覧（公式ドキュメント）: https://docs.perplexity.ai/docs/sonar/models（2026-06-08アクセス）
Perplexity API 料金（公式ドキュメント）: https://docs.perplexity.ai/docs/getting-started/pricing（2026-06-08アクセス）
Perplexity Enterprise 料金: https://www.perplexity.ai/enterprise/pricing（2026-06-08アクセス）
Perplexity API Platform（公式）: https://www.perplexity.ai/api-platform
Perplexity API利用規約（公式）: https://www.perplexity.ai/ja/hub/legal/perplexity-api-terms-of-service
名古屋大学附属図書館医学部分館における生成AIを用いた文献検索（J-STAGE）: https://www.jstage.jst.go.jp/article/igakutoshokan/72/3/72_142/_pdf
生成AIを用いた観光情報提供の試み（J-STAGE）: https://www.jstage.jst.go.jp/article/stisymposium/27/0/27_56/_pdf/-char/en
オンライン検索×AI：Perplexity新API Sonarの概要と基本的な使い方（豆蔵デベロッパーサイト）: https://developer.mamezou-tech.com/blogs/2025/01/22/perplexity-sonar-intro/

監修

河合継（クリスタルメソッド株式会社代表取締役）

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について｜編集方針

Study about AI

AIについて学ぶ

Claude Opus 5 活用方法と企業導入ロードマップ：コスト半減と自律運用の最適解

Anthropicが発表した「Claude Opus 5」の概要 Anthropicは、同社の最新かつ最上位のフラッグシップAIモデルである「Claude Op...
OpenAIの音声エージェント開発を企業が導入する基準：新基盤「Presence」の衝撃

OpenAIの音声エージェント開発を企業が導入する基準：新基盤「Presence」の衝撃 AI技術の進展に伴い、企業のカスタマーサポートやセールス活動における自...
AI 暴走リスクセキュリティ対策：OpenAI自律ハッキング事案から学ぶ企業の防衛策

人工知能（AI）技術の進化は、業務効率化や意思決定の迅速化に大きく貢献する一方で、これまでにない新たな脅威をもたらしています。特に、自律的に判断して行動する「A...