blog

Perplexity API(Sonar)完全ガイド|料金・モデル選択・実装【2026年版】

Perplexity API(Sonar)完全ガイド|料金・モデル選択・実装【2026年版】

Perplexity APIが解決する課題――「知識カットオフ」の壁を越える検索連動型AI

Perplexity APIは、リアルタイムWeb検索と大規模言語モデルを一体化させた推論機能を、外部アプリケーションへ組み込むためのインターフェースである。通常のLLM APIが学習データの知識範囲内でしか回答できないのに対し、Perplexity APIは回答生成時にインターネット検索を実行し、最新情報を引用URL付きで返す。この「検索と生成の統合」が最大の差別化点だ。

Perplexityという会社の本質は、独自の汎用フラッグシップLLMで他社と競うことではない。検索特化の自社Sonarシリーズを中核に据え、主要他社モデルを切り替えられる「回答エンジン(AI検索)」がその正体である。開発者向けのSonar APIはこの回答エンジンの機能を外部システムへ開放したものと捉えると、モデル選択や料金体系の理解が一段と明確になる。

アプリ側リクエスト送信Sonar APIモデル・パラメータ処理Web検索実行リアルタイム取得LLM生成引用付き回答生成レスポンステキスト+citations
Perplexity APIのリクエスト・レスポンスフロー:Web検索とLLM生成が並行し、引用付き回答を返す

OpenAI互換のREST APIとして設計されているため、既存のOpenAIクライアントライブラリのベースURLを差し替えるだけで利用できる。エンドポイントは https://api.perplexity.ai/chat/completions の1本で、modelmessagestemperature などのパラメータをJSONで渡す構造はほぼ同一だ。

他のAI APIとの比較を検討する際は、DeepSeek APIMistral APIの解説記事も参照されたい。Web検索連動という特性を他社LLMのスペックと並べるうえで参考になる。

Perplexity APIのモデル選択――Sonarシリーズの構成と使い分け

Perplexity APIの中核は自社開発の「Sonarシリーズ」である。2026年6月時点の公式モデル一覧(出典:Perplexity公式モデル一覧、2026-06-08アクセス)に基づき、各モデルの特性を整理する。なお「pplx-7b」「pplx-70b」「pplx-online」等の旧モデル名は廃止済みであり、現行として記述しない。

モデル名 Web検索 コンテキスト 特徴 推奨用途
sonar あり 128K 軽量・高速・低コスト 日常的な情報収集、社内チャットbot
sonar-pro あり 約200K 高精度・マルチステップ推論・vision対応 競合調査・市場レポート生成
sonar-reasoning-pro あり 約128K Chain of Thought(CoT)推論+Web検索 金融・法律など多段階分析が必要な専門領域
sonar-deep-research あり 128K 複数ソースを自律探索・統合し長文レポートを生成 調査報告書・市場分析・デューデリジェンス
r1-1776 なし 128K DeepSeek R1ベース・オフライン動作 機密データ処理・内部文書分析

モデル選択の実務的な判断軸は、速度・コスト・推論深度の三つだ。定型的な情報収集やチャットbotには sonar が費用対効果の面で優れる。競合調査や複数情報源の統合が必要なリサーチ用途には sonar-pro が主力となる。高度な多段階分析が必要な場面では sonar-reasoning-pro が回答品質を向上させるが、レスポンス時間が数秒長くなる点は導入前に許容できるか確認が必要だ。長文の調査報告書を自動生成したい場合は sonar-deep-research だが、後述するcitation課金が別途発生することを念頭に置く。

機械学習の基礎的な仕組みを理解しておくと、各モデルの推論特性の違いが把握しやすくなる。機械学習の基礎解説ディープラーニングの解説記事を参照されたい。

Perplexity API料金体系――トークン課金とリクエスト課金の両軸を把握する

Perplexity APIの費用構造を正確に理解するには、「トークン従量課金」と「Webリクエスト課金」が独立した課金軸であることを押さえる必要がある。「Sonarは$1だけ」という単純化は誤りで、実際の請求はこの二軸の合算だ。2026年6月時点の公式料金(USD)は以下の通り(出典:Perplexity API公式料金ページ、2026-06-08アクセス)。為替・価格改定により変動するため、導入前に必ず公式を確認されたい。

モデル 入力トークン
(100万トークンあたり)
出力トークン
(100万トークンあたり)
リクエスト課金
(1,000リクエストあたり)
追加課金
sonar $1.00 $1.00 $5〜$12(low〜high context) なし
sonar-pro $3.00 $15.00 $6〜$14(low〜high context) なし
sonar-reasoning-pro $2.00 $8.00 別途リクエスト課金あり なし
sonar-deep-research $2.00 $8.00 $5 per 1,000 queries citation $2、reasoning $3(各1,000あたり)
r1-1776(オフライン) $2.00 $8.00 なし なし

sonar-deep-research はcitation課金が発生する唯一のモデルである(2026年6月時点。2025年以前はcitation課金が全モデル対象だったが、現在は当モデルのみに変更されている)。また、Pro Searchモード(API)を利用する場合は約$14〜$22 / 1,000 queriesのリクエスト課金が加算される。

コスト管理の実務ポイントを三点挙げる。第一に、システムプロンプトの簡潔化だ。毎リクエストで消費される入力トークンを削減するため、system promptは必要最小限に絞る。冗長な指示文は月間コストに直接反映される。第二に、モデルの用途分離だ。最新情報が不要なタスク(文章整形・要約・分類)には他社の軽量APIを活用し、Perplexity APIは「外部Web検索が必要な場面」に特化させる。第三に、max_tokens の明示だ。出力長の上限を指定しないと、モデルが必要以上に長い回答を生成してコストが膨らむ。用途に合わせて上限を設定する習慣をつけたい。

なお、ProプランユーザーはAPIダッシュボードから月$5分のAPIクレジットを受け取れる(Pro: 月額$20、年額$200)。小規模な検証用途であれば実質的な追加コストを抑えてスタートできる。Max(月額$200)はPerplexity Computer・Model Councilなど最上位機能が対象で、エンタープライズ向けの個人プランとして位置づけられている(出典:Perplexity Enterprise料金、2026-06-08アクセス)。

他の主要AIサービスのAPI料金との費用比較には、Claude Code APIの料金解説Grok APIの解説も参照されたい。

Perplexity APIの実装――主要パラメータと実用コードパターン

Perplexity APIはOpenAI SDKのベースURLを差し替えるだけで利用できる。APIキーはPerplexityダッシュボード(Settings → API → Generate API Key)から発行し、必ず環境変数で管理する。コードにハードコードすることやGitリポジトリへの混入は深刻なセキュリティリスクとなる。

基本リクエスト(OpenAIライブラリ流用)

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ.get("PPLX_API_KEY"),
    base_url="https://api.perplexity.ai"
)

response = client.chat.completions.create(
    model="sonar-pro",
    messages=[
        {"role": "system", "content": "日本語で簡潔に回答してください。"},
        {"role": "user", "content": "2026年のAI規制の最新動向を教えてください。"}
    ],
    temperature=0.2,
    max_tokens=1024,
    extra_body={"return_citations": True}
)

print(response.choices[0].message.content)
if hasattr(response, "citations"):
    for i, url in enumerate(response.citations, 1):
        print(f"[{i}] {url}")

return_citations: true を指定すると、回答テキスト中に引用番号が挿入され、レスポンスの citations 配列に参照URLが格納される。出力の情報ソースをユーザーが確認できる透明性の高いアプリケーション構築に有効だ。

検索ドメインの絞り込みと新鮮度フィルタ

response = client.chat.completions.create(
    model="sonar-pro",
    messages=[{"role": "user", "content": "個人情報保護法の最新改正内容を教えてください。"}],
    extra_body={
        "return_citations": True,
        "search_domain_filter": ["ppc.go.jp", "meti.go.jp"],
        "search_recency_filter": "month"
    }
)

search_domain_filter で信頼性の高い情報源(政府サイト・公式ドメイン等)に絞ることで回答品質を安定させられる。search_recency_filter(day / week / month / year)は市況・規制情報を扱うシステムで特に重要だ。古い情報が混入するリスクを低減できる。

主要パラメータ一覧

パラメータ デフォルト 説明
model string 必須 使用するモデル名
messages array 必須 会話履歴(system / user / assistant)
temperature float 0.2 出力の多様性。0に近いほど安定・決定論的
max_tokens integer 最大出力トークン数。コスト管理の要
stream boolean false ストリーミング出力の有効化
return_citations boolean false 引用URLの返却(Sonarモデルのみ)
search_domain_filter array [] 検索対象ドメインの絞り込み・除外
search_recency_filter string 検索結果の新鮮度絞り込み(day / week / month / year)
return_images boolean false 検索結果の画像URLを返却

エラーハンドリングとレート制限対応

本番環境では429(レート制限超過)エラーへの対処が不可欠だ。Exponential backoffを実装し、リクエスト間隔を指数的に広げる設計を標準として組み込む。

import time, random

def call_with_backoff(client, max_retries=5, **kwargs):
    for attempt in range(max_retries):
        try:
            return client.chat.completions.create(**kwargs)
        except Exception as e:
            if "429" in str(e) and attempt < max_retries - 1:
                wait = (2 ** attempt) + random.uniform(0, 1)
                time.sleep(wait)
            else:
                raise

主なHTTPエラーコードと対処は次の通り。400(不正リクエスト)はパラメータとモデル名の確認、401(認証エラー)はAPIキーの再発行、500・503はサーバー側の問題であり数秒後の再試行またはステータスページの確認が基本対応となる。

Perplexity APIを活用したリアルタイム情報収集・要約パイプラインの構成例
Perplexity APIを用いた情報収集・要約パイプラインの構成例:検索、LLM生成、社内配信が連携する

導入判断のための実用ユースケースと限界

Perplexity APIが導入効果を発揮しやすいのは、「最新情報への追従」と「引用の透明性」が業務要件として明確に存在する場面だ。

リアルタイム情報収集・要約配信では、競合情報、業界ニュース、法改正情報などを日次で自動収集し社内に配信するパイプラインに適している。システムプロンプトで「箇条書き3点以内で要約」と指定することで、出力フォーマットを安定させやすい。search_recency_filter: "day" と組み合わせることで前日情報に限定した収集も実現できる。

RAGの外部検索レイヤーとして、社内ナレッジベースにない最新の外部情報が必要な場面でPerplexity APIを「外部検索エージェント」に位置づける構成も有効だ。LangChainやLlamaIndexと組み合わせ、社内ドキュメント検索と外部Web検索を並行実行してコンテキストへ統合するアーキテクチャが設計の選択肢になる。テキストマイニングの基礎についてはテキストマイニング解説記事も参考になる。

引用付きコンテンツ生成では、マーケティング・PR用の調査レポートのドラフト生成で引用URLが自動付与されるため、ファクトチェックの工数を抑えやすくなる。ただし生成テキストをそのまま公開することは推奨しない。引用URLを担当者が検証するプロセスは必須として設計に組み込む。

一方、Perplexity APIの限界についても明確に認識する必要がある。Web上に存在しない情報(社内の非公開データ、顧客固有の情報)はWeb検索では取得できない。機密データをプロンプトに含めることはPerplexityのサーバーへの送信を意味するため、データガバナンス上の審査が先行して必要だ。また、Web検索を経由した回答は最新情報を含む反面、誤った情報源を引用する可能性もある。重要な意思決定に使う場合は人間によるファクトチェックを必ず設計に含めること。高度なコーディング生成や複雑なマルチモーダル処理では、専門特化型のモデルが上回る場面がある。

強化学習を用いたAIエージェントの設計を検討している場合は、強化学習の解説記事も参照されたい。Perplexity APIをエージェントのツールの一つとして組み込む構成の参考になる。

弊社が開発するDeepAI(バーチャルヒューマン/AIアバターソリューション)では、実在の人物の容姿・表情・声・振る舞いをデジタル空間で再現し、接客・研修・面接練習・広報などの用途に活用している。自然言語処理系のAPIを組み合わせたアバターの対話品質向上は技術的な関心領域の一つであり、外部Web検索との統合は今後の選択肢として注視している。

AI技術をゼロから整理したい場合は、AI・ディープラーニング関連の記事一覧を起点にされたい。

セキュリティと運用管理の要点

APIを本番運用に載せる前に、以下の四点を組織内で確認・整備する。

機密情報の入力制御:ユーザーが入力したテキストはPerplexityのサーバーへ送信される。個人情報・機密データ・営業秘密を含むプロンプトは送信しないよう、アプリケーション層でフィルタリングを実装する。エンタープライズ用途ではデータ処理契約(DPA)の締結を確認すること。

プロンプトインジェクション対策:ユーザー入力をそのままプロンプトへ挿入する設計は危険だ。入力のサニタイズと、system promptでの権限境界の明確化が必要になる。

APIキーの管理とローテーション:キーは環境変数(.envファイル+dotenv等)で管理し、定期的に再生成して古いキーを失効させる運用を取り入れる。

出力の検証プロセス:Web検索経由の回答は最新情報を含む反面、誤情報を引用するリスクを内包する。特に医療・法律・金融領域の情報提供用途では、人間によるレビューをワークフローに組み込む設計が不可欠だ。


参考文献

監修

河合 継(クリスタルメソッド株式会社 代表取締役)

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について編集方針

AIブログ購読

 
クリスタルメソッドがお届けする
AIブログの更新通知を受け取る

Study about AI

AIについて学ぶ

  • 生成AIオンプレミス導入と規制リスク——Anthropic輸出規制が示す自社インフラ回帰の必然

    生成AIオンプレミス導入と規制リスク——Anthropic輸出規制が示す自社インフラ回帰の必然

    Anthropicの輸出規制命令——生成AIオンプレミス導入が「規制リスク対策」に変わった瞬間 2026年6月、米国政府はAnthropicに対し、新モデル「M...

  • EU AI規制 企業対応の実務——ENISAとAnthropicの協議が示す日本企業への含意

    EU AI規制 企業対応の実務——ENISAとAnthropicの協議が示す日本企業への含意

    ENISAがAnthropicと直接協議——EU AI規制の監視が生成AIへ本格移行 欧州サイバーセキュリティ機関ENISA(European Union Ag...

  • Claude障害が招く業務影響と対策——AI依存リスクの経営管理指針

    Claude障害が招く業務影響と対策——AI依存リスクの経営管理指針

    Claude障害の実態:2026年6月インシデントが示すもの 2026年6月18日、AnthropicのAIチャットボット「Claude」(claude.ai)...

View more