blog

Qwen API 料金の完全ガイド|全モデル比較・コスト試算・選定基準

Qwen API 料金の完全ガイド|全モデル比較・コスト試算・選定基準

Qwen API 料金を理解する前に:三つの提供形態の区別

Alibaba Cloudが提供するQwen(通義千問)のAPIは、Alibaba Cloud Model Studio(DashScope API)を通じてトークン単位の従量課金(pay-as-you-go)で提供される。「Qwen API 料金」を正確に把握するには、まず提供形態を三つに分けて理解することが不可欠だ。形態によってコスト構造がまったく異なる。

  • Qwen Chat(chat.qwen.ai / qwen.ai):一般ユーザー向けチャットアプリ。画像理解・画像生成・文書処理・音声チャット等を含め無料で利用可能。ただし、これは製品として組み込むことのできないエンドユーザー向けUIであり、業務システムへの組み込みには使えない。
  • Alibaba Cloud Model Studio(DashScope API):開発者・法人向けのAPI。トークン単位の従量課金が基本となる。かつて存在した開発者向け無料API枠は2026年4月頃に終了しており、現在は新規ユーザー向けのオンボーディング試用枠(量・期間は時期によって変動)と有料従量課金が中心となっている(出典:Alibaba Cloud Model Studio — Model Pricing、2026年6月8日アクセス)。
  • オープンウェイトモデル(HuggingFace等):Qwen3シリーズ・Qwen3-Coder・Qwen3-VL等はApache 2.0ライセンスのもと無料ダウンロード・商用利用が可能(モデルごとにライセンス要確認)。ただし自社インフラでの運用コストは別途発生する。

「Qwen API 料金を調べたい」という文脈では、Model Studio経由のAPI課金が主題となる。チャットアプリでの無料利用やローカルデプロイとは性質が根本的に異なる点を、最初に明確にしておきたい。Qwenのモデル系列や各モデルの特性の全体像については、Qwenシリーズ詳細解説を参照されたい。

Qwen Chat chat.qwen.ai / qwen.ai 無料チャットアプリ 業務組み込み不可

Model Studio API DashScope(従量課金) 法人・開発者向け ★ API料金が発生

オープンウェイト HuggingFace 等 Apache 2.0 / 無料DL 自社インフラ費のみ

「Qwen API 料金」の文脈で主題となるのは中央のModel Studio API 出典:Alibaba Cloud Model Studio(2026年6月8日時点)

図1:Qwenの三つの提供形態とAPI料金発生の有無

Qwen API 料金の全モデル比較表(2026年6月時点)

以下の料金はAlibaba Cloud Model Studio国際版の公式ページ(Alibaba Cloud Model Studio — Model Pricing、2026年6月8日アクセス)に基づく。単位はUSD/100万トークン(入力・出力それぞれ)。入力長によって段階課金(tiered)が適用されるモデルがあり、表中の範囲はその最小〜最大を示す。円換算は概算であり、為替変動の影響を受ける点に注意されたい。

モデル名 位置づけ 入力
(USD/1Mトークン)
出力
(USD/1Mトークン)
備考
qwen3-max 旗艦・最上位(クローズド) 約 $1.20〜$3.00 約 $6.00〜$15.00 1T超パラメータMoE。複雑推論・エージェント向け。入力長で段階課金
qwen-max(旧世代) 旧旗艦スナップショット $1.60 $6.40 新規は qwen3-max 系への移行を推奨
qwen3.5-plus バランス型・中位主力 約 $0.40〜$1.20 約 $1.20〜$3.60 性能・速度・コストの最適バランス。エンタープライズ用途で最初の候補
qwen-plus(旧世代) 旧バランス型スナップショット 約 $0.40〜$1.20 約 $1.20〜$3.60 スナップショット版(例:qwen-plus-2025-12-01)が併存
qwen3.5-flash 軽量・高速・低コスト 約 $0.05〜$0.25 約 $0.40〜$2.00 単純タスク・大量バッチ処理向け
qwen-turbo 更新停止・非推奨 $0.05 $0.20 公式はqwen3.5-flashへの移行を推奨。新規での採用は避けること

出典:Alibaba Cloud Model Studio — Model Pricing(2026年6月8日アクセス)。価格は国際版(インターナショナル)。中国本土向けでは異なる場合がある。

表中で特に注意すべき点が二つある。第一に、qwen-turboは更新が停止しており、Alibaba Cloud公式は後継モデルとしてqwen3.5-flashへの移行を推奨している。一部の古い記事ではqwen-turboが「軽量の主力モデル」として紹介されているが、新規APIインテグレーションで選択すべきモデルではない。第二に、qwen3-maxの旗艦版と軽量版のqwen3.5-flashでは出力コストに最大37倍超の開きがある。この差は用途設計の段階から意識しなければ、運用後に大きなコスト乖離として顕在化する。

なお、一部の第三者メディアでは「Qwen3.6」「Qwen3.7-Max」といったモデル名が記載されているケースがあるが、2026年6月時点のAlibaba Cloud Model Studio公式ドキュメントでは確認できていない。本記事では一次情報として裏取りできたモデル名のみを掲載している。各モデルの詳細な料金の最新情報はQwen料金ページでも継続的に更新している。qwen-flashとqwen-turboの違いや移行の判断基準についてはQwenモデルDifferences解説も参考になる。

コスト試算の実例:モデル選択が経営判断に直結する理由

Qwen API 料金の最適化は、単なる「安いモデルを使う」ことではない。タスクの要件・品質水準・呼び出し頻度の三つを組み合わせて、最も費用対効果の高いモデルを選ぶことが目的となる。以下では、同一のシステム要件をモデル別にコスト試算した場合の差異を示す。

試算条件

  • 1リクエストあたり:入力500トークン、出力500トークン(平均)
  • 月間コール数:100万回
  • 使用する価格帯:各モデルの下限単価(短い入力のtiered下限)を適用
モデル 入力単価
(USD/1M)
出力単価
(USD/1M)
月間入力コスト 月間出力コスト 月額合計(概算)
qwen3-max(上限段階) $3.00 $15.00 $1,500 $7,500 約 $9,000
qwen3.5-plus(下限段階) $0.40 $1.20 $200 $600 約 $800
qwen3.5-flash(下限段階) $0.05 $0.40 $25 $200 約 $225

試算は説明目的の概算。単価はAlibaba Cloud Model Studio公式(2026年6月8日時点)の下限・上限段階を適用。実際のトークン数・段階区分は公式Tokenizerで計測のこと。

月間100万コールという同一条件でも、qwen3-maxとqwen3.5-flashでは約40倍の月額差が生じる。年間換算では差額が1,000万円規模に達し得るこの差は、機能開発コストやインフラコストと同等以上の経営インパクトを持つ。

APIコストの基本計算式は「総トークン数(入力+出力)× 単価」だ。1,000文字の日本語テキストはおおよそ400〜600トークンに相当するとされているが、正確なトークン数はAlibaba Cloud提供のTokenizerで事前に計測することが望ましい。単純に文字数から逆算した見積もりは実際のコストと乖離する可能性がある。

用途別モデル選択指針

  • qwen3-max:複雑な推論・マルチステップエージェント処理・法律文書の解析・高精度な多言語タスク等、品質が収益や法的判断に直結する場面。コストより品質を優先する判断が必要な局面に限定すべきだ。
  • qwen3.5-plus:カスタマーサポートの自動回答・社内ドキュメント検索・コンテンツ要約等、量と品質のバランスが求められる業務。多くのエンタープライズ用途でここが最初の検討候補となる。
  • qwen3.5-flash:大量バッチ処理・分類タスク・簡易なQ&A・応答速度が重要なリアルタイムアプリケーション。コスト感度が高く、精度要件が比較的緩い用途に適する。
  • オープンウェイト(Qwen3-32B等)のセルフホスト:自社GPU・クラウドインフラでの運用が可能であれば、中長期的にAPI課金ゼロとなる選択肢。ただしGPU調達・インフラ運用コスト・MLエンジニアリングコストとの総コスト比較が必須であり、一見「無料」に見えてもTCO(総保有コスト)は相応に発生する。

大量呼び出しを前提とするシステムでは、タスクの複雑度に応じてモデルを動的に割り当てる「ルーティング設計」が有効だ。簡易な判定はqwen3.5-flash、高度な推論が必要な場合のみqwen3-maxを呼び出す構成にするだけで、同等の品質水準を維持しながらコストを大幅に圧縮できる。他社APIとのコスト比較はDeepSeek API料金解説Mistral API料金解説、そしてClaude Code API料金解説を参照しながら横断的に検討することを推奨する。Qwen3世代のモデル特性はQwen3解説記事で詳しく扱っている。

Qwen API導入の注意点・限界・反対意見

Qwenの料金競争力は否定しがたいが、導入判断においては以下の点を冷静に評価する必要がある。コストの安さだけを根拠に採用を決定することはリスクを伴う。

地政学・コンプライアンスリスクの事前評価

QwenはAlibaba Cloud(中国企業)が提供するサービスだ。業種・データの機密性・適用法令によっては、中国企業のクラウドAPIを通じてデータを処理することに対する社内コンプライアンス審査が必要となる。デジタル庁が2025年に公表した「政府等保有データのAI学習データへの変換に係る調査研究」(PDF、digital.go.jp、2025年6月)でも、データ取り扱いとプロバイダ選択における透明性確保の重要性が論点として取り上げられている。

医療・ヘルスケア分野では、Japan AISI(AIセーフティ研究所)が2026年4月に公開した「ヘルスケア領域におけるAIセーフティ評価観点ガイド v1.0」(PDF、aisi.go.jp、2026年4月)が、AIプロバイダ選定時のリスク評価フレームワークとして参照されている。特に患者データを処理するシステムでは、APIの調達判断においてこのような公的ガイドラインを踏まえた評価プロセスの構築が求められる。金融・官公庁向けシステムでも同様の慎重な検討が不可欠だ。

価格変動リスクと長期プロジェクトへの影響

QwenのAPIは2025〜2026年にかけてモデルラインナップ・価格体系ともに急速に変化している。qwen-turboの更新停止とqwen3.5-flashへの移行推奨はその象徴的な例だ。現在安価に見えるモデルが将来も同じ価格・同じAPI仕様で提供される保証はなく、長期プロジェクトではAPIの価格変動リスクをコスト計画に明示的に織り込む必要がある。オープンウェイトモデルのセルフホストはこの変動リスクを一定程度回避する手段となるが、前述のTCO比較が前提となる。

日本語性能の実務的検証の必要性

Qwen3は119言語対応を謳っており日本語にも対応しているが(出典:Qwen3公式ブログ、2026年6月8日アクセス)、日本語特有の文脈・敬語・業界固有用語・法律用語への対応品質は実際のユースケースで検証が必要だ。英語・中国語での高い評価スコアが日本語タスクに直接対応するとは限らない。本番導入前に、自社の代表的なプロンプトセットを用いた品質評価を必ず実施すべきだ。

第三者プロキシ経由の利用と料金の混在

OpenRouterやAtlas Cloud等の第三者サービスを経由してQwenモデルを利用できる場合があるが、その際はプロキシサービス独自の料金体系が適用される。公式Model Studioの価格とは異なる場合が多く、またサービス品質・SLA・データ処理ポリシーも異なる。調達先を明確にしたうえでコスト比較を行うことが重要だ。見かけ上の「公式価格」がどの経路を前提とするものかを確認しないまま稟議を通すと、実際の請求額との乖離が生じかねない。

「Qwen Chat無料」とAPI料金の混同に注意

Qwen Chatが無料であることと、Qwen APIが無料であることはまったく別の話だ。エンドユーザー向けUIを試して「使えそうだ」と判断し、そのまま業務組み込みを検討する際に料金体系が変わることを見落とすケースがある。また、旧来の無料API開発者枠は終了しており、現在の導入では従量課金前提での予算計画が必要だ。

Qwen APIの実装・セットアップ手順についてはQwen APIセットアップガイドを、他モデルとの性能・料金の横断比較についてはQwen比較ガイドを参照されたい。QwenのTTS機能についてはQwen TTS解説で詳しく扱っている。


弊社が開発するDeepAIは、実在の人物の容姿・表情・声・振る舞いをデジタル空間で再現するバーチャルヒューマン/AIアバターソリューションであり、Qwen API等のLLMを対話AIや振る舞い再現の基盤として組み合わせることで、接客・研修・広報といった用途における自然な対話体験の構築に活用できる。LLMとバーチャルヒューマンを組み合わせた業務活用を検討される場合は、それぞれの役割分担を明確化したうえでご相談いただきたい。


参考文献

監修

河合 継(クリスタルメソッド株式会社 代表取締役)

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について編集方針

AIブログ購読

 
クリスタルメソッドがお届けする
AIブログの更新通知を受け取る

Study about AI

AIについて学ぶ

  • AI規制・州法ルール形成の最前線——米国の現実から日本企業が学ぶ教訓

    AI規制・州法ルール形成の最前線——米国の現実から日本企業が学ぶ教訓

    AI規制・州法ルール形成の現在地——連邦停滞が生む「パッチワーク」構造 2026年6月4日、米下院のJay Obernolte議員(共和・カリフォルニア州)とL...

  • Supermicro AIサーバー調達・受注390億ドルが日本企業に示す戦略的含意

    Supermicro AIサーバー調達・受注390億ドルが日本企業に示す戦略的含意

    Supermicro AIサーバー受注390億ドル・70億ドル調達計画の要点 Super Micro Computer(ティッカー: SMCI、以下Superm...

  • AI広告・合成パフォーマー開示規制の全米初施行——日本企業が今取るべき対応

    AI広告・合成パフォーマー開示規制の全米初施行——日本企業が今取るべき対応

    NY州「AI合成パフォーマー」広告開示規制——全米初の法律が施行 2026年6月9日、ニューヨーク州でAI生成の「synthetic performers(合成...

View more