blog
AIブログ
Qwen 料金の完全ガイド|無料枠・API単価・導入試算(2026年版)

Qwen 料金の全体構造:三層を取り違えるとコスト試算が崩れる
Alibaba Cloud(阿里巴巴)のQwenチームが開発するQwenは、「無料で使えるチャットアプリ」「従量課金のAPI」「自社インフラで動かすオープンウェイト」という三層構造を持つ。この区分を誤ると、コスト試算が大幅に外れる。とりわけ注意が必要なのは、かつて存在した常設の「無料開発者API枠(月次リセット)」が2026年4月頃に終了している点だ。現在APIを継続利用するには従量課金への登録が必要であり、無料で使い続けたい場合はQwen Chat(chat.qwen.ai)が唯一の選択肢となる。
| 利用形態 | 窓口 | 費用 | 主な対象 |
|---|---|---|---|
| Qwen Chat | chat.qwen.ai | 無料 | 個人利用・試用・評価 |
| Model Studio API(DashScope) | Alibaba Cloud | 従量課金(pay-as-you-go) | 開発者・プロダクト組み込み |
| オープンウェイト(Apache 2.0) | HuggingFace等 | モデル無料(インフラ費別途) | 大量処理・機密データ・自社運用 |
Qwenの全体像・機能についてはQwen概要記事を参照されたい。
Qwen 料金の中核:モデル別API単価一覧(2026年6月時点)
Alibaba Cloud Model Studio国際版の公式料金ページに基づき、主要モデルの単価を整理する。単位は1Mトークン(100万トークン)あたりのUSD。入力長によって段階課金(tiered pricing)が適用されるため、表は各段の下限〜上限の範囲で示す。円換算は1USD=150円を目安とした参考値であり、実際はカード会社のレートによる。
| モデル | 入力 $/1M tokens |
出力 $/1M tokens |
入力(参考円換算) | 位置づけ |
|---|---|---|---|---|
| qwen3-max 旗艦・クローズド |
約$1.20〜$3.00 | 約$6.00〜$15.00 | 約¥180〜¥450 | 1兆パラメータ超MoE。複雑推論・エージェント用途 |
| qwen3.5-plus バランス型・現行中位主力 |
約$0.40〜$1.20 | 約$1.20〜$3.60 | 約¥60〜¥180 | 性能・速度・コストの折衷。一般業務向け |
| qwen3.5-flash 軽量・高速・低コスト |
約$0.05〜$0.25 | 約$0.40〜$2.00 | 約¥7.5〜¥37 | 大量バッチ・単純タスク・コスト優先 |
| qwen-max 旧世代スナップショット |
$1.60 | $6.40 | 約¥240 | 旧世代互換。新規はqwen3-max系を推奨 |
| qwen-plus 旧世代スナップショット |
約$0.40〜$1.20 | 約$1.20〜$3.60 | 約¥60〜¥180 | 旧世代互換。新規はqwen3.5-plusを推奨 |
出典:Alibaba Cloud Model Studio — Model Pricing(alibabacloud.com、2026年6月8日確認)。価格は入力長による段階課金のため実費は変動する。最新値は公式ページで必ず確認されたい。
二点、導入検討時に注意が必要な事項を明記する。第一に、qwen-turboは更新停止済みであり、公式はqwen-flashへの移行を推奨している。社内ドキュメントや既存コードでturboを参照している場合は修正が求められる。第二に、一部ブログや第三者サービスで「Qwen3.7-Max」「Qwen3.6」等の版番が言及されることがあるが、Alibaba Cloud Model Studioの公式ドキュメント(2026年6月時点)ではこれらは確認できない。公式で確認できるまで、これらの版番に基づくコスト試算は行わないことを強く推奨する。
Qwen各モデルの性能・特徴の比較はQwen比較記事、モデル間の違いの詳細はモデル差異解説記事を参照されたい。
他社モデルとのQwen 料金比較
料金の競争力は絶対値だけでなく、同等性能帯との相対比較で判断する必要がある。下表は旗艦クラスと軽量クラスにわけて主要競合と並べたものだ。競合他社の単価は各社公式APIドキュメント掲載値(2026年6月時点の参考値)である。
| モデル | 提供元 | 入力 $/1M tokens |
出力 $/1M tokens |
無料チャットUI |
|---|---|---|---|---|
| qwen3-max | Alibaba | 約$1.20〜$3.00 | 約$6.00〜$15.00 | あり(Qwen Chat) |
| GPT-4o | OpenAI | $2.50 | $10.00 | なし(API) |
| Claude 3.5 Sonnet | Anthropic | $3.00 | $15.00 | なし(API) |
| Gemini 1.5 Pro | $1.25 | $5.00 | あり(制限付き) | |
| qwen3.5-flash | Alibaba | 約$0.05〜$0.25 | 約$0.40〜$2.00 | あり(Qwen Chat) |
| GPT-4o mini | OpenAI | $0.15 | $0.60 | なし(API) |
※競合他社価格は各社公式APIドキュメント掲載値(2026年6月時点)。為替・時期により変動する。
旗艦クラスでは、qwen3-maxの入力単価下限はGPT-4oの半額程度に収まる。軽量クラスではqwen3.5-flashの下限単価がGPT-4o miniより大幅に低く、大量バッチ処理でのコスト差は顕著になる。ただし、モデルの応答品質・日本語精度・レイテンシはユースケースによって異なるため、単価のみを根拠に選定することは推奨しない。プロトタイプ段階での検証をQwen Chat(無料)で行い、本番移行後に従量課金に切り替えるという進め方が、リスクを抑えた導入経路として現実的だ。

Qwen 料金の実務試算:導入稟議に使えるシナリオ別計算
「1Mトークン」という単位は直感的にわかりにくい。ここでは実際の業務ユースケースに近いシナリオで月額コストを試算する。いずれも段階課金の下限単価を基準とした概算であり、実費は使用量・適用段階・キャッシュヒット率によって変動する。稟議資料の作成や予算取りの参考値として活用されたい。
シナリオA:社内ヘルプデスクチャットボットの試作(小規模)
- 採用モデル:qwen3.5-plus(バランス型)
- 月間リクエスト:3,000回
- 平均入力500トークン・出力300トークン/回
- 月間消費:入力150万+出力90万=計240万トークン
- 概算費用:入力1.5×$0.40+出力0.9×$1.20 = 約$1.68(参考:約¥252)
- 導入判断のポイント:オンボーディングトライアル枠でまかなえる規模。本番移行前の検証フェーズはコストリスクが低く、段階的な稟議が取りやすい
シナリオB:SaaSプロダクトへの文書要約機能の組み込み(中規模)
- 採用モデル:qwen3.5-flash(軽量・低コスト)
- 月間リクエスト:50,000回
- 平均入力2,000トークン・出力400トークン/回
- 月間消費:入力1億+出力2,000万トークン
- 概算費用:入力100×$0.05+出力20×$0.40 = 約$13.00(参考:約¥1,950)
- 導入判断のポイント:月2,000円以下での機能実装が見込める。段階課金の適用区分とキャッシュヒット率によって実費は上下するため、初月は実測値でモデルを選定し直すことを推奨する
シナリオC:高精度な契約書レビュー・法務支援(エンタープライズ)
- 採用モデル:qwen3-max(旗艦)
- 月間リクエスト:10,000回
- 平均入力5,000トークン・出力2,000トークン/回
- 月間消費:入力5,000万+出力2,000万トークン
- 概算費用:入力50×$1.20+出力20×$6.00 = 約$180.00(参考:約¥27,000)
- 導入判断のポイント:専門性の高い大量文書処理ではAPI単価よりもモデル品質・セキュリティ要件が選定の主軸となる。機密情報を扱う場合はオープンウェイトの自社運用も選択肢となり、損益分岐の試算が必要だ
Qwen3の詳細仕様についてはQwen3詳細記事を、モデルのセットアップ手順についてはQwenセットアップ記事を参照されたい。
オープンウェイト自社運用のコスト試算と損益分岐点
Qwen3シリーズ(Qwen3-235B-A22B、Qwen3-32Bなど)はApache 2.0ライセンスで公開されており、HuggingFaceから無料でダウンロード・商用利用できる(HuggingFace Qwen3コレクション、2026年6月8日確認)。自社インフラ上で動かす場合、トークン単位の課金は発生しない。
ただし二点を明確にしておく。第一に、qwen3-maxはクローズドモデルであり重みは非公開。HuggingFaceから無料DLできるのはQwen3 dense系・Qwen3-Coder・Qwen3-VL等のオープンウェイト版に限られる。第二に、自社運用ではGPU・サーバーのインフラコストが代わりに生じる。
| モデル | 必要VRAM目安 | AWS参考コスト | 向く用途 |
|---|---|---|---|
| Qwen3-32B (dense・オープンウェイト) |
約48GB〜 | 約$2〜4/時 | 低レイテンシ・コンシューマGPU対応 |
| Qwen3-235B-A22B (MoE・オープンウェイト) |
約80GB〜 (A100×2〜4枚) |
約$15〜30/時 | 最高精度・機密データ・大量処理 |
※AWS参考コストはインスタンス種別・リージョン・利用形態によって大幅に変動する。実際の見積もりはAWS公式または各クラウドベンダーに確認されたい。
一般的な目安として、月間3,000万〜1億トークン以上を安定的に処理する規模では、インフラコストの固定費化によってAPI従量課金より総コストを抑えられる可能性がある。それ以下の規模ではAPIの方が初期投資ゼロ・運用負担ゼロの点で有利だ。また医療・金融・個人情報など機密データを扱う場合は、データを外部に送信しないというセキュリティ要件からオープンウェイト運用が選ばれることもある。なお、米国の輸出規制が中国AI技術の自律的発展を促している背景については、科学技術振興機構(JST)の報告でも言及されており(spap.jst.go.jp)、Qwenのようなオープンウェイトモデルの戦略的意義はその文脈でも理解できる。
Qwen3-Coderのコスト最適化についてはQwen Coder記事、マルチモーダル(画像・動画)用途のコスト感についてはQwen VL記事およびQwen画像編集記事を参照されたい。
コスト最適化のための実践的判断基準
Qwen APIのコストを合理的に抑えるために、導入設計段階で検討すべき点を整理する。
タスク複雑度によるモデルのカスケード選択
すべてのリクエストを旗艦モデルに送る必要はない。タスクの複雑さに応じてモデルを分けるカスケード設計が、コストと品質のバランスを最適化する最も効果的な手法のひとつだ。
プロンプト設計でのトークン削減
- システムプロンプトは簡潔に保つ(全リクエストに乗るため累積影響が大きい)
- 長い会話履歴は古い部分を要約してからコンテキストに入れる
max_tokensパラメータで出力上限を明示する- RAG構成では検索結果を必要最小限に絞り込む
プロンプトキャッシュの活用
Alibaba Cloud Model Studioでは同一プレフィックスの繰り返しリクエストに対してキャッシュヒット時の入力コスト削減が期待できる。共通のシステムプロンプトを大量リクエストで共有するユースケースでは積極的に活用したい。
予算アラートとレート制限の設定
Alibaba Cloudのコンソールでは月間予算アラートを設定でき、一定金額に近づくとメール通知が届く。プロジェクト単位でAPIのレート制限を設けることで、バグや処理の暴走による予期しない費用超過を抑えやすくなる。
バッチ処理APIの活用
リアルタイム性が不要な処理(文書分析・変換・採点など)は、バッチ処理APIを使うことで通常のAPIより割引になるケースがある。レスポンスが非同期になる点は許容する必要があるが、コスト重視の大量処理には有効だ。
音声機能を組み込む場合のコスト設計はQwen TTS記事を、Qwen全般の機能一覧はブログトップから確認できる。
弊社クリスタルメソッド株式会社が開発するDeepAIは、実在の人物の容姿・表情・声・振る舞いをデジタル空間で再現するバーチャルヒューマン/AIアバターソリューションであり、接客・研修・面接練習・広報などの用途で活用されている。Qwenを含む外部LLMとの連携可能性を検討している企業はお問い合わせいただきたい。
参考文献
- Alibaba Cloud Model Studio — Supported Models(2026年6月8日確認):https://www.alibabacloud.com/help/en/model-studio/models
- Alibaba Cloud Model Studio — Model Pricing(2026年6月8日確認):https://www.alibabacloud.com/help/en/model-studio/model-pricing
- Qwen 公式ブログ(2026年6月8日確認):https://qwenlm.github.io/blog/
- Qwen3 公式ブログ記事(2026年6月8日確認):https://qwenlm.github.io/blog/qwen3/
- Qwen3-Max-Preview 告知(公式X、2026年6月8日確認):https://x.com/Alibaba_Qwen/status/1963991502440562976
- VentureBeat — Qwen3-Max arrives in preview with 1 trillion parameters(2026年6月8日確認):https://venturebeat.com/ai/qwen3-max-arrives-in-preview-with-1-trillion-parameters-blazing-fast
- HuggingFace Qwen3 コレクション(2026年6月8日確認):https://huggingface.co/collections/Qwen/qwen3
- 科学技術振興機構(JST)— 米国からの制裁が中国AIの隆盛につながる(spap.jst.go.jp、2026年6月確認):https://spap.jst.go.jp/china/experiences/science/st_26032.html
監修
河合 継(クリスタルメソッド株式会社 代表取締役)
AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について | 編集方針
関連記事
Study about AI
AIについて学ぶ
-
生成AIオンプレミス導入と規制リスク——Anthropic輸出規制が示す自社インフラ回帰の必然
Anthropicの輸出規制命令——生成AIオンプレミス導入が「規制リスク対策」に変わった瞬間 2026年6月、米国政府はAnthropicに対し、新モデル「M...
-
EU AI規制 企業対応の実務——ENISAとAnthropicの協議が示す日本企業への含意
ENISAがAnthropicと直接協議——EU AI規制の監視が生成AIへ本格移行 欧州サイバーセキュリティ機関ENISA(European Union Ag...
-
Claude障害が招く業務影響と対策——AI依存リスクの経営管理指針
Claude障害の実態:2026年6月インシデントが示すもの 2026年6月18日、AnthropicのAIチャットボット「Claude」(claude.ai)...