blog

AIブログ

Qwen 料金の完全ガイド｜無料枠・API単価・導入試算（2026年版）

Qwen 料金の全体構造：三層を取り違えるとコスト試算が崩れる

Alibaba Cloud（阿里巴巴）のQwenチームが開発するQwenは、「無料で使えるチャットアプリ」「従量課金のAPI」「自社インフラで動かすオープンウェイト」という三層構造を持つ。この区分を誤ると、コスト試算が大幅に外れる。とりわけ注意が必要なのは、かつて存在した常設の「無料開発者API枠（月次リセット）」が2026年4月頃に終了している点だ。現在APIを継続利用するには従量課金への登録が必要であり、無料で使い続けたい場合はQwen Chat（chat.qwen.ai）が唯一の選択肢となる。

利用形態	窓口	費用	主な対象
Qwen Chat	chat.qwen.ai	無料	個人利用・試用・評価
Model Studio API（DashScope）	Alibaba Cloud	従量課金（pay-as-you-go）	開発者・プロダクト組み込み
オープンウェイト（Apache 2.0）	HuggingFace等	モデル無料（インフラ費別途）	大量処理・機密データ・自社運用

Qwenの三層利用形態とコスト構造（2026年6月時点）

Qwenの全体像・機能についてはQwen概要記事を参照されたい。

Qwen 料金の中核：モデル別API単価一覧（2026年6月時点）

Alibaba Cloud Model Studio国際版の公式料金ページに基づき、主要モデルの単価を整理する。単位は1Mトークン（100万トークン）あたりのUSD。入力長によって段階課金（tiered pricing）が適用されるため、表は各段の下限〜上限の範囲で示す。円換算は1USD＝150円を目安とした参考値であり、実際はカード会社のレートによる。

モデル	入力 $/1M tokens	出力 $/1M tokens	入力（参考円換算）	位置づけ
qwen3-max 旗艦・クローズド	約$1.20〜$3.00	約$6.00〜$15.00	約¥180〜¥450	1兆パラメータ超MoE。複雑推論・エージェント用途
qwen3.5-plus バランス型・現行中位主力	約$0.40〜$1.20	約$1.20〜$3.60	約¥60〜¥180	性能・速度・コストの折衷。一般業務向け
qwen3.5-flash 軽量・高速・低コスト	約$0.05〜$0.25	約$0.40〜$2.00	約¥7.5〜¥37	大量バッチ・単純タスク・コスト優先
qwen-max 旧世代スナップショット	$1.60	$6.40	約¥240	旧世代互換。新規はqwen3-max系を推奨
qwen-plus 旧世代スナップショット	約$0.40〜$1.20	約$1.20〜$3.60	約¥60〜¥180	旧世代互換。新規はqwen3.5-plusを推奨

出典：Alibaba Cloud Model Studio — Model Pricing（alibabacloud.com、2026年6月8日確認）。価格は入力長による段階課金のため実費は変動する。最新値は公式ページで必ず確認されたい。

二点、導入検討時に注意が必要な事項を明記する。第一に、qwen-turboは更新停止済みであり、公式はqwen-flashへの移行を推奨している。社内ドキュメントや既存コードでturboを参照している場合は修正が求められる。第二に、一部ブログや第三者サービスで「Qwen3.7-Max」「Qwen3.6」等の版番が言及されることがあるが、Alibaba Cloud Model Studioの公式ドキュメント（2026年6月時点）ではこれらは確認できない。公式で確認できるまで、これらの版番に基づくコスト試算は行わないことを強く推奨する。

Qwen各モデルの性能・特徴の比較はQwen比較記事、モデル間の違いの詳細はモデル差異解説記事を参照されたい。

他社モデルとのQwen 料金比較

料金の競争力は絶対値だけでなく、同等性能帯との相対比較で判断する必要がある。下表は旗艦クラスと軽量クラスにわけて主要競合と並べたものだ。競合他社の単価は各社公式APIドキュメント掲載値（2026年6月時点の参考値）である。

モデル	提供元	入力 $/1M tokens	出力 $/1M tokens	無料チャットUI
qwen3-max	Alibaba	約$1.20〜$3.00	約$6.00〜$15.00	あり（Qwen Chat）
GPT-4o	OpenAI	$2.50	$10.00	なし（API）
Claude 3.5 Sonnet	Anthropic	$3.00	$15.00	なし（API）
Gemini 1.5 Pro	Google	$1.25	$5.00	あり（制限付き）
qwen3.5-flash	Alibaba	約$0.05〜$0.25	約$0.40〜$2.00	あり（Qwen Chat）
GPT-4o mini	OpenAI	$0.15	$0.60	なし（API）

※競合他社価格は各社公式APIドキュメント掲載値（2026年6月時点）。為替・時期により変動する。

旗艦クラスでは、qwen3-maxの入力単価下限はGPT-4o（2026年6月時点の比較参考値）の半額程度に収まる。軽量クラスではqwen3.5-flashの下限単価がGPT-4o mini（同）より大幅に低く、大量バッチ処理でのコスト差は顕著になる。ただし、モデルの応答品質・日本語精度・レイテンシはユースケースによって異なるため、単価のみを根拠に選定することは推奨しない。プロトタイプ段階での検証をQwen Chat（無料）で行い、本番移行後に従量課金に切り替えるという進め方が、リスクを抑えた導入経路として現実的だ。

APIコストはトークン消費量と単価の積で決まる。段階課金の適用区分を事前に確認することが重要

Qwen 料金の実務試算：導入稟議に使えるシナリオ別計算

「1Mトークン」という単位は直感的にわかりにくい。ここでは実際の業務ユースケースに近いシナリオで月額コストを試算する。いずれも段階課金の下限単価を基準とした概算であり、実費は使用量・適用段階・キャッシュヒット率によって変動する。稟議資料の作成や予算取りの参考値として活用されたい。

シナリオA：社内ヘルプデスクチャットボットの試作（小規模）

採用モデル：qwen3.5-plus（バランス型）
月間リクエスト：3,000回
平均入力500トークン・出力300トークン／回
月間消費：入力150万＋出力90万＝計240万トークン
概算費用：入力1.5×$0.40＋出力0.9×$1.20 ＝ 約$1.68（参考：約¥252）
導入判断のポイント：オンボーディングトライアル枠でまかなえる規模。本番移行前の検証フェーズはコストリスクが低く、段階的な稟議が取りやすい

シナリオB：SaaSプロダクトへの文書要約機能の組み込み（中規模）

採用モデル：qwen3.5-flash（軽量・低コスト）
月間リクエスト：50,000回
平均入力2,000トークン・出力400トークン／回
月間消費：入力1億＋出力2,000万トークン
概算費用：入力100×$0.05＋出力20×$0.40 ＝ 約$13.00（参考：約¥1,950）
導入判断のポイント：月2,000円以下での機能実装が見込める。段階課金の適用区分とキャッシュヒット率によって実費は上下するため、初月は実測値でモデルを選定し直すことを推奨する

シナリオC：高精度な契約書レビュー・法務支援（エンタープライズ）

採用モデル：qwen3-max（旗艦）
月間リクエスト：10,000回
平均入力5,000トークン・出力2,000トークン／回
月間消費：入力5,000万＋出力2,000万トークン
概算費用：入力50×$1.20＋出力20×$6.00 ＝ 約$180.00（参考：約¥27,000）
導入判断のポイント：専門性の高い大量文書処理ではAPI単価よりもモデル品質・セキュリティ要件が選定の主軸となる。機密情報を扱う場合はオープンウェイトの自社運用も選択肢となり、損益分岐の試算が必要だ

Qwen3の詳細仕様についてはQwen3詳細記事を、モデルのセットアップ手順についてはQwenセットアップ記事を参照されたい。

オープンウェイト自社運用のコスト試算と損益分岐点

Qwen3シリーズ（Qwen3-235B-A22B、Qwen3-32Bなど）はApache 2.0ライセンスで公開されており、HuggingFaceから無料でダウンロード・商用利用できる（HuggingFace Qwen3コレクション、2026年6月8日確認）。自社インフラ上で動かす場合、トークン単位の課金は発生しない。

ただし二点を明確にしておく。第一に、qwen3-maxはクローズドモデルであり重みは非公開。HuggingFaceから無料DLできるのはQwen3 dense系・Qwen3-Coder・Qwen3-VL等のオープンウェイト版に限られる。第二に、自社運用ではGPU・サーバーのインフラコストが代わりに生じる。

モデル	必要VRAM目安	AWS参考コスト	向く用途
Qwen3-32B (dense・オープンウェイト)	約48GB〜	約$2〜4/時	低レイテンシ・コンシューマGPU対応
Qwen3-235B-A22B (MoE・オープンウェイト)	約80GB〜 (A100×2〜4枚)	約$15〜30/時	最高精度・機密データ・大量処理

※AWS参考コストはインスタンス種別・リージョン・利用形態によって大幅に変動する。実際の見積もりはAWS公式または各クラウドベンダーに確認されたい。

一般的な目安として、月間3,000万〜1億トークン以上を安定的に処理する規模では、インフラコストの固定費化によってAPI従量課金より総コストを抑えられる可能性がある。それ以下の規模ではAPIの方が初期投資ゼロ・運用負担ゼロの点で有利だ。また医療・金融・個人情報など機密データを扱う場合は、データを外部に送信しないというセキュリティ要件からオープンウェイト運用が選ばれることもある。なお、米国の輸出規制が中国AI技術の自律的発展を促している背景については、科学技術振興機構（JST）の報告でも言及されており（spap.jst.go.jp）、Qwenのようなオープンウェイトモデルの戦略的意義はその文脈でも理解できる。

Qwen3-Coderのコスト最適化についてはQwen Coder記事、マルチモーダル（画像・動画）用途のコスト感についてはQwen VL記事およびQwen画像編集記事を参照されたい。

コスト最適化のための実践的判断基準

Qwen APIのコストを合理的に抑えるために、導入設計段階で検討すべき点を整理する。

タスク複雑度によるモデルのカスケード選択

すべてのリクエストを旗艦モデルに送る必要はない。タスクの複雑さに応じてモデルを分けるカスケード設計が、コストと品質のバランスを最適化する最も効果的な手法のひとつだ。

タスク複雑度に応じたモデルカスケード設計の概念図

プロンプト設計でのトークン削減

システムプロンプトは簡潔に保つ（全リクエストに乗るため累積影響が大きい）
長い会話履歴は古い部分を要約してからコンテキストに入れる
max_tokensパラメータで出力上限を明示する
RAG構成では検索結果を必要最小限に絞り込む

プロンプトキャッシュの活用

Alibaba Cloud Model Studioでは同一プレフィックスの繰り返しリクエストに対してキャッシュヒット時の入力コスト削減が期待できる。共通のシステムプロンプトを大量リクエストで共有するユースケースでは積極的に活用したい。

予算アラートとレート制限の設定

Alibaba Cloudのコンソールでは月間予算アラートを設定でき、一定金額に近づくとメール通知が届く。プロジェクト単位でAPIのレート制限を設けることで、バグや処理の暴走による予期しない費用超過を抑えやすくなる。

バッチ処理APIの活用

リアルタイム性が不要な処理（文書分析・変換・採点など）は、バッチ処理APIを使うことで通常のAPIより割引になるケースがある。レスポンスが非同期になる点は許容する必要があるが、コスト重視の大量処理には有効だ。

音声機能を組み込む場合のコスト設計はQwen TTS記事を、Qwen全般の機能一覧はブログトップから確認できる。

弊社クリスタルメソッド株式会社が開発するDeepAIは、実在の人物の容姿・表情・声・振る舞いをデジタル空間で再現するバーチャルヒューマン／AIアバターソリューションであり、接客・研修・面接練習・広報などの用途で活用されている。Qwenを含む外部LLMとの連携可能性を検討している企業はお問い合わせいただきたい。

参考文献

Alibaba Cloud Model Studio — Supported Models（2026年6月8日確認）：https://www.alibabacloud.com/help/en/model-studio/models
Alibaba Cloud Model Studio — Model Pricing（2026年6月8日確認）：https://www.alibabacloud.com/help/en/model-studio/model-pricing
Qwen 公式ブログ（2026年6月8日確認）：https://qwenlm.github.io/blog/
Qwen3 公式ブログ記事（2026年6月8日確認）：https://qwenlm.github.io/blog/qwen3/
Qwen3-Max-Preview 告知（公式X、2026年6月8日確認）：https://x.com/Alibaba_Qwen/status/1963991502440562976
VentureBeat — Qwen3-Max arrives in preview with 1 trillion parameters（2026年6月8日確認）：https://venturebeat.com/ai/qwen3-max-arrives-in-preview-with-1-trillion-parameters-blazing-fast
HuggingFace Qwen3 コレクション（2026年6月8日確認）：https://huggingface.co/collections/Qwen/qwen3
科学技術振興機構（JST）— 米国からの制裁が中国AIの隆盛につながる（spap.jst.go.jp、2026年6月確認）：https://spap.jst.go.jp/china/experiences/science/st_26032.html

監修

河合継（クリスタルメソッド株式会社代表取締役）

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について｜編集方針

AIの業務活用をご検討の方へ

クリスタルメソッドは、バーチャルヒューマンをはじめAIの開発・業務導入を支援しています。生成AI・AIエージェントの活用や、自社業務へのAI導入をご検討の際は、お気軽にご相談ください。

無料相談・お問い合わせ：ご相談はこちら

Study about AI

AIについて学ぶ

AI面接の通過率を上げる受け方｜落ちる人の共通点と今すぐできる対策

「手応えがあったのに、なぜ落ちたのだろう」——AI面接のフィードバックを何度読み返しても、どこが悪かったのか腑に落ちない。その感覚はおかしくない。AI面接の評価...
新卒の面接対策｜就活で評価される準備と答え方

「何を答えるか」は準備できた。エントリーシートも添削してもらった。でも、いざカメラの前で話すと言葉に詰まり、自分の表情が固まっているかどうかもわからない——就活...
AI面接の服装｜録画・オンライン面接で好印象な身だしなみ

結論：AI面接の服装は「対面と同じ清潔感」でOK——開発側から理由を説明する先に答えを出す。AI面接の服装は、対面面接と同じ清潔感を保てばそれで十分だ。私服で...