blog

AIブログ

qwen 料金｜2026年版ガイド

Qwen料金の全貌：無料枠から有料APIまで徹底解説

Qwenはアリババクラウドが開発する大規模言語モデルシリーズです。GPT-4oやClaude 3.5と直接競合する高性能モデルでありながら、無料で使える範囲が驚くほど広いのが特徴です。2026年6月時点での最新世代はQwen 3シリーズとなり、推論・数学ベンチマークで最強クラスのオープンウェイトモデルへと進化しています。「どのモデルがいくらなのか」「無料枠はどこまで使えるのか」「日本円でどう換算すればよいのか」といった疑問は調べるほど複雑に見えます。この記事では2026年時点の最新料金体系を、モデル別・用途別にわかりやすく整理します。

Qwen料金体系の基本構造

Qwenの料金は大きく「Qwen Chat（無料チャットアプリ）」「従量課金API」「Alibabaクラウドの商用プラン」の3層に分かれます。個人利用・小規模開発であれば無料のQwen Chatや一時的なオンボーディング枠で相当なことができますが、本番運用や大量リクエストには従量課金が必要です。

① Qwen Chat（無料）

chat.qwen.ai経由
チャット・画像生成等
APIキー不要

→

② 従量課金API

Model Studio経由
1Mトークン単位で課金

→

③ 商用プラン

Alibabaクラウド
契約・SLA保証付き

APIへのアクセスはAlibaba Cloud Model Studio（DashScope API）経由で行います。新規アカウントにはオンボーディング用の一時的な無料トライアル枠が付与されますが、かつてあった常設の無料開発者API枠は2026年4月頃に終了しており、現在は従量課金（pay-as-you-go）が基本です。無料でQwenを試したい場合はQwen Chat（chat.qwen.ai）を活用するのが最も手軽です。

Qwen 3シリーズとは：2026年時点の最新世代

2026年6月時点でのQwenの最新世代はQwen 3です。前世代のQwen 2／2.5から大幅に進化し、特に推論・数学分野で世界最高水準のオープンウェイトモデルへと成長しました。「思考（thinking）／非思考」モード切替や119言語対応も特徴です。主要なQwen 3モデルの概要を以下に示します。

Qwen3-235B-A22B

MoEアーキテクチャ（総パラメータ235B・活性22B）
Apache 2.0ライセンス・オープンウェイト
推論・数学で最強クラス
HuggingFaceから無料ダウンロード可

Qwen3-32B / 14B / 8B ほか

密（dense）アーキテクチャの開放モデル群
Apache 2.0ライセンス
コンシューマ向けハードウェアでの動作も可能
ローカル推論・エッジデプロイに最適

qwen3-max（API・クローズド）

1兆パラメータ超のMoE・重み非公開
現行の旗艦・最上位APIモデル
高精度タスク・エージェント・エンタープライズ用途
Alibaba Cloud Model Studio／Qwen Chat経由

ℹ Qwen3-235B-A22BのMoEアーキテクチャについて
総パラメータ数235Bを持ちながら、1回の推論で実際に活性化されるのは22Bのみです。これにより、大規模モデルの高い表現力を保ちながら、推論コストを大幅に抑えることができます。なお、このオープンウェイト版とは別に、クローズドな旗艦APIモデル「qwen3-max」（1兆パラメータ超）が存在します。HuggingFaceから無料ダウンロードできるのはオープンウェイトの Qwen3 系のみです。

モデル別API料金一覧（2026年版）

Qwenシリーズには規模・用途・モダリティごとに多数のモデルがあります。主要モデルのAPI料金を以下にまとめます。価格はAlibaba Cloud Model Studioの公式ページに準拠し、単位は1Mトークン（100万トークン）あたりの米ドルです（入力長による段階課金あり）。円換算は目安として1USD＝150円で計算しています。

テキスト系モデルの料金

モデル名	入力（$/1M tokens）	出力（$/1M tokens）	主な用途
qwen3-max 旗艦・クローズド	約$1.20〜$3.00 （≒約¥180〜¥450）	約$6.00〜$15.00 （≒約¥900〜¥2,250）	高精度タスク・エージェント・複雑推論
qwen3.5-plus バランス型・中位主力	参考: qwen-plus系約$0.40〜$1.20 （≒約¥60〜¥180）	約$1.20〜$3.60 （≒約¥180〜¥540）	バランス型・一般チャット・要約
qwen3.5-flash 軽量・高速	参考: qwen-flash系約$0.05〜$0.25 （≒約¥7.5〜¥37）	約$0.40〜$2.00 （≒約¥60〜¥300）	高速・低コスト・大量バッチ・単純タスク
qwen-max 旧世代スナップショット	$1.60 （≒約¥240）	$6.40 （≒約¥960）	旧世代互換。新規は qwen3-max 系を推奨
qwen-plus 旧世代スナップショット	約$0.40〜$1.20 （≒約¥60〜¥180）	約$1.20〜$3.60 （≒約¥180〜¥540）	旧世代互換。新規は qwen3.5-plus を推奨

※料金は2026年6月時点の公式価格をもとに記載。入力長による段階課金（tiered pricing）があるため、実際のコストは使用量によって変動します。最新値はAlibaba Cloud Model Studioの料金ページで必ず確認してください。

マルチモーダル・特化モデルの料金

モデル名	価格（参考）	特徴
Qwen3-VL （視覚言語・オープンウェイト）	Apache 2.0・無料DL （API利用は従量課金）	画像・動画理解、OCR、図表解析。例：Qwen3-VL-235B-A22B-Instruct
Qwen3-Coder （コーディング特化・オープンウェイト）	Apache 2.0・無料DL （API利用は従量課金）	コード生成・デバッグ・補完・コーディングエージェント。例：Qwen3-Coder-Next（総80B/活性3B）
Qwen-MT （翻訳特化）	Model Studio 従量課金	多言語翻訳特化。119言語対応の Qwen3 基盤
Qwen3Guard （安全・モデレーション）	Model Studio 従量課金	コンテンツ安全・モデレーション用途

※マルチモーダル・特化モデルの詳細価格は公式料金ページおよび対応モデル一覧を参照してください。

無料で利用できる範囲と注意点

Qwenを無料で使う方法は主に2つあります。一般ユーザー向けのQwen Chatと、開発者向けのオンボーディングトライアル枠です。この2つは仕組みが異なるため、よく理解しておく必要があります。

Qwen Chat（chat.qwen.ai）：無料チャットアプリ

アカウント登録後、APIキーなしで無料利用可能
チャット・画像理解・画像生成・画像編集・文書処理・音声・動画チャットなど幅広い機能に対応
個人の試用・日常利用に最適
商用利用・API連携には対応しない（チャットUIのみ）

Model Studio オンボーディングトライアル枠（開発者向け）

アカウント作成後に付与される一時的な無料トライアル枠（量・有効期限は時期により変動）
常設の「毎月リセット無料トークン」は2026年4月頃に終了。現在はトライアル枠＋従量課金が基本
トライアル枠消化後は自動的に従量課金に移行（残高管理に注意）
最新のトライアル内容はModel Studio公式ページで確認を

オープンウェイト：Apache 2.0で完全無料

Qwen3系・Qwen3-Coder・Qwen3-VLなどはApache 2.0ライセンスでHuggingFaceから無料ダウンロード・商用利用可
自社インフラで動かせばトークン単位の課金は一切発生しない
ただしqwen3-maxなどクローズドモデルの重みは非公開。HuggingFaceからDLできるのはオープンウェイト版のみ

⚠ 注意：「無料API枠が毎月もらえる」は旧情報
かつて存在した常設の無料開発者API枠（毎月リセット）は2026年4月頃に終了しています。現在、APIを継続利用するには従量課金への登録が必要です。無料で使い続けたい場合はQwen Chat（chat.qwen.ai）をご利用ください。

他社モデルとの料金比較

Qwenの料金競争力を把握するために、同等性能帯の競合モデルと比較します。

モデル	提供元	入力 $/1M tokens	出力 $/1M tokens	無料チャット
qwen3-max	Alibaba	約$1.20〜$3.00	約$6.00〜$15.00	あり（Qwen Chat）
GPT-4o	OpenAI	$2.50	$10.00	なし（API）
Claude 3.5 Sonnet	Anthropic	$3.00	$15.00	なし（API）
Gemini 1.5 Pro	Google	$1.25	$5.00	あり（制限付き）
qwen3.5-flash	Alibaba	約$0.05〜$0.25	約$0.40〜$2.00	あり（Qwen Chat）
GPT-4o mini	OpenAI	$0.15	$0.60	なし（API）

qwen3-maxはGPT-4oと比べて入力コストが大幅に安く、軽量帯のqwen3.5-flashはGPT-4o miniよりさらに低価格という競争力があります。加えてQwen Chat経由の無料チャット利用が可能な点は、プロトタイプ検証や個人利用において大きなアドバンテージです。

料金計算の実例：具体的なシナリオで試算

「1Mトークンと言われてもピンとこない」という方のために、実際の使用シナリオで月額コストを試算します。

シナリオA：個人開発者がチャットボットを試作する場合

モデル：qwen3.5-plus
月間リクエスト：3,000回
平均入力：500トークン／回、平均出力：300トークン／回
月間消費：入力150万トークン＋出力90万トークン＝計240万トークン
概算費用：入力150万×約$0.40/1M＋出力90万×約$1.20/1M ＝ 約$0.60＋$1.08＝約$1.68（≒約¥252/月）
※小規模試作段階ではオンボーディングトライアル枠の活用も検討を

シナリオB：中規模SaaSがqwen3.5-flashで要約機能を提供する場合

モデル：qwen3.5-flash
月間リクエスト：50,000回
平均入力：2,000トークン／回、平均出力：400トークン／回
月間消費：入力1億トークン＋出力2,000万トークン
費用：入力$0.05×100＋出力$0.40×20（下限参考値）＝ $5.00＋$8.00＝約$13.00（≒約¥1,950/月）
※段階課金の適用区分により実費は変動します

シナリオC：Qwen3-VLで月1万枚の画像解析を行う場合

モデル：Qwen3-VL（API利用・従量課金）
画像1枚あたり：入力約1,000トークン（画像トークン含む）、出力200トークン
月間消費：入力1,000万トークン＋出力200万トークン
費用：最新の公式料金ページで確認のこと（視覚言語モデルは別途料金設定）

このように、テキスト中心のユースケースであれば月数百円〜数千円以下で本格的なAI機能を実装できるのがQwenの大きな強みです。

サードパーティ経由で利用する場合の料金

QwenはAlibaba Cloud Model Studio以外にも、複数のプラットフォームからアクセスできます。それぞれ料金体系が異なります。

OpenRouter経由

OpenRouterはAlibaba公式APIをリレーするサービスで、OpenAI互換のAPIキーで呼び出せます。料金はAlibaba公式より若干高めに設定されることが多く、Qwen3系モデルの場合も公式より10〜20%程度上乗せされるケースがあります。ただしクレジットカードの国際決済に不安がある場合や、OpenAI互換インターフェースを使いたい開発者には便利です。

Together AI・Fireworks AI経由

Together AIやFireworks AIでも一部のQwenモデルを提供しており、公式と同水準か若干異なる価格になる場合があります。ただしモデルの最新バージョン対応は公式より遅れる傾向があり、Qwen 3の最新モデルはまず公式で提供されます。

Qwen Chat（chat.qwen.ai）の無料チャットUI

Alibabaが提供するWebチャットUI「Qwen Chat」は個人利用向けの無料チャットインターフェースです。APIキーは不要で、ブラウザから直接Qwen 3世代のモデルと会話できます。ただし商用利用・API連携には対応しておらず、あくまで個人の試用・日常利用目的に限定されます。

コスト最適化のための実践的テクニック

Qwen APIの料金を抑えながら品質を維持するには、いくつかの工夫が有効です。

モデルのカスケード選択

すべてのリクエストを最上位モデルに送る必要はありません。タスクの複雑さに応じてモデルを使い分けるカスケード構成が効果的です。

単純なFAQ

qwen3.5-flash

低コスト・高速

→

一般的な要約・分析

qwen3.5-plus

バランス型・中位

→

複雑な推論・エージェント

qwen3-max

旗艦・最上位

プロンプトの最適化でトークン削減

システムプロンプトは簡潔に保つ（毎回送信されるため影響が大きい）
チャット履歴の圧縮：古い会話を要約してからコンテキストに入れる
RAG構成では検索結果を必要最低限に絞り込む
出力長の制限：max_tokensパラメータで上限を設ける

キャッシュ機能の活用

Alibaba Cloud Model Studioでは「プロンプトキャッシュ」機能が提供されており、同一プレフィックスの繰り返しリクエストはキャッシュヒット時に入力コストが削減されます。同一システムプロンプトを大量のリクエストで共有するユースケースでは、積極的に活用しましょう。

バッチ処理APIの利用

リアルタイム性が不要な処理（分析・変換・採点など）は、バッチ処理APIを使うことで通常APIより割引になるケースがあります。レスポンスが非同期になる点は許容する必要がありますが、コスト重視の大量処理には有効です。

支払い方法・請求の仕組み

Alibaba Cloud Model Studioでの支払いについて、日本のユーザーが知っておくべきポイントをまとめます。

対応している支払い方法

クレジットカード（Visa・Mastercard・AmericanExpress）
Alibabaクラウドのプリペイドクレジット（チャージ式）
一部地域では銀行振込・請求書払い（法人向け）

請求通貨と為替

料金は基本的に米ドル（USD）建てで設定されています。クレジットカード決済の場合、カード会社の為替レートで円換算されます。Alibabaクラウドの国際サイトでは一部日本円表示も選択できますが、実際の請求はUSDベースが基本です。

請求タイミング

従量課金：月次請求（月末に前月分を集計）
プリペイドクレジット：チャージ時に即時決済
利用金額が一定のしきい値を超えた場合の中間請求あり（設定値による）

予算アラートとコスト上限設定

Alibaba Cloudのコンソールでは月間予算アラートを設定でき、設定金額に近づくとメールで通知が届きます。また、API呼び出しのレート制限をプロジェクト単位で設定することで、予期しない大量リクエストによる費用超過を防ぐことができます。

法人・エンタープライズ向けプランについて

大規模な商用利用を検討する企業向けに、Alibaba Cloudではエンタープライズプランも提供しています。

エンタープライズプランの主な特徴

ボリュームディスカウント：月間使用量に応じた割引（通常10〜30%程度）
SLA保証：99.9%以上の稼働率保証と優先サポート
専用エンドポイント：レート制限が緩和されたプライベートデプロイオプション
コンプライアンス対応：データ処理地域の指定、SOC2・ISOなどの認証対応
カスタムファインチューニング：自社データでのモデル追加学習（別途料金）

エンタープライズプランの具体的な価格は個別見積もりとなります。Alibaba Cloud Japanの営業チームに問い合わせることで、日本語でのサポートと日本円での請求に対応した契約が可能です。

Qwenをオープンウェイトで自社運用する場合のコスト

Qwen 3シリーズはApache 2.0ライセンスでモデルウェイトが公開されており、自社インフラで動かす場合はトークン単位の課金が一切発生しません。特にQwen3-235B-A22BはMoEアーキテクチャにより、総パラメータ235Bながら推論時の実活性パラメータが22Bに抑えられているため、同等品質の密結合モデルより少ないGPUリソースで運用できる点がメリットです。ただし、インフラコストは別途かかります。なお、qwen3-maxはクローズドモデルのため、自社運用はできません。

モデル	必要GPU（推論目安）	AWS参考コスト	適した用途
Qwen3-32B （dense・オープンウェイト）	VRAM 48GB程度（コンシューマGPU対応）	約$2.00〜4.00/時	ローカル推論・低レイテンシ
Qwen3-235B-A22B （MoE・オープンウェイト）	VRAM 80GB〜（A100×2〜4枚）活性22Bで推論効率高	約$15.00〜30.00/時	最高精度・機密データ・大量処理

自社運用が割安になるのは、月間3,000万〜1億トークン以上を安定的に処理する規模が目安です。それ以下であればAPIのほうが初期投資ゼロ・運用コストゼロで有利です。また、医療・金融など機密データを扱う場合はデータの外部送信を避けるため、セキュリティ観点から

参考文献

監修

河合継（クリスタルメソッド株式会社代表取締役）

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について｜編集方針

Study about AI

AIについて学ぶ

AI規制・州法ルール形成の最前線——米国の現実から日本企業が学ぶ教訓

AI規制・州法ルール形成の現在地——連邦停滞が生む「パッチワーク」構造 2026年6月4日、米下院のJay Obernolte議員（共和・カリフォルニア州）とL...
Supermicro AIサーバー調達・受注390億ドルが日本企業に示す戦略的含意

Supermicro AIサーバー受注390億ドル・70億ドル調達計画の要点 Super Micro Computer（ティッカー: SMCI、以下Superm...
AI広告・合成パフォーマー開示規制の全米初施行——日本企業が今取るべき対応

NY州「AI合成パフォーマー」広告開示規制——全米初の法律が施行 2026年6月9日、ニューヨーク州でAI生成の「synthetic performers（合成...