blog
AIブログ
Mistral最新モデル比較|Small・Medium・Largeの違いと選び方
Mistral AIは2023年の創業以来、急速にモデルラインナップを拡充し、2025〜2026年時点では軽量オープンモデルからエンタープライズ向けフロンティアモデルまで多岐にわたる選択肢を提供しています。「どのモデルを選べばいいのか」「APIで使えるモデルはどれか」「オープンウェイトと商用モデルの違いは何か」——本記事ではそうした疑問に答えるべく、Mistral AIの全モデルを体系的に整理します。実際にAPIおよびローカル環境で各モデルを検証してきた知見も交えながら、用途別の選び方まで解説します。
Mistral AIのモデル体系:まず全体像を把握する
Mistral AIのモデルは大きく「オープンウェイトモデル」と「商用(プロプライエタリ)モデル」の二軸で整理できます。オープンウェイトモデルはApache 2.0などのライセンスで重みが公開されており、ローカル実行やファインチューニングが自由に行えます。商用モデルはAPIを通じてのみ利用可能で、より高い性能・機能を持ちます。
| カテゴリ | 代表モデル | 特徴 | 入手方法 |
|---|---|---|---|
| オープンウェイト(軽量) | Ministral 3(3B/8B/14B) | ローカル実行可・低コスト・ビジョン対応 | HuggingFace/API |
| オープンウェイト(汎用旗艦) | Mistral Large 3(Mistral 3) | 大規模MoE・マルチモーダル・高性能 | HuggingFace/API |
| 商用フロンティア | Mistral Medium 3.5、Mistral Small 4 | エージェント・コーディング・マルチモーダル | API(la Plateforme) |
| 特化型・専門モデル | Devstral 2、Codestral、OCR 3、Voxtral | コードエージェント・文書認識・音声 | API |
| エンベディング | Mistral Embed、Codestral Embed | RAG・検索用ベクトル化・コード表現 | API |
Mistral AIの概要・背景・企業情報についてはMistral AIとは何かで詳しく解説しています。本記事ではモデルの仕様・性能・用途の深掘りに集中します。
オープンウェイトモデル詳細
オープンウェイトモデルは商用利用を含む幅広いライセンスで重みが公開されており、自社インフラへのデプロイやファインチューニングが可能です。コスト管理とデータプライバシーの両立を求めるプロジェクトで特に重宝します。
Mistral Large 3(Mistral 3)
2025年12月2日に発表されたオープンウェイトの汎用マルチモーダル旗艦モデルです。大手ラボ最大級のオープンウェイトMoEモデルとして位置づけられており、「Mistral 3」とも呼ばれます。重みが公開されているため自己ホストが可能で、商用APIとは別系統で利用できます。
- アーキテクチャ:大規模MoE(Mixture of Experts)
- マルチモーダル:テキスト+画像入力対応
- 推奨用途:オープンウェイト最高性能が必要な場面、エンタープライズ自己ホスト、マルチモーダル推論
- ライセンス:オープンウェイト公開(自己ホスト可)
Ministral 3ファミリー(3B・8B・14B)
2025年12月リリースの「エッジ・オンデバイス」向け軽量モデルシリーズです。Apache 2.0ライセンスで公開されており、テキストとビジョン(画像)の両方に対応しています。3B・8B・14Bの3サイズ展開で、リソース制約に応じた選択が可能です。
- パラメータ:3B
- ライセンス:Apache 2.0
- マルチモーダル:テキスト+ビジョン
- 用途:モバイル・エッジデバイス、超低レイテンシ推論
- パラメータ:8B
- ライセンス:Apache 2.0
- マルチモーダル:テキスト+ビジョン
- 用途:オンプレミスの軽量エージェント、低コスト推論サーバー
- パラメータ:14B
- ライセンス:Apache 2.0
- マルチモーダル:テキスト+ビジョン
- 用途:性能重視のオンプレミス展開、RAGパイプライン
商用(プロプライエタリ)モデル詳細
商用モデルはAPIのみで提供され、重みは非公開です。Mistral AIの「la Plateforme」経由または各クラウドプロバイダーのMistralマネージドサービスから利用します。
Mistral Medium 3.5(現行のプレミア・フロンティアモデル)
2026年5月22日にリリースされた、現行の premier フロンティア・マルチモーダルモデルです。エージェント・コーディング用途に最適化されており、Le Chatの「Vibe」リモートコーディングエージェントを駆動するモデルでもあります。
- マルチモーダル:テキスト+画像入力対応
- 特徴:エージェントワークフロー、ツール/関数呼び出し、コード生成に最適化
- API料金:入力 $1.50 / 出力 $7.50(百万トークン、出典: mistral.ai/pricing/)
- 推奨用途:複雑なエージェントタスク、リモートコーディング、マルチモーダル推論
Mistral Small 4
2026年3月16日リリースの最新小型商用モデルです。instruct・reasoning(推論)・codingを1モデルに統合したハイブリッド設計で、マルチモーダルにも対応。APIでの従量課金コストが非常に安価なため、大量処理ユースケースに最適です。
- マルチモーダル:テキスト+画像入力対応
- 特徴:推論・コーディング・インストラクション対応を1モデルで統合
- API料金:入力 $0.10 / 出力 $0.30(百万トークン、出典: mistral.ai/pricing/)
- 推奨用途:分類・要約・定型文生成・FAQへの回答、コスト最小化が優先されるシンプルタスク
- 実運用メモ:自社検証でもFAQへの定型応答は十分な品質が出ており、コストパフォーマンスに優れる
特化型・専門モデル詳細
Devstral 2
2025年12月リリースのソフトウェアエンジニアリング向けフロンティア・コードエージェントモデルです。複雑なコードリポジトリを横断した作業や、マルチステップの開発タスクに特化して設計されています。
- 推奨用途:コードエージェント、リポジトリ横断のリファクタリング、自律的な開発タスク
Codestral(コード補完)・Codestral Embed
Codestral(v25.08)はコード補完に特化したモデルです。Fill-in-the-Middle(FIM)という手法でコードの中間部分の補完も得意とし、80以上のプログラミング言語に対応します。Codestral Embed(v25.05)はコードのセマンティック表現(埋め込み)専用モデルです。
- 対応言語(主要):Python、JavaScript、TypeScript、Rust、Go、C++、Java、SQL など80種以上
- 特徴:FIM補完、コード説明・レビュー
- 実運用メモ:VS CodeのContinue拡張と組み合わせてローカルコーディングアシスタントとして検証。自動補完の精度はGitHub Copilot相当の体感
Magistral Medium 1.2
マルチモーダル推論(reasoning)に特化した専用モデルです(v25.09)。複雑な多段階推論が求められるタスクに対応します。
OCR 3
2025年12月リリースのドキュメントAI専用APIです(Mistral OCRの現行版)。PDFや画像からのテキスト抽出・構造化に特化しており、従来のOCRを大きく上回る理解力を持ちます。表・数式・図の解釈も可能で、非構造化文書をLLMが扱いやすいMarkdown形式に変換できます。
- 入力形式:PDF、PNG、JPEG など
- 特徴:段組み・表・数式の正確な構造化、多言語対応
- 推奨用途:契約書・請求書の自動処理、学術論文の取り込み、RAGのデータ前処理
- 実運用メモ:日本語PDFの表抽出で試したところ、複雑なレイアウトでも概ね正確に構造を復元。従来のPyMuPDF+後処理よりパイプラインが単純化できた
Voxtralシリーズ(音声モデル)
音声系モデルとして3モデルが提供されています。
- Voxtral TTS(v26.03):音声合成・ボイスクローン対応
- Voxtral Small(v25.07):音声入力(Speech-to-Text)
- Voxtral Mini Transcribe Realtime(v26.02):リアルタイム文字起こし
Mistral Embed・Mistral Moderation 2
Mistral Embed(v23.12)はテキストをベクトルに変換するエンベディングモデルです。RAGシステムの検索コンポーネントやセマンティック類似度計算に使います。Mistral Moderation 2(v26.03)はテキストの有害性・ポリシー違反を検出するコンテンツモデレーションモデルで、チャットアプリや生成システムの安全レイヤーとして組み込めます。
- Mistral Embed 出力次元:1,024 / 最大入力:8,192トークン
- 特徴:MTEB(Massive Text Embedding Benchmark)で上位の性能
- 推奨用途:ドキュメント検索、意味ベースのクラスタリング、Q&Aシステムのリトリーバー

全モデルスペック比較表
| モデル名 | カテゴリ | マルチモーダル | ツール呼び出し | ライセンス | 主な用途 |
|---|---|---|---|---|---|
| Mistral Medium 3.5 | 商用フロンティア | ○ | ○ | 商用API | エージェント・コーディング・マルチモーダル推論 |
| Mistral Large 3(Mistral 3) | OW汎用旗艦 | ○ | ○ | オープンウェイト | 自己ホスト最高性能・汎用 |
| Mistral Small 4 | 商用小型 | ○ | ○ | 商用API | コスパ重視・大量処理・推論コーディング |
| Ministral 3B | OW軽量 | ○ | ○ | Apache 2.0 | モバイル・エッジ |
| Ministral 8B | OW軽量 | ○ | ○ | Apache 2.0 | 軽量エージェント・オンプレ |
| Ministral 14B | OW軽量 | ○ | ○ | Apache 2.0 | 性能重視オンプレ・RAG |
| Devstral 2 | コードエージェント | — | ○ | 商用API | コードエージェント・自律開発 |
| Codestral | コード補完 | × | ○ | MNPL/API | コード生成・FIM補完 |
| Magistral Medium 1.2 | 推論専用 | ○ | ○ | 商用API | 多段階推論・マルチモーダル |
| OCR 3 | ドキュメントAI | ○(文書) | — | 商用API | PDF・文書構造化 |
| Voxtral TTS / Small / Mini RT | 音声 | 音声 | — | 商用API | 音声合成・文字起こし・リアルタイム転写 |
| Mistral Embed | エンベディング | × | — | 商用API | RAG・セマンティック検索 |
| Mistral Moderation 2 | モデレーション | × | — | 商用API | コンテンツ安全・有害性検出 |
用途別のモデル選び方ガイド
モデル一覧を眺めるだけでは選択肢が多すぎると感じる場合も多いです。ここでは「何をしたいか」起点の実用的な選び方をまとめます。
コスト最小・スピード最優先のシンプルタスク
Mistral Small 4が最適です。入力$0.10・出力$0.30(百万トークン)と非常に安価で、instruct・reasoning・codingを1モデルで統合しているため、分類・要約・テンプレート埋め込みなど定型タスクをこれ1本でカバーできます。自社検証でも、FAQへの定型応答はMistral Small 4で十分な品質が出ており、コストを大幅に抑えられました。
完全ローカル・オンプレミスで動かしたい
使えるVRAM量に応じて選択肢が変わります。
| VRAM目安 | 推奨モデル | 備考 |
|---|---|---|
| 〜8GB(またはCPU) | Ministral 3B(量子化) | Apache 2.0・ビジョン対応 |
| 16GB | Ministral 8B(量子化) | Apache 2.0・ビジョン対応 |
| 24〜32GB | Ministral 14B | Apache 2.0・マルチモーダル対応 |
| 48GB以上 | Mistral Large 3(分割量子化) | オープンウェイト最高性能 |
| マルチGPU(80GB+) | Mistral Large 3(フル精度) | 大規模MoE・汎用旗艦 |
コード生成・開発支援
用途によって使い分けを推奨します。IDE補完・FIM補完にはCodestral、エージェント的な自律開発タスクにはDevstral 2が最適です。Codestralのコード補完品質はテキスト系モデルと比較にならないほど高く、IDEとの統合も実用的です。商用プロジェクトへの組み込みはAPIライセンスの確認が必要です。
画像や文書を読み取らせたい
ユースケースで分岐します。
- PDFやスキャン文書の構造化抽出:OCR 3 API
- 画像とテキストを組み合わせた推論・VQA:Ministral 3ファミリー(ローカル可・Apache 2.0)またはMistral Medium 3.5(高精度・商用API)
- マルチモーダルをオープンウェイトで使いたい:Mistral Large 3(Mistral 3)
RAGシステムを構築したい
エンベディングにMistral Embed、生成にMistral Small 4(コスト重視)またはMistral Medium 3.5(精度重視)という組み合わせが標準的です。コードのRAGにはCodestral Embedの利用も検討できます。

APIでの利用・料金・無料枠について
Mistral AIのAPIはla Plateforme(console.mistral.ai)から利用します。無料トライアル枠が用意されており、クレジットカードなしで試すことも可能です。主要APIモデルの料金例として、Mistral Medium 3.5は入力$1.50・出力$7.50、Mistral Small 4は入力$0.10・出力$0.30(いずれも百万トークン単位、出典: mistral.ai/pricing/)です。その他モデルの単価はconsole.mistral.aiの最新pricingで都度確認してください。詳細な料金体系についてはMistral AIの料金プランと価格で詳しく解説しています。
無料で使える範囲や制限についてはMistral AIの無料プランを徹底解説をご参照ください。APIの具体的な使い方・初回セットアップの手順はMistral AIの使い方ガイドで説明しています。
ライセンスの注意点
Mistralのモデルにはいくつかのライセンス形態があり、用途によって選択肢が制限される場合があります。
| ライセンス名 | 商用利用 | 再配布 | ファインチューニング | 主な対象モデル |
|---|---|---|---|---|
| Apache 2.0 | ○ | ○ | ○ | Ministral 3(3B/8B/14B)、Mistral Large 3(Mistral 3) |
| MNPL(Non-Production License) | ×(本番環境) | × | 研究・評価目的○ | Codestral(重み) |
| 商用APIライセンス | ○(API経由) | — | — | Mistral Medium 3.5、Mistral Small 4、Devstral 2、OCR 3 等 |
特にCodestralを商用プロダクトに組み込む場合は、重みを直接使う場合と、API経由で使う場合でライセンスが異なります。商用利用前には公式ライセンスページを必ず確認してください。
モデルのアクセス方法:HuggingFace・API・クラウド
Mistralモデルへのアクセス経路は主に3つです。
オープンウェイトモデルの重みをダウンロード。transformers、llama.cpp、vLLM、Ollamaなどで自前実行。ファインチューニングもここから。
console.mistral.aiでAPIキーを発行。OpenAI互換のエンドポイント設計なので、既存のOpenAIベースのコードを最小限の変更で移行可能。
Study about AI
AIについて学ぶ
-
Meta インド データセンター AIインフラ——Reliance 168MW契約の深層と日本企業の実務対応
Meta インド データセンター AIインフラ——168MW契約の要点と背景 2026年6月9日、MetaはリライアンスIインダストリーズ(Reliance I...
-
ワーナー Sureel AI 音楽 著作権——買収の意味と日本企業への示唆
ワーナー Sureel AI 音楽 著作権——買収の要点と業界的意義 2026年6月10日、Warner Music Group(以下WMG)はAIスタートアッ...
-
Vector Lakebase ベクターDB RAG——Zillizが示す統合AIデータ基盤の論点
Vector Lakebaseとは何か——RAGデータ基盤をめぐる問い直し 2026年6月10日、ZillizはマネージドサービスZilliz Cloudをベー...