blog

Mistral最新モデル比較|Small・Medium・Largeの違いと選び方

Mistral AIは2023年の創業以来、急速にモデルラインナップを拡充し、2025〜2026年時点では軽量オープンモデルからエンタープライズ向けフロンティアモデルまで多岐にわたる選択肢を提供しています。「どのモデルを選べばいいのか」「APIで使えるモデルはどれか」「オープンウェイトと商用モデルの違いは何か」——本記事ではそうした疑問に答えるべく、Mistral AIの全モデルを体系的に整理します。実際にAPIおよびローカル環境で各モデルを検証してきた知見も交えながら、用途別の選び方まで解説します。

Mistral AIのモデル体系:まず全体像を把握する

Mistral AIのモデルは大きく「オープンウェイトモデル」「商用(プロプライエタリ)モデル」の二軸で整理できます。オープンウェイトモデルはApache 2.0などのライセンスで重みが公開されており、ローカル実行やファインチューニングが自由に行えます。商用モデルはAPIを通じてのみ利用可能で、より高い性能・機能を持ちます。

カテゴリ 代表モデル 特徴 入手方法
オープンウェイト(軽量) Ministral 3(3B/8B/14B) ローカル実行可・低コスト・ビジョン対応 HuggingFace/API
オープンウェイト(汎用旗艦) Mistral Large 3(Mistral 3) 大規模MoE・マルチモーダル・高性能 HuggingFace/API
商用フロンティア Mistral Medium 3.5、Mistral Small 4 エージェント・コーディング・マルチモーダル API(la Plateforme)
特化型・専門モデル Devstral 2、Codestral、OCR 3、Voxtral コードエージェント・文書認識・音声 API
エンベディング Mistral Embed、Codestral Embed RAG・検索用ベクトル化・コード表現 API

Mistral AIの概要・背景・企業情報についてはMistral AIとは何かで詳しく解説しています。本記事ではモデルの仕様・性能・用途の深掘りに集中します。

オープンウェイトモデル詳細

オープンウェイトモデルは商用利用を含む幅広いライセンスで重みが公開されており、自社インフラへのデプロイやファインチューニングが可能です。コスト管理とデータプライバシーの両立を求めるプロジェクトで特に重宝します。

Mistral Large 3(Mistral 3)

2025年12月2日に発表されたオープンウェイトの汎用マルチモーダル旗艦モデルです。大手ラボ最大級のオープンウェイトMoEモデルとして位置づけられており、「Mistral 3」とも呼ばれます。重みが公開されているため自己ホストが可能で、商用APIとは別系統で利用できます。

  • アーキテクチャ:大規模MoE(Mixture of Experts)
  • マルチモーダル:テキスト+画像入力対応
  • 推奨用途:オープンウェイト最高性能が必要な場面、エンタープライズ自己ホスト、マルチモーダル推論
  • ライセンス:オープンウェイト公開(自己ホスト可)

Ministral 3ファミリー(3B・8B・14B)

2025年12月リリースの「エッジ・オンデバイス」向け軽量モデルシリーズです。Apache 2.0ライセンスで公開されており、テキストとビジョン(画像)の両方に対応しています。3B・8B・14Bの3サイズ展開で、リソース制約に応じた選択が可能です。

Ministral 3B

  • パラメータ:3B
  • ライセンス:Apache 2.0
  • マルチモーダル:テキスト+ビジョン
  • 用途:モバイル・エッジデバイス、超低レイテンシ推論
Ministral 8B

  • パラメータ:8B
  • ライセンス:Apache 2.0
  • マルチモーダル:テキスト+ビジョン
  • 用途:オンプレミスの軽量エージェント、低コスト推論サーバー
Ministral 14B

  • パラメータ:14B
  • ライセンス:Apache 2.0
  • マルチモーダル:テキスト+ビジョン
  • 用途:性能重視のオンプレミス展開、RAGパイプライン

商用(プロプライエタリ)モデル詳細

商用モデルはAPIのみで提供され、重みは非公開です。Mistral AIの「la Plateforme」経由または各クラウドプロバイダーのMistralマネージドサービスから利用します。

Mistral Medium 3.5(現行のプレミア・フロンティアモデル)

2026年5月22日にリリースされた、現行の premier フロンティア・マルチモーダルモデルです。エージェント・コーディング用途に最適化されており、Le Chatの「Vibe」リモートコーディングエージェントを駆動するモデルでもあります。

  • マルチモーダル:テキスト+画像入力対応
  • 特徴:エージェントワークフロー、ツール/関数呼び出し、コード生成に最適化
  • API料金:入力 $1.50 / 出力 $7.50(百万トークン、出典: mistral.ai/pricing/)
  • 推奨用途:複雑なエージェントタスク、リモートコーディング、マルチモーダル推論

Mistral Small 4

2026年3月16日リリースの最新小型商用モデルです。instruct・reasoning(推論)・codingを1モデルに統合したハイブリッド設計で、マルチモーダルにも対応。APIでの従量課金コストが非常に安価なため、大量処理ユースケースに最適です。

  • マルチモーダル:テキスト+画像入力対応
  • 特徴:推論・コーディング・インストラクション対応を1モデルで統合
  • API料金:入力 $0.10 / 出力 $0.30(百万トークン、出典: mistral.ai/pricing/)
  • 推奨用途:分類・要約・定型文生成・FAQへの回答、コスト最小化が優先されるシンプルタスク
  • 実運用メモ:自社検証でもFAQへの定型応答は十分な品質が出ており、コストパフォーマンスに優れる

特化型・専門モデル詳細

Devstral 2

2025年12月リリースのソフトウェアエンジニアリング向けフロンティア・コードエージェントモデルです。複雑なコードリポジトリを横断した作業や、マルチステップの開発タスクに特化して設計されています。

  • 推奨用途:コードエージェント、リポジトリ横断のリファクタリング、自律的な開発タスク

Codestral(コード補完)・Codestral Embed

Codestral(v25.08)はコード補完に特化したモデルです。Fill-in-the-Middle(FIM)という手法でコードの中間部分の補完も得意とし、80以上のプログラミング言語に対応します。Codestral Embed(v25.05)はコードのセマンティック表現(埋め込み)専用モデルです。

  • 対応言語(主要):Python、JavaScript、TypeScript、Rust、Go、C++、Java、SQL など80種以上
  • 特徴:FIM補完、コード説明・レビュー
  • 実運用メモ:VS CodeのContinue拡張と組み合わせてローカルコーディングアシスタントとして検証。自動補完の精度はGitHub Copilot相当の体感

Magistral Medium 1.2

マルチモーダル推論(reasoning)に特化した専用モデルです(v25.09)。複雑な多段階推論が求められるタスクに対応します。

OCR 3

2025年12月リリースのドキュメントAI専用APIです(Mistral OCRの現行版)。PDFや画像からのテキスト抽出・構造化に特化しており、従来のOCRを大きく上回る理解力を持ちます。表・数式・図の解釈も可能で、非構造化文書をLLMが扱いやすいMarkdown形式に変換できます。

  • 入力形式:PDF、PNG、JPEG など
  • 特徴:段組み・表・数式の正確な構造化、多言語対応
  • 推奨用途:契約書・請求書の自動処理、学術論文の取り込み、RAGのデータ前処理
  • 実運用メモ:日本語PDFの表抽出で試したところ、複雑なレイアウトでも概ね正確に構造を復元。従来のPyMuPDF+後処理よりパイプラインが単純化できた

Voxtralシリーズ(音声モデル)

音声系モデルとして3モデルが提供されています。

  • Voxtral TTS(v26.03):音声合成・ボイスクローン対応
  • Voxtral Small(v25.07):音声入力(Speech-to-Text)
  • Voxtral Mini Transcribe Realtime(v26.02):リアルタイム文字起こし

Mistral Embed・Mistral Moderation 2

Mistral Embed(v23.12)はテキストをベクトルに変換するエンベディングモデルです。RAGシステムの検索コンポーネントやセマンティック類似度計算に使います。Mistral Moderation 2(v26.03)はテキストの有害性・ポリシー違反を検出するコンテンツモデレーションモデルで、チャットアプリや生成システムの安全レイヤーとして組み込めます。

  • Mistral Embed 出力次元:1,024 / 最大入力:8,192トークン
  • 特徴:MTEB(Massive Text Embedding Benchmark)で上位の性能
  • 推奨用途:ドキュメント検索、意味ベースのクラスタリング、Q&Aシステムのリトリーバー
Mistral OCRが非構造化文書をMarkdown形式に変換するイメージ
Mistral OCRが非構造化文書をMarkdown形式に変換するイメージ

全モデルスペック比較表

モデル名 カテゴリ マルチモーダル ツール呼び出し ライセンス 主な用途
Mistral Medium 3.5 商用フロンティア 商用API エージェント・コーディング・マルチモーダル推論
Mistral Large 3(Mistral 3) OW汎用旗艦 オープンウェイト 自己ホスト最高性能・汎用
Mistral Small 4 商用小型 商用API コスパ重視・大量処理・推論コーディング
Ministral 3B OW軽量 Apache 2.0 モバイル・エッジ
Ministral 8B OW軽量 Apache 2.0 軽量エージェント・オンプレ
Ministral 14B OW軽量 Apache 2.0 性能重視オンプレ・RAG
Devstral 2 コードエージェント 商用API コードエージェント・自律開発
Codestral コード補完 × MNPL/API コード生成・FIM補完
Magistral Medium 1.2 推論専用 商用API 多段階推論・マルチモーダル
OCR 3 ドキュメントAI ○(文書) 商用API PDF・文書構造化
Voxtral TTS / Small / Mini RT 音声 音声 商用API 音声合成・文字起こし・リアルタイム転写
Mistral Embed エンベディング × 商用API RAG・セマンティック検索
Mistral Moderation 2 モデレーション × 商用API コンテンツ安全・有害性検出

用途別のモデル選び方ガイド

モデル一覧を眺めるだけでは選択肢が多すぎると感じる場合も多いです。ここでは「何をしたいか」起点の実用的な選び方をまとめます。

コスト最小・スピード最優先のシンプルタスク

Mistral Small 4が最適です。入力$0.10・出力$0.30(百万トークン)と非常に安価で、instruct・reasoning・codingを1モデルで統合しているため、分類・要約・テンプレート埋め込みなど定型タスクをこれ1本でカバーできます。自社検証でも、FAQへの定型応答はMistral Small 4で十分な品質が出ており、コストを大幅に抑えられました。

完全ローカル・オンプレミスで動かしたい

使えるVRAM量に応じて選択肢が変わります。

VRAM目安 推奨モデル 備考
〜8GB(またはCPU) Ministral 3B(量子化) Apache 2.0・ビジョン対応
16GB Ministral 8B(量子化) Apache 2.0・ビジョン対応
24〜32GB Ministral 14B Apache 2.0・マルチモーダル対応
48GB以上 Mistral Large 3(分割量子化) オープンウェイト最高性能
マルチGPU(80GB+) Mistral Large 3(フル精度) 大規模MoE・汎用旗艦

コード生成・開発支援

用途によって使い分けを推奨します。IDE補完・FIM補完にはCodestral、エージェント的な自律開発タスクにはDevstral 2が最適です。Codestralのコード補完品質はテキスト系モデルと比較にならないほど高く、IDEとの統合も実用的です。商用プロジェクトへの組み込みはAPIライセンスの確認が必要です。

画像や文書を読み取らせたい

ユースケースで分岐します。

  • PDFやスキャン文書の構造化抽出:OCR 3 API
  • 画像とテキストを組み合わせた推論・VQA:Ministral 3ファミリー(ローカル可・Apache 2.0)またはMistral Medium 3.5(高精度・商用API)
  • マルチモーダルをオープンウェイトで使いたい:Mistral Large 3(Mistral 3)

RAGシステムを構築したい

エンベディングにMistral Embed、生成にMistral Small 4(コスト重視)またはMistral Medium 3.5(精度重視)という組み合わせが標準的です。コードのRAGにはCodestral Embedの利用も検討できます。

MistralのRAGパイプラインで多言語文書から関連箇所を抽出するイメージ
MistralのRAGパイプラインで多言語文書から関連箇所を抽出するイメージ

APIでの利用・料金・無料枠について

Mistral AIのAPIはla Plateforme(console.mistral.ai)から利用します。無料トライアル枠が用意されており、クレジットカードなしで試すことも可能です。主要APIモデルの料金例として、Mistral Medium 3.5は入力$1.50・出力$7.50、Mistral Small 4は入力$0.10・出力$0.30(いずれも百万トークン単位、出典: mistral.ai/pricing/)です。その他モデルの単価はconsole.mistral.aiの最新pricingで都度確認してください。詳細な料金体系についてはMistral AIの料金プランと価格で詳しく解説しています。

無料で使える範囲や制限についてはMistral AIの無料プランを徹底解説をご参照ください。APIの具体的な使い方・初回セットアップの手順はMistral AIの使い方ガイドで説明しています。

ライセンスの注意点

Mistralのモデルにはいくつかのライセンス形態があり、用途によって選択肢が制限される場合があります。

ライセンス名 商用利用 再配布 ファインチューニング 主な対象モデル
Apache 2.0 Ministral 3(3B/8B/14B)、Mistral Large 3(Mistral 3)
MNPL(Non-Production License) ×(本番環境) × 研究・評価目的○ Codestral(重み)
商用APIライセンス ○(API経由) Mistral Medium 3.5、Mistral Small 4、Devstral 2、OCR 3 等

特にCodestralを商用プロダクトに組み込む場合は、重みを直接使う場合と、API経由で使う場合でライセンスが異なります。商用利用前には公式ライセンスページを必ず確認してください。

モデルのアクセス方法:HuggingFace・API・クラウド

Mistralモデルへのアクセス経路は主に3つです。

① Hugging Face

オープンウェイトモデルの重みをダウンロード。transformers、llama.cpp、vLLM、Ollamaなどで自前実行。ファインチューニングもここから。

② la Plateforme(公式API)

console.mistral.aiでAPIキーを発行。OpenAI互換のエンドポイント設計なので、既存のOpenAIベースのコードを最小限の変更で移行可能。

参考文献

    監修

    河合 継(クリスタルメソッド株式会社 代表取締役)

    AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
    運営会社について編集方針

    AIブログ購読

     
    クリスタルメソッドがお届けする
    AIブログの更新通知を受け取る

    Study about AI

    AIについて学ぶ

    • Meta インド データセンター AIインフラ——Reliance 168MW契約の深層と日本企業の実務対応

      Meta インド データセンター AIインフラ——Reliance 168MW契約の深層と日本企業の実務対応

      Meta インド データセンター AIインフラ——168MW契約の要点と背景 2026年6月9日、MetaはリライアンスIインダストリーズ(Reliance I...

    • ワーナー Sureel AI 音楽 著作権——買収の意味と日本企業への示唆

      ワーナー Sureel AI 音楽 著作権——買収の意味と日本企業への示唆

      ワーナー Sureel AI 音楽 著作権——買収の要点と業界的意義 2026年6月10日、Warner Music Group(以下WMG)はAIスタートアッ...

    • Vector Lakebase ベクターDB RAG——Zillizが示す統合AIデータ基盤の論点

      Vector Lakebase ベクターDB RAG——Zillizが示す統合AIデータ基盤の論点

      Vector Lakebaseとは何か——RAGデータ基盤をめぐる問い直し 2026年6月10日、ZillizはマネージドサービスZilliz Cloudをベー...

    View more