blog

mistral 使い方|2026年版ガイド

Mistralとは?まず基本を押さえる

Mistral AIは2023年にフランスで創業したAIスタートアップで、オープンソース志向の大規模言語モデル(LLM)を次々とリリースしています。Meta社のLlamaと並び、「商用・研究問わず自由に使えるLLM」として世界中の開発者から注目を集めており、2026年6月現在は現行の旗艦マルチモーダルモデルMistral Medium 3.5(エージェント・コーディング特化)、オープンウェイト汎用旗艦のMistral Large 3(別称「Mistral 3」)、軽量統合モデルのMistral Small 4、そしてオープンウェイト軽量シリーズのMinistral 3(3B/8B/14B)など、用途別に整理されたラインナップが提供されています。

本記事ではMistralをはじめて使う方から、APIやローカル環境での本格活用を目指す方まで、具体的な手順とユースケースを網羅的に解説します。「どこで動かせるのか」「何ができるのか」「どう呼び出すのか」という3つの疑問にまとめて答える構成になっているので、自分のレベルに合ったパートから読み進めてください。

Mistralが言語を処理・変換するイメージ
Mistralが言語を処理・変換するイメージ

Mistralを使える場所・環境の全体像

Mistralには大きく分けて3つのアクセス経路があります。それぞれ特徴が異なるため、目的に応じて使い分けることが重要です。

① Le Chat(公式チャット)
ブラウザから即利用
登録のみで無料スタート
プログラミング不要

② Mistral API
アプリ・サービスへ組込み
APIキーで呼び出し
従量課金

③ ローカル実行
自前PCやサーバーで動作
データが外部に出ない
Ollama等で手軽に構築

方法 費用 セットアップ難易度 データプライバシー 主な用途
Le Chat 無料プランあり(Pro月額あり) ★☆☆(アカウント登録のみ) サーバー側で処理 日常的な対話・下書き・翻訳
Mistral API 従量課金(無料枠あり) ★★☆(APIキー取得+コード) Mistralサーバーで処理 アプリ開発・自動化・RAG
ローカル実行(Ollama等) 無料(電気代・ハード代のみ) ★★★(環境構築が必要) 完全ローカル・外部送信なし 機密データ処理・研究・カスタマイズ

【方法①】Le Chatで今すぐ使う手順

Mistral公式のチャットUI「Le Chat」は、ChatGPTと同様の感覚で使えるブラウザサービスです。アカウントさえ作れば数分で会話を始められます。

アカウント登録からチャット開始まで

  1. 公式サイトにアクセス:chat.mistral.ai をブラウザで開く。
  2. 「Sign up」を選択:メールアドレスまたはGoogleアカウントで登録。
  3. メール認証:届いた確認メールのリンクをクリック。
  4. モデルを選択:画面上部のドロップダウンから使いたいモデル(Mistral Small 4/Mistral Medium 3.5等)を選ぶ。
  5. プロンプトを入力して送信:テキスト欄に質問や指示を書き、Enterキーまたは送信ボタンを押す。

Le Chatで使える主な機能

  • テキスト会話:質問応答・文書要約・翻訳・コード生成など、汎用的なタスクに対応。
  • ファイルアップロード:PDF・Word・テキストファイルを読み込ませて内容を要析させることが可能。
  • Web検索連携(Proプラン):最新情報を参照しながら回答を生成する機能。
  • Canvas機能:文章や資料をドキュメント形式で編集しながら生成できるモード。
  • 「Vibe」リモートコーディングエージェント(Proプラン):Mistral Medium 3.5を駆動するエージェント機能で、終日のコーディングセッションに対応。
  • カスタムインストラクション:常に特定のスタイルや言語で回答させるよう事前設定できる。

効果的なプロンプトのコツ

Mistralは英語での指示に最も精度が高いとされますが、日本語プロンプトでも実用レベルの回答が得られます。より精度を上げるには以下を意識してください。

  • 役割を与える:「あなたは経験豊富なPythonエンジニアです」のように冒頭でペルソナを設定する。
  • 出力形式を指定する:「箇条書きで5点にまとめてください」「JSON形式で出力してください」など。
  • 背景情報を補足する:曖昧な質問より、文脈・目的・対象読者を書いた方が精度が上がる。
  • 段階的に深掘りする:一度で完璧な回答を求めるより、「もっと詳しく」「コードに直して」と反復するとよい結果が出やすい。

【方法②】Mistral APIを使う手順(開発者向け)

自作のアプリケーションやスクリプトにMistralを組み込む場合は、公式APIを使います。OpenAI APIと互換性の高い設計になっているため、既存のコードを流用しやすいのも特徴です。

APIキーの取得方法

  1. console.mistral.ai にアクセスしてログイン(Le Chatと同一アカウント)。
  2. 左メニューの「API Keys」→「Create new key」を選択。
  3. キーに名前を付けて「Generate」をクリックし、表示されたキーをコピーして安全な場所に保存する(再表示不可)。
  4. 「Billing」メニューでクレジットカードを登録するか、無料枠の範囲で利用開始。

Pythonからの基本的な呼び出し方

公式Pythonライブラリ mistralai を使う方法が最も簡単です。モデル名には現行の mistral-medium-3.5-latestmistral-small-4-latest(Mistral Small 4)を指定できます。

# ライブラリのインストール(ターミナルで実行)
pip install mistralai

# サンプルコード
from mistralai import Mistral

client = Mistral(api_key=“YOUR_API_KEY”)

response = client.chat.complete(
    model=“mistral-small-4-latest”,
    messages=[
        {“role”: “system”, “content”: “あなたは日本語で回答するアシスタントです。”},
        {“role”: “user”, “content”: “Mistralの特徴を3点で教えてください。”}
    ]
)

print(response.choices[0].message.content)

ストリーミング出力(逐次表示)の実装

チャットUIのようにトークンを1つずつ表示させたい場合は、ストリーミングモードを使います。

with client.chat.stream(
    model=“mistral-small-4-latest”,
    messages=[{“role”: “user”, “content”: “量子コンピュータを簡単に説明して”}]
) as stream:
    for chunk in stream:
        delta = chunk.data.choices[0].delta.content
        if delta:
            print(delta, end=“”, flush=True)

Function Calling(ツール連携)の使い方

Mistralは外部ツールや自作関数をモデルに呼び出させる「Function Calling」に対応しています。これにより、カレンダーAPI・データベース・社内システムとLLMを接続した自律型エージェントを構築できます。

tools = [
    {
        “type”: “function”,
        “function”: {
            “name”: “get_weather”,
            “description”: “指定した都市の現在の天気を返す”,
            “parameters”: {
                “type”: “object”,
                “properties”: {“city”: {“type”: “string”}},
                “required”: [“city”]
            }
        }
    }
]

response = client.chat.complete(
    model=“mistral-small-4-latest”,
    messages=[{“role”: “user”, “content”: “東京の天気は?”}],
    tools=tools,
    tool_choice=“auto”
)

主要なAPIパラメータ一覧

パラメータ 説明 推奨値
model string 使用するモデル名 mistral-small-4-latest / mistral-medium-3.5-latest
temperature float (0〜1) 出力のランダム性。高いほど創造的 事実回答:0.1〜0.3 / 創作:0.7〜0.9
max_tokens int 生成する最大トークン数 用途に応じて設定(512〜4096)
top_p float (0〜1) nucleus samplingの閾値 temperatureとどちらか一方を調整
safe_prompt bool 安全フィルタ用プレフィックスを付加 一般公開アプリではtrue推奨

【方法③】Ollamaを使ったローカル実行手順

機密データを外部に送りたくない場合や、APIコストを抑えながら開発したい場合は、ローカル環境でMistralを動かすのが有効です。OllamaはMac・Windows・Linux問わず最もシンプルにローカルLLMを実行できるツールで、Apache 2.0ライセンスで公開されているオープンウェイトのMinistral 3シリーズ(3B/8B/14B)Mistral Large 3にも対応しています。

Ollamaのインストールと起動

  1. ollama.com の公式サイトからインストーラをダウンロードしてインストール。
  2. ターミナル(またはコマンドプロンプト)を開き、以下コマンドでMinistral 3(14B)をダウンロード・起動:
    ollama run ministral3

    初回はモデルのダウンロードが走ります。完了すると対話プロンプトが起動します。軽量な3Bモデルを試したい場合は ollama run ministral3:3b と指定してください。

  3. 終了するには /bye と入力してEnterキーを押す。

使えるMistralモデルの種類(Ollama経由、2026年6月時点)

モデル名 パラメータ 必要RAM目安 特徴
ministral3:3b 3B 8GB以上 超軽量・低スペック端末でも動作。Apache 2.0
ministral3:8b 8B 16GB以上 速度と精度のバランス・入門に最適。Apache 2.0
ministral3(14B) 14B 24GB以上 指示追従・多言語・コーディングに強い。Apache 2.0
mistral-large-3 大規模MoE 高スペック環境推奨 オープンウェイト汎用旗艦・マルチモーダル対応

なお、Mistral Medium 3.5はAPIプロプライエタリモデルのため、一般的なコンシューマー向けPCでのローカル実行はできません。Medium 3.5を使う場合は公式APIの利用を推奨します(入力$1.50/出力$7.50、百万トークン当たり・Mistral公式価格)。

OllamaのREST APIをPythonから使う

Ollamaはローカルに http://localhost:11434 でAPIサーバーを立ち上げるため、Pythonの requests ライブラリや公式のOpenAI互換エンドポイントから呼び出せます。

import requests, json

response = requests.post(
    “http://localhost:11434/api/chat”,
    json={
        “model”: “ministral3”,
        “messages”: [{“role”: “user”, “content”: “Pythonのリスト内包表記を説明して”}],
        “stream”: False
    }
)
print(response.json()[“message”][“content”])

Mistralの代表的なユースケース

環境を整えた後は、具体的に何をさせるかが重要です。以下はMistralが特に得意とするタスクと、実際のプロンプト例です。

コード生成・レビュー

Mistral Small 4およびMistral Medium 3.5はコーディングタスクに強く、Python・JavaScript・SQL・Shell等のコードを高精度で生成します。特にMedium 3.5はエージェント・コーディング用途に最適化された現行フロンティアモデルであり、複雑な実装要件にも対応できます。コード補完に特化した用途ではCodestral(コード補完モデル)やDevstral 2(ソフトウェアエンジニアリング向けコードエージェント)も選択肢に入ります。

  • プロンプト例(生成):「PandasでCSVを読み込み、欠損値をゼロ埋めして、売上列の月次合計をmatplotlibで棒グラフにするPythonコードを書いて」
  • プロンプト例(レビュー):「以下のPythonコードのバグと改善点を指摘して(コードを貼り付け)」

文書の要約・翻訳

長い議事録・論文・契約書をまとめたり、英日・日英翻訳に使えます。

  • プロンプト例(要約):「以下の文章を、非専門家向けに200字以内で要約して(文書を貼り付け)」
  • プロンプト例(翻訳):「以下の英文を自然な日本語ビジネス文章に翻訳して(文章を貼り付け)」

RAG(検索拡張生成)システムの構築

社内ドキュメントやナレッジベースと組み合わせて、根拠のある回答を返す「RAGシステム」を作る用途に向いています。LangChainやLlamaIndexとの連携も豊富なサンプルが公開されています。

  • ベクトルDB(ChromaDB・Qdrantなど)にドキュメントを格納
  • ユーザーの質問に関連するチャンクを検索してコンテキストに付加
  • Mistral APIに「以下の情報を参考に回答して」と渡すことで、幻覚(ハルシネーション)を大幅に低減

カスタマーサポートBot・チャットAgent

Function CallingとシステムプロンプトをうまくWebhookに接続することで、FAQへの自動回答・チケット起票・注文状況確認などのエージェントを構築できます。クリスタルメソッドでは、バーチャルヒューマン事業においてLLMを使ったマルチターン会話エンジンの活用事例を持っており、Mistral Small 4のような軽量高速モデルは低遅延が求められる対話シーンで実力を発揮します。

データ抽出・構造化

非構造化テキストから情報をJSON形式で抽出するタスクはMistralが得意とする領域です。

  • プロンプト例:「以下のメールから、送信者名・日付・件名・アクションアイテムをJSONで抽出して(メール本文を貼り付け)」

Mistralの各モデル比較と選び方

2026年6月現在、Mistralが提供する主要モデルは以下の通りです。用途・コスト・精度のバランスで選びましょう(料金はMistral公式 mistral.ai/pricing/ 基準・USD、円は参考値)。

モデル 規模・種別 強み こんな用途に APIコスト感(百万トークン)
Mistral Small 4 小型・マルチモーダル instruct/推論/コーディング統合。非常に安価 大量バッチ処理・要約・分類・対話Bot 入力$0.10/出力$0.30
Ministral 3(3B) 超軽量・オープンウェイト(Apache 2.0) エッジ実行向け・低スペック対応 モバイル・IoT・ローカル実行入門 最低コスト(自己ホスト可)
Ministral 3(8B) 軽量・オープンウェイト(Apache 2.0) 速度・コスト効率。テキスト+ビジョン対応 汎用ローカル実行・ローカルRAG 低コスト(自己ホスト可)
Ministral 3(14B) 軽量・オープンウェイト(Apache 2.0) 指示追従・多言語・コーディング ローカル実行の主力・汎用タスク全般 低〜中コスト(自己ホスト可)
Mistral Large 3(Mistral 3) 大規模MoE・オープンウェイト 汎用マルチモーダル旗艦。大手ラボ最大級のオープンMoE 高精度汎用タスク・自己ホスト大規模運用 中〜高(API利用時。自己ホスト可)
Mistral Medium 3.5 プレミア・マルチモーダル(APIプロプライエタリ) エージェント・コーディング特化の現行フロンティア 契約書分析・高度な多段推論・複雑なコード生成・Vibeコーディング 入力$1.50/出力$7.50
Codestral コード補完特化 Fill-in-Middle対応のコード補完 IDEプラグイン・コードレビュー 中程度(公式pricing参照)

迷ったときの選び方の目安:まず試す→Mistral Small 4(安価で高性能)、ローカル実行を始めたい→Ministral 3(8B)、さらに精度が必要→Ministral 3(14B)→高精度フロンティアが必要→Mistral Medium 3.5へ移行、コード補完メインで使う→Codestral、という順で検討すると費用対効果が高くなります。

よくあるトラブルと対処法

APIキーのエラー(401 Unauthorized)

APIキーのコピーミスや、環境変数への設定漏れが原因であることがほとんどです。コード内にキーをハードコードするのではなく、os.environ.get("MISTRAL_API_KEY") のように環境変数から読み込む実装を推奨します。

日本語の回答精度が低い

Mistralは英語データで主に学習されているため、日本語タスクでは英語プロンプトを使うか、「Respond in Japanese」をシステムプロンプトに含めると精度が改善する場合があります。Ministral 3シリーズをはじめ現行モデルはいずれも多言語対応が強化されており、日本語の自然さも向上しています。

長い文章が途中で切れる

max_tokens の値が小さす

参考文献

    関連記事

    監修

    河合 継(クリスタルメソッド株式会社 代表取締役)

    AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
    運営会社について編集方針

    AIブログ購読

     
    クリスタルメソッドがお届けする
    AIブログの更新通知を受け取る

    Study about AI

    AIについて学ぶ

    • Meta インド データセンター AIインフラ——Reliance 168MW契約の深層と日本企業の実務対応

      Meta インド データセンター AIインフラ——Reliance 168MW契約の深層と日本企業の実務対応

      Meta インド データセンター AIインフラ——168MW契約の要点と背景 2026年6月9日、MetaはリライアンスIインダストリーズ(Reliance I...

    • ワーナー Sureel AI 音楽 著作権——買収の意味と日本企業への示唆

      ワーナー Sureel AI 音楽 著作権——買収の意味と日本企業への示唆

      ワーナー Sureel AI 音楽 著作権——買収の要点と業界的意義 2026年6月10日、Warner Music Group(以下WMG)はAIスタートアッ...

    • Vector Lakebase ベクターDB RAG——Zillizが示す統合AIデータ基盤の論点

      Vector Lakebase ベクターDB RAG——Zillizが示す統合AIデータ基盤の論点

      Vector Lakebaseとは何か——RAGデータ基盤をめぐる問い直し 2026年6月10日、ZillizはマネージドサービスZilliz Cloudをベー...

    View more