blog

ハルシネーションの仕組み・原因|なぜAIは間違えるのか

本ページはハルシネーションが「なぜ起きるのか」という仕組み・原因の解説に特化しています。確率的テキスト生成・訓練データの欠損・目的関数の限界といった発生メカニズムを掘り下げます。具体的な防止手順や全体像はハルシネーションの対策|RAG・プロンプトで防ぐ方法をご覧ください。

ハルシネーションとは何か――なぜAIは「嘘」をつくのか

ChatGPTや各種LLM(大規模言語モデル)を業務に使い始めた途端、「そんな事実はない」「数字がまったく違う」という出力に遭遇した経験はないでしょうか。これがAIにおけるハルシネーション(幻覚)と呼ばれる現象です。

当社でも複数のAIツールを実務検証する中で、ハルシネーションは「たまに起きる誤り」ではなく、LLMの構造そのものに根ざした避けがたい性質であることを実感しています。本記事では、ハルシネーションがなぜ起きるのか、その仕組みを技術的な根拠から丁寧に解説します。対策・ツール比較といった派生テーマには適宜リンクで補足しつつ、「仕組み」の深掘りに集中します。

LLMがトークンを確率的に予測するイメージ図
LLMがトークンを確率的に予測するイメージ図

ハルシネーションの定義と分類

ハルシネーションとは、AIモデルが事実に基づかない情報を、あたかも正確であるかのように自信をもって出力する現象です。単純な「間違い」と異なり、モデル自身は誤りを認識していません。NLP(自然言語処理)研究では大きく2種類に分類されます。

種類 概要 典型例
内在的ハルシネーション(Intrinsic) 与えられたソースや文脈と矛盾する情報を生成する 参照文書に書かれていない事実を「書いてある」と要約する
外在的ハルシネーション(Extrinsic) ソースから検証できない情報を追加・創作する 実在しない論文のタイトル・DOI・著者名を生成する

実務で当社が遭遇したケースの多くは外在的ハルシネーションです。特に「引用元を示してほしい」と指示したときに、もっともらしいがまったく架空の文献が出力されるパターンが頻繁に確認されました。

LLMの基本構造――確率的テキスト生成がすべての起点

ハルシネーションの仕組みを理解するには、まずLLMが「どうやって文章を生成しているか」を押さえる必要があります。

トークン予測という本質的な仕組み

LLMはテキストをトークン(単語や文字の断片)単位に分割し、「これまでのトークン列が与えられたとき、次のトークンは何か」という条件付き確率を計算し続けます。文章全体の「意味」を理解して生成しているわけではなく、統計的に最もそれらしいトークンを逐次選択する装置です。

入力プロンプト
(トークン列)
Transformerが
確率分布を計算
最高確率の
トークンを出力
出力トークンを
入力に追加して繰り返す

このループが何千回と繰り返されて一つの回答が完成します。重要なのは、「正しいかどうか」を判定するステップがこのループに存在しないことです。モデルは「それらしいか」を最大化するだけです。

Transformerとアテンション機構

現代のLLMはほぼすべてTransformerアーキテクチャを採用しています。Transformerの核心は自己注意(Self-Attention)機構で、トークン間の関連度を動的に重み付けして文脈を把握します。数百億〜数兆のパラメータに圧縮された「知識」は、訓練データ中の共起パターンとして暗黙的に埋め込まれており、明示的な事実データベースとは根本的に異なります。

ここに最初の落とし穴があります。訓練データに多く登場したパターンは強く学習され、稀なパターンは曖昧に学習されるか、誤った汎化が起きます。ニッチな専門知識や最新情報ほどハルシネーションが発生しやすいのはこのためです。

ハルシネーションが発生する4つのメカニズム

①訓練データのバイアスと欠損

LLMはインターネット上のテキストを大量に学習しますが、そのデータは本質的に偏っています。

  • 英語・主要言語のデータが圧倒的に多く、日本語の専門知識は薄くなる
  • フィクション・誤情報・古い情報が大量に混入している
  • 特定分野(医療・法律・最新ニュース)は記述が少なく、誤った汎化が起きやすい

モデルは「よく見たパターン」を信頼度高く、「あまり見ていないパターン」を補完的に生成します。補完の際に事実確認のメカニズムはなく、既存パターンをつなぎ合わせた「それらしい話」が生成されるのがハルシネーションの本質の一つです。

②目的関数の限界――「正確さ」ではなく「らしさ」を最大化

LLMの事前学習における目的関数は次トークン予測損失の最小化です。「人間が事実として受け入れやすい文章」と「実際に正確な文章」はしばしば異なります。モデルは後者ではなく前者に最適化されています。

RLHF(人間のフィードバックによる強化学習)でファインチューニングされたモデルでも事情は複雑で、人間の評価者が「流暢で自信に満ちた回答」を「正確な回答」より高評価しがちなため、自信を持って断言するバイアスがかえって強化されることがあります。

③知識カットオフとリアルタイム情報の欠如

LLMには訓練データのカットオフ日(学習終了日)があります。それ以降の出来事については学習データが存在しないため、モデルは「それらしい補完」で回答するしかありません。当社の検証でも、カットオフ直後の出来事についてはとくにハルシネーション率が上昇することを確認しています。

また、モデルは自分の知識の境界を正確に把握していません。「知らない」と答えるより「それらしい答えを生成する」方が訓練上の報酬を得やすかった可能性があり、不確かな領域でも自信を持って回答するクセが形成されます。

④デコーディング戦略の影響

生成時に使われるデコーディング戦略もハルシネーションに影響します。

パラメータ 高い場合の挙動 低い場合の挙動 ハルシネーションとの関係
Temperature 多様・創造的な出力 確定的・保守的な出力 高いほどハルシネーション増加傾向
Top-p(nucleus sampling) 低確率トークンも選択 高確率トークンのみ選択 高いほど意外な(誤った)トークンを選ぶリスク増
Greedy decoding 常に最高確率を選択 反復・単調になるが事実誤りは比較的減少

クリエイティブ用途でTemperatureを上げると出力が豊かになる一方、事実性は低下します。業務での事実確認用途ではTemperatureを低めに設定することが基本の対策となります。

長文コンテキストと「中間忘れ」問題

コンテキストウィンドウ(一度に処理できるトークン数)が拡大した現代のLLMでも、コンテキストの中間部分への注意(アテンション)が端部より弱くなるという現象が研究で報告されています(いわゆる”Lost in the Middle”問題)。

これはRAG(検索拡張生成)や長文要約において実務上の問題を起こします。長い参照文書の中間に重要な事実が書かれていても、それが無視されてハルシネーションが発生するケースです。当社の検証でも、数万トークン規模の文書を与えたとき、文書後半の内容の反映精度が低下するパターンを確認しています。重要情報はコンテキストの先頭または末尾に配置する、あるいは文書を分割して処理するといった工夫が実務上有効です。

モデルの「自信」とキャリブレーション問題

ハルシネーションをとくに扱いにくくしているのが、モデルが誤りを誤りとして認識しないまま高い確信度で出力するという特性です。これをキャリブレーションのずれと呼びます。

理想的なモデルは「確信度80%の回答が正解である確率も約80%」になるよう校正(キャリブレーション)されているべきですが、多くのLLMはこのキャリブレーションが不完全で、誤りに対しても高い確信度を示す傾向があります。

これはRLHFの副作用とも考えられています。人間の評価者が「はっきり答えない回答」に低評価をつけることで、モデルが「不確かでも断言する」方向に強化学習されてしまう可能性があります。

モデルの確信度と実際の正確さのずれ(キャリブレーション問題)
モデルの確信度と実際の正確さのずれ(キャリブレーション問題)

RAGはハルシネーションを解決するか

RAG(Retrieval-Augmented Generation)は外部の信頼できる文書を検索してコンテキストに追加し、それを根拠に回答させる手法です。当社でも社内ナレッジベースへのRAG適用を試みており、事実誤りの削減に一定の効果があることを確認しています。

ただし、RAGでもハルシネーションがゼロになるわけではありません。

  • 検索精度の問題:関連文書が正しく取得されなければ、誤った前提で回答が生成される
  • コンテキスト競合:検索結果と訓練済み知識が矛盾したとき、どちらを採用するかモデルが迷い、折衷した誤回答を生成することがある
  • 引用の水増し:取得文書に基づきながら、そこに書かれていない追加情報をさも根拠があるように付け加える

RAGはハルシネーション軽減の有力な手段ですが、「根絶の手段」ではなく「リスク低減の手段」として位置づけるべきです。

モデルごとのハルシネーション特性の違い

ハルシネーションの頻度・傾向はモデルアーキテクチャ、訓練データ量、RLHFの設計によって大きく異なります。当社で複数のLLMを実務検証した結果、同じプロンプトでも事実誤りの頻度・種類には顕著な差があることを確認しています。

主要LLMのハルシネーション傾向をはじめとした詳細な比較については、AIモデルの比較(LLM比較)をご参照ください。モデル選定の際の重要な判断材料になります。

ハルシネーションを減らすための実践的アプローチ

仕組みを理解した上で、現時点で実務上効果が確認されているアプローチをまとめます。

プロンプト設計による対策

  • 「わからない場合はわからないと言ってください」と明示的に指示する(不確実性の許容)
  • 回答の根拠となる情報を文脈として明示的に提供する(ゼロショットより少数ショット)
  • Chain-of-Thought(思考ステップを明示させる)プロンプトで推論の透明化を図る
  • Temperature を下げ、Greedy寄りの設定にする(事実確認用途)

システム設計による対策

  • RAGで外部の信頼できる情報源を根拠として与える
  • 出力に引用元の明記を義務付け、人間が検証できるようにする
  • 複数モデルに同じ質問をして回答を照合するアンサンブル検証
  • 重要な事実判断をLLM単独に委ねず、ルールベースや人間レビューを組み合わせる

評価・モニタリング

  • 定期的にゴールデンセット(既知の正解データ)でハルシネーション率を計測する
  • ユーザーからのフィードバックを蓄積し、誤り傾向のパターンを把握する
  • 特定ドメインへのファインチューニングで、その分野の事実性を高める

まとめ

ハルシネーションは偶発的なバグではなく、LLMが「次のトークンとして最もらしいものを選ぶ」という根本原理から生まれる構造的な現象です。訓練データのバイアス、目的関数の限界、知識カットオフ、デコーディング戦略、キャリブレーション問題――これらが複合的に絡み合って「自信満々な誤情報」が生成されます。

RAGやプロンプト設計などの対策を重ねることでリスクは大幅に下げられますが、現時点でハルシネーションを完全にゼロにする方法は存在しません。「LLMは確率的なテキスト生成装置である」という前提を持ち、重要な判断には必ず検証プロセスを設けることが、AIを実務で安全に活用するための基本姿勢です。

各LLMのハルシネーション傾向の違いや選定基準については、AIモデルの比較(LLM比較)で詳しく解説しています。自社のユースケースに最適なモデルを選ぶ際の参考にしてください。

関連記事

関連記事

監修

河合 継(クリスタルメソッド株式会社 代表取締役)

AI・ディープラーニングに関する特許16件の発明者。過去、国立がん研究センターとの共同研究や、テレビ番組でのAI解説実績を持つAI研究者として、AIの研究開発を主導している。
運営会社について編集方針

AIブログ購読

 
クリスタルメソッドがお届けする
AIブログの更新通知を受け取る

Study about AI

AIについて学ぶ

  • GPT-5.5 Claude エージェント ベンチマーク選定——日本企業が問い直すべき評価軸

    GPT-5.5 Claude エージェント ベンチマーク選定——日本企業が問い直すべき評価軸

    GPT-5.5がClaude Fable 5を上回った——「Agents’ Last Exam」とは何か 2026年6月、AIエージェント評価の文脈...

  • 米上院 金融AI 規制 公聴会——日本の銀行・証券への実務的示唆

    米上院 金融AI 規制 公聴会——日本の銀行・証券への実務的示唆

    上院 金融AI 規制 公聴会の要点——何が、なぜ今議題に上ったか 2026年6月11日午前10時(米東部夏時間)、米上院銀行・住宅・都市問題委員会(U.S. S...

  • Cerebras NvidiaのGPUに対抗——SuperAI Singaporeデモが日本のAIインフラ調達に示す論点

    Cerebras NvidiaのGPUに対抗——SuperAI Singaporeデモが日本のAIインフラ調達に示す論点

    CerebrasがSuperAI SingaporeでNvidiaのGPUに対抗——デモの概要と報道の背景 2026年6月10〜11日、シンガポールのMarin...

View more