最先端 AI 5 つのファクトチェックが 67% で割れる — 「合議で安心」の前提が崩れた

AI に「これは事実か？」と聞く運用は、いまや SNS の誤情報対策からセキュリティ製品の判定機構まで広く組み込まれている。だがその前提を揺るがす調査結果が出た。ファクトチェック特化サービス「Lenz」が、ユーザーから寄せられた 1,000 件の主張を最先端 5 モデル(GPT-5 系・Claude 4 系・Gemini 2.5 系・Grok 4 系・DeepSeek V4)に同時投入したところ、67% の主張で意見が一致しなかったという。多数決でも結論が確定しないケースが多く、「AI に真偽判定を委ねる」という静かな前提が崩れた。

67%

5 モデルで意見が割れた主張

1,000

検証された主張の総数

対象となった最先端モデル

なぜ最先端 AI 同士で噛み合わないのか #

不一致が大きく出たのは「政治・地政学」「健康・栄養」「最近の事件の責任所在」といった、一次情報が断片的でかつ評価軸が論争的な領域だ。要因は三つ重なっている。第一に学習データの世代差 ── モデルごとに知識カットオフが数か月単位でずれており、同じ「最新情報」を見ていない。第二に整合チューニングの方針差。Anthropic は不確実性をそのまま「分からない」と返す傾向が強く、OpenAI 系は補助仮説で穴埋めしがちで、Grok は強めの断定に寄る。第三にハルシネーションの方向性が揃わない。各社が違う方向に間違えるので、合議させても誤りが平均化されず、判断が分散するだけになる。

政治・地政学

82%

健康・栄養

74%

直近の事件・責任所在

69%

歴史的事実

31%

分野別の不一致率(Lenz 調査をもとに当サイト編集)

セキュリティ屋から見た「AI 多数決」の落とし穴 #

この結果はファクトチェック界隈だけの話ではない。フィッシング判定・偽サイト検知・ディープフェイク検出・SOC のアラート要約 ── どの場面でも「複数 LLM の合議でハルシネーションを抑える」という設計が当たり前になりつつある。だが今回の調査は、モデルが違う方向に間違える前提では、合議は安全網にならないことを示した。とくに政治的・社会的に係争中のトピックは、攻撃者が情報戦の文脈で意図的に流し込みやすい領域でもある。AI が「事実です」と返した瞬間に SNS で増幅されるアーキテクチャは、誤判定が攻撃面に直結する構造を抱えている。

運用上の含意

AI 判定を最終決裁に置かない。複数モデルの「一致率」をスコアとして出し、低一致のものは人間の二次判定に必ず回す。とくに「断定できなかった割合」をログに残し、後追いできる状態を保つ。

人間のメディアリテラシーを節約するために AI を使うはずが、AI 同士の不一致を解釈するためにより高度な人間の判断が必要になる ── という逆転が起きている。「AI に聞けば分かる」時代の終わりは、案外こうした地味な数字から始まる。

最先端 AI 5 つのファクトチェックが 67% で割れる — 「合議で安心」の前提が崩れた

なぜ最先端 AI 同士で噛み合わないのか #

セキュリティ屋から見た「AI 多数決」の落とし穴 #

COMMENTS 0

Post a comment

なぜ最先端 AI 同士で噛み合わないのか #

セキュリティ屋から見た「AI 多数決」の落とし穴 #

COMMENTS 0

Post a comment

RELATED

AIが言語化しない"内なる思考"を可視化──AnthropicのJ-spaceとJacobian lens

エストニア政府が LLM のロシア宣伝耐性ベンチマークを公開、首位は Claude Opus 4.7

中国発「Kimi K3」がコーディング系ベンチでGPT-5.6超え、7月27日に2.8兆パラメータをオープン化へ

iPhone単体で270億パラメータAIが動く時代 ― "Bonsai 27B"が突きつける新たな攻撃面