AI に「これは事実か?」と聞く運用は、いまや SNS の誤情報対策からセキュリティ製品の判定機構まで広く組み込まれている。だがその前提を揺るがす調査結果が出た。ファクトチェック特化サービス「Lenz」が、ユーザーから寄せられた 1,000 件の主張を最先端 5 モデル(GPT-5 系・Claude 4 系・Gemini 2.5 系・Grok 4 系・DeepSeek V4)に同時投入したところ、67% の主張で意見が一致しなかったという。多数決でも結論が確定しないケースが多く、「AI に真偽判定を委ねる」という静かな前提が崩れた。
なぜ最先端 AI 同士で噛み合わないのか #
不一致が大きく出たのは「政治・地政学」「健康・栄養」「最近の事件の責任所在」といった、一次情報が断片的でかつ評価軸が論争的な領域だ。要因は三つ重なっている。第一に学習データの世代差 ── モデルごとに知識カットオフが数か月単位でずれており、同じ「最新情報」を見ていない。第二に整合チューニングの方針差。Anthropic は不確実性をそのまま「分からない」と返す傾向が強く、OpenAI 系は補助仮説で穴埋めしがちで、Grok は強めの断定に寄る。第三にハルシネーションの方向性が揃わない。各社が違う方向に間違えるので、合議させても誤りが平均化されず、判断が分散するだけになる。
セキュリティ屋から見た「AI 多数決」の落とし穴 #
この結果はファクトチェック界隈だけの話ではない。フィッシング判定・偽サイト検知・ディープフェイク検出・SOC のアラート要約 ── どの場面でも「複数 LLM の合議でハルシネーションを抑える」という設計が当たり前になりつつある。だが今回の調査は、モデルが違う方向に間違える前提では、合議は安全網にならないことを示した。とくに政治的・社会的に係争中のトピックは、攻撃者が情報戦の文脈で意図的に流し込みやすい領域でもある。AI が「事実です」と返した瞬間に SNS で増幅されるアーキテクチャは、誤判定が攻撃面に直結する構造を抱えている。
AI 判定を最終決裁に置かない。複数モデルの「一致率」をスコアとして出し、低一致のものは人間の二次判定に必ず回す。とくに「断定できなかった割合」をログに残し、後追いできる状態を保つ。
人間のメディアリテラシーを節約するために AI を使うはずが、AI 同士の不一致を解釈するためにより高度な人間の判断が必要になる ── という逆転が起きている。「AI に聞けば分かる」時代の終わりは、案外こうした地味な数字から始まる。
COMMENTS 0
No comments yet — be the first to leave one.