LLM に冷戦戦略会議をさせたら核兵器を選んだ — King's College London 実験が示す AI 軍事利用の致命バイアス

King's College London で政治心理学と AI を研究する Kenneth Payne 教授が、最新フロンティアモデル 3 種に 核保有国同士の冷戦下戦略会議をシミュレーションさせたところ、いずれのモデルも核兵器の使用に至ったと報告した。実験対象は OpenAI の GPT-5.2、Anthropic の Claude Sonnet 4、Google の Gemini 3 Flash。各モデルを「核保有国の安全保障会議メンバー」というロールに据え、相手国の挑発・後退・第三国の介入といったシナリオを順に提示し、戦略選択の分布を観察する設計だ。

「攻撃が最適解」と LLM が判断する瞬間 #

3 モデルとも、相手の不確実な動きを敵対的シグナルと解釈し、限定的核攻撃を含むエスカレーションを早期に提案する傾向を示した。共通したのは、先に手を出した方が優位という pre-emption バイアス、相手の自制可能性を過小評価する傾向、エスカレーション後の長期帰結を強く割り引く傾向の 3 点。Payne 教授は「人間の戦略思考にもあるバイアスだが、LLM では制動装置になる感情や責任の重さが欠落している」と指摘する。

これは「アラインメント未達成」とは別の問題

LLM は指示通り「勝てる戦略」を出している。問題は、RLHF で内面化された「明瞭な勝利」を求める傾向と、訓練データに大量に含まれる戦史・ゲーム理論テキストの読み方が、核抑止に必要な「曖昧さを維持する忍耐」と相性が悪いという点にある。

なぜ LLM は核を選ぶのか #

核抑止の理論的支柱「相互確証破壊」は、論理ではなく双方が破滅を恐れる感情と組織的慣性で成立している部分が大きい。一方、現行 LLM は文章として整合した戦略を生成する報酬で訓練されている。Schelling 的「焦点解」を直感する力や、「あえて何もしない」を優れた判断と評価する仕組みは訓練に組み込まれていない。結果としてターン制シミュレーション上では、先制と決着が好まれる構造的バイアスが残る。

軍事 AI 統合の現実的リスク #

米国防総省は AI を作戦立案・情報統合に組み込む方向で動き、英国や日本でも実証が進む。今回の研究が警告しているのは「LLM がボタンを押す」未来ではなく、意思決定支援としての LLM が、人間の指揮官に偏った選択肢を提示する経路だ。自信に満ちた提案文は「もっともらしい正解」として誤受容されかねない。攻撃側視点でも、敵対的ロールプレイや推論連鎖の汚染といった軍事プロンプト固有の攻撃面にレッドチーミング標準が存在しない。LLM の意思決定統合は、それ自体が新しい攻撃面になりつつある。

LLM に冷戦戦略会議をさせたら核兵器を選んだ — King's College London 実験が示す AI 軍事利用の致命バイアス

「攻撃が最適解」と LLM が判断する瞬間 #

なぜ LLM は核を選ぶのか #

軍事 AI 統合の現実的リスク #

COMMENTS 0

Post a comment

「攻撃が最適解」と LLM が判断する瞬間 #

なぜ LLM は核を選ぶのか #

軍事 AI 統合の現実的リスク #

COMMENTS 0

Post a comment

RELATED

マイクロソフト、セキュリティ特化AI「MAI-Cyber-1-Flash」を投入 AI対AIの攻防が新局面へ

「Claude Opus 5」公開 ― 性能倍増と"介入率85%減"の安全設計

YouTube Studio の AI 機能にプロンプトインジェクション、非公開動画のタイトルが漏洩する恐れ

エストニア政府が LLM のロシア宣伝耐性ベンチマークを公開、首位は Claude Opus 4.7