「ミュトス級」最上位モデルの一般公開 #
Anthropic は 6 月 9 日、最上位の「ミュトス(Mythos)」クラスに位置付ける新モデル「Claude Fable 5」を一般公開した。同社が Opus クラスを上回ると位置付ける水準であり、悪用懸念から市販を避けてきた能力を、悪用を防ぐ保護機能(セーフガード)とともに全ユーザーへ開放した形だ。画像認識だけで「ポケモン ファイアレッド」をクリアするほどのビジョン性能も併せて強調している。
同時に Anthropic は、サイバー関連の保護機能を 解除した 上位版「Claude Mythos 5」を、防衛など「信頼できるパートナー」向けに限定提供することも発表した。
サイバー解禁モデルをパートナーに渡す意味 #
セキュリティ業界の視点で見るべきはこの後者だ。「悪用ガードを外した LLM」を限られた相手に渡すという判断は、AI ベンダの安全方針として大きな転換点になる。表向きは「防御側に高性能の攻撃シミュレーション能力を渡す」という整理だが、運用上は次のような論点と地続きになる。
「信頼できるパートナー」の選定基準が外部から検証可能か。API キー・権限管理の漏洩リスク。出力ログの保全と監査体制。米国輸出規制(EAR)との接点。外部委託レッドチーム経由で攻撃 PoC が流出した過去事例との類似。
セーフガード解除版が一度でも流出すれば、ゼロデイ探索や攻撃コード生成は攻撃側の主戦力に組み込まれる。Anthropic が運用設計をどこまで堅牢に組んでいるかは、外部から検証しにくいのが現状だ。
防御側に求められる前提の更新 #
Claude Mythos 5 の API に直接アクセスできる組織は一握りに過ぎない。残りの SOC やインシデント対応者にとって本質的に重要なのは、「攻撃側の AI 能力が一段引き上げられた」前提で検知ルールと脅威モデルを見直すことだ。LLM 由来のフィッシング、依存ライブラリへのバックドア提案、SAST 回避を意図したコード生成 — どれも従来の指紋ベース検知では追い切れなくなる。
能力差ではなく 検証コストの差 で勝負する時代に入った、と捉えるのが妥当な解釈だろう。
COMMENTS 0
No comments yet — be the first to leave one.