#LLM
11 件-
newsLLM に冷戦戦略会議をさせたら核兵器を選んだ — King's College London 実験が示す AI 軍事利用の致命バイアス
King's College London の Payne 教授が GPT-5.2・Claude Sonnet 4・Gemini 3 Flash に核保有国の戦略会議を演じさせたところ、3...
-
newsAIエージェントが直接バックエンドを叩く時代 — OSS「InsForge」とエージェント運用の死角
AIコーディングエージェント向けのOSSバックエンド「InsForge」が登場。DB・ストレージ・MCP連携をエージェントが直接運用する設...
-
newsllm-checker — 自分の PC で動くローカル LLM を CLI が選んでくれる
ローカル LLM の選定を CLI で解決する llm-checker。GPU/RAM をスキャンし、Ollama カタログ 200+ から自分のマシンで動くモデ...
-
newsエストニア政府が LLM のロシア宣伝耐性ベンチマークを公開、首位は Claude Opus 4.7
エストニア言語研究所がLLMのロシア宣伝耐性を測る公開ベンチマークを発表。Claude Opus 4.7 が94.9点で首位。国家機関が AI を...
-
news最先端 AI 5 つのファクトチェックが 67% で割れる — 「合議で安心」の前提が崩れた
Lenz の調査で最先端 5 モデルにユーザー投稿 1,000 件の主張を投げたところ、67% で意見が一致しなかった。AI 多数決では誤りが...
-
newsAnthropic が 9,650 億ドル評価で OpenAI 超え、Opus 4.8「dynamic workflows」が変えるエージェント攻防
Anthropic が 650 億ドル調達で評価額 9,650 億ドルとなり OpenAI を抜いた。同日公開された Claude Opus 4.8 の dynamic workfl...
-
newsAI捏造の参考文献が生物医学論文に3年で12倍 — 277本に1本が偽引用の知の汚染時代
生物医学論文に紛れ込む存在しない参考文献が3年で12倍に急増。277本に1本が偽引用という事態は、LLM出力を無検証で信頼した結果...
-
newsオープンウェイト LLM の安全装置は数分で剥がせる ― FT 検証が示す『公開モデルの根本問題』
Meta や Google が公開するオープンウェイト LLM の安全制御を、GitHub 公開ツールで数分で剥がせると FT が検証。マルウェア・...
-
news「Noroboto」攻撃 — フォント細工で AI だけ別文章を読まされる契約書ハック
PDF/DOCX 埋め込みフォントの Unicode マッピングを細工し、人間にはそのまま見える文章を AI には別物として読ませる新攻撃「No...
-
news「ignore」と検索しただけで Google AI が黙る ─ 検索バーで実演されたプロンプトインジェクション
Google 検索で ignore や disregard と打つと AI Overview が辞書定義ではなく「指示を無視します」と返す現象が拡散。プロンプ...
-
newsClaude の Anthropic が Musk の xAI に月 2,000 億円 ― Grok 不振の余剰計算を競合が買い占める
Anthropic が xAI 傘下の Colossus 1 を 2029 年 5 月まで月額 2,000 億円で全占有することが SpaceX の S-1 で判明。300MW・GPU...