TAG

#LLM

11 件

news
LLM に冷戦戦略会議をさせたら核兵器を選んだ — King's College London 実験が示す AI 軍事利用の致命バイアス

King's College London の Payne 教授が GPT-5.2・Claude Sonnet 4・Gemini 3 Flash に核保有国の戦略会議を演じさせたところ、3...

2026-06-15 view 87 like 0
news
AIエージェントが直接バックエンドを叩く時代 — OSS「InsForge」とエージェント運用の死角

AIコーディングエージェント向けのOSSバックエンド「InsForge」が登場。DB・ストレージ・MCP連携をエージェントが直接運用する設...

2026-06-15 view 88 like 0
news
llm-checker — 自分の PC で動くローカル LLM を CLI が選んでくれる

ローカル LLM の選定を CLI で解決する llm-checker。GPU/RAM をスキャンし、Ollama カタログ 200+ から自分のマシンで動くモデ...

2026-06-07 view 93 like 0
news
エストニア政府が LLM のロシア宣伝耐性ベンチマークを公開、首位は Claude Opus 4.7

エストニア言語研究所がLLMのロシア宣伝耐性を測る公開ベンチマークを発表。Claude Opus 4.7 が94.9点で首位。国家機関が AI を...

2026-06-06 view 140 like 0
news
最先端 AI 5 つのファクトチェックが 67% で割れる — 「合議で安心」の前提が崩れた

Lenz の調査で最先端 5 モデルにユーザー投稿 1,000 件の主張を投げたところ、67% で意見が一致しなかった。AI 多数決では誤りが...

2026-06-01 view 97 like 0
news
Anthropic が 9,650 億ドル評価で OpenAI 超え、Opus 4.8「dynamic workflows」が変えるエージェント攻防

Anthropic が 650 億ドル調達で評価額 9,650 億ドルとなり OpenAI を抜いた。同日公開された Claude Opus 4.8 の dynamic workfl...

2026-05-29 view 131 like 0
news
AI捏造の参考文献が生物医学論文に3年で12倍 — 277本に1本が偽引用の知の汚染時代

生物医学論文に紛れ込む存在しない参考文献が3年で12倍に急増。277本に1本が偽引用という事態は、LLM出力を無検証で信頼した結果...

2026-05-28 view 105 like 0
news
オープンウェイト LLM の安全装置は数分で剥がせる ― FT 検証が示す『公開モデルの根本問題』

Meta や Google が公開するオープンウェイト LLM の安全制御を、GitHub 公開ツールで数分で剥がせると FT が検証。マルウェア・...

2026-05-27 view 99 like 0
news
「Noroboto」攻撃 — フォント細工で AI だけ別文章を読まされる契約書ハック

PDF/DOCX 埋め込みフォントの Unicode マッピングを細工し、人間にはそのまま見える文章を AI には別物として読ませる新攻撃「No...

2026-05-25 view 118 like 0
news
「ignore」と検索しただけで Google AI が黙る ─ 検索バーで実演されたプロンプトインジェクション

Google 検索で ignore や disregard と打つと AI Overview が辞書定義ではなく「指示を無視します」と返す現象が拡散。プロンプ...

2026-05-23 view 118 like 1
news
Claude の Anthropic が Musk の xAI に月 2,000 億円 ― Grok 不振の余剰計算を競合が買い占める

Anthropic が xAI 傘下の Colossus 1 を 2029 年 5 月まで月額 2,000 億円で全占有することが SpaceX の S-1 で判明。300MW・GPU...

2026-05-21 view 95 like 0