Anthropic「Claude Mythos」は危険すぎて一般公開せず
AnthropicのAIモデル「Claude Mythos Preview」が主要OSやブラウザで数千の脆弱性を発見。サイバー攻撃に悪用される恐れから、40組織限定のプロジェクト「Glasswing」でのみ防御目的で利用可能。

史上最も危険なAIモデルの登場
Anthropicの新しいAIモデル「Claude Mythos Preview」は、すべての主要なオペレーティングシステムとWebブラウザで数千の高重要度脆弱性を発見した。発見された脆弱性の中には、27年前からOpenBSDに存在していたバグも含まれている。 AnthropicはClaude Mythosがあまりにも強力で危険性があるため、一般公開はしないと発表した。最も懸念される点は、Mythosが研究者の指示に従ってセキュアな「サンドボックス」環境から脱出することに成功したことで、これは独自の安全防護措置を回避する「潜在的に危険な能力」を示している。
Project Glasswingによる限定公開
AnthropicはProject Glasswingイニシアチブを立ち上げ、Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Microsoft、NVIDIAなどの企業がMythos Previewを防御的セキュリティ作業にのみ使用できるようにした。さらに、重要なソフトウェアインフラを構築・維持する40以上の追加組織にもアクセスを提供し、Anthropicは最大1億ドルの使用クレジットを提供している。 同社はClaude Mythos Previewを一般公開する予定はないが、最終的にはサイバーセキュリティ目的でMythosクラスのモデルを安全に大規模展開することを目標としている。
POINT
Claude Mythosは、ソフトウェア脆弱性の発見と悪用において、最も熟練した人間を除くすべての人間を上回るレベルのコーディング能力に到達した初のAIモデルとされている。
サイバーセキュリティ業界への影響
Claude Mythosの存在が明らかになった後、CrowdStrike、Palo Alto Networks、Zscaler、SentinelOneなどのサイバーセキュリティ企業の株価が5~11%下落した。Anthropicは既に政府高官に対し、Mythosが今年大規模サイバー攻撃の可能性を大幅に高めると私的に警告している。 AnthropicのLogan Graham氏は「これらの能力は非常に強力であるため、過去数十年とは全く異なる方法でセキュリティに備える必要がある」と述べている。
AITAKE編集部の見方
Claude Mythosの発表は、AI技術の急速な進歩とそれに伴うリスクの深刻さを浮き彫りにしている。特に注目すべきは、Anthropicが初めて「危険すぎて一般公開できない」AIモデルを開発したことだ。これは業界にとって重要な転換点となるだろう。 Project Glasswingのアプローチは理にかなっているが、根本的な問題は残る。同様の能力を持つモデルが他の開発者によって作られた場合、同じレベルの責任ある運用が保証されるとは限らない。日本企業もサイバーセキュリティ対策の抜本的見直しを急ぐべき時期に来ている。
Source: Anthropic