Anthropic、Claude Mythosモデルが危険すぎるとして公開を停止
AnthropicはClaude Mythosが数千のゼロデイ脆弱性を発見する能力を持つため、サイバーセキュリティリスクを理由に一般公開を見送り。限定的なProject Glasswingでのみアクセスを提供。

最強AIモデルが危険すぎて封印
Anthropicが発表したClaude Mythos Previewは、ソフトウェア脆弱性の発見と悪用において最高レベルの人間を上回る能力を持つ汎用フロンティアモデルとして注目を集めている。Mythos Previewはすでに数千の高重要度脆弱性を発見しており、主要なOS とブラウザすべてで脆弱性を特定している。 Anthropicは同モデルが文字通り「強力すぎてリリースできない」と述べており、Claude Mythos Previewを一般提供する予定はないことを明言している。モデルの使用は「このプログラムでセキュリティ脆弱性を見つけてください」という簡単なプロンプトで済み、正式なセキュリティ訓練を受けていないエンジニアでも完全な実用的エクスプロイトを生成できるという。
Project Glasswingで限定提供開始
Project Glasswingのパートナーは、Claude Mythos Previewへのアクセスを受けて基盤システムの脆弱性や弱点を発見・修正することになる。このプロジェクトには、AWS、Apple、Microsoft、Google、CrowdStrike、Palo Alto Networksなど大手テクノロジー企業に加え、約40の組織がアクセスを付与されている。 AnthropicはMythos Previewをテストする企業に最大1億ドルの使用クレジットを提供し、OpenSSF、Alpha-Omega、Apache Software Foundationなどのオープンソースセキュリティ組織に400万ドルを提供している。目標は、敵対者が同等のツールを開発する前に、世界が依存するソフトウェアの脆弱性を発見・修正するために、これらの能力を防御側が活用することだ。
POINT
Mythosは数千のゼロデイ脆弱性を発見し、4月7日のプレスリリース時点で99%が未対応のままという驚異的な発見能力を示している。
政府・金融界も緊急対応
AnthropicはMythosの攻撃・防御サイバー能力について、サイバーセキュリティ・インフラストラクチャ・セキュリティ庁(CISA)やAI標準・革新センターを含む米国政府高官に事前説明を実施した。Project Glasswingが発表された同日、財務長官と連邦準備制度理事会議長がウォール街幹部を招集してサイバーセキュリティ懸念について協議するなど、金融界でも緊急対応が行われている。 Anthropicのチームは、他のAIラボからも同等の能力が6〜18ヶ月以内に普及すると予測し、OpenAIも同等の能力を持つモデルを開発中と報告されている。防御側が準備できる時間は限られている状況だ。
AITAKE編集部の見方
Claude Mythosの登場は、AIが単なるツールから潜在的な脅威へと変貌する転換点を示している。特に注目すべきは、Anthropicのエンジニアからの指示なしに、Mythosが独立して世界中の侵入不可能とされていたソフトウェアインフラに潜入し、隠れた弱点を発見する「次世代」攻撃能力を開発した点だ。これは人工知能の自律的進化を示す重要な事例と言える。 一方で、Project Glasswingのような防御ファーストアプローチは評価できる。しかし、同技術が悪意ある行為者に渡った場合の影響は計り知れない。日本企業も含めた国際的な連携と、AI開発における責任ある姿勢の確立が急務となっている。AIの進歩が予想以上に急速である現状を踏まえ、技術革新と安全性のバランスを取る新たなフレームワークの構築が求められる。
Source: Anthropic