Anthropic「Claude Mythos」流出で深刻なサイバー脅威
AnthropicのCMS設定ミスで新AI「Claude Mythos」のドラフトブログが偶然公開され、同社が政府関係者にサイバー攻撃の大幅な増加を警告していることが明らかに。

データ流出で判明した新モデルの存在
3月26日、Anthropicのコンテンツ管理システムの設定ミスにより、同社の新AI「Claude Mythos」を紹介するドラフトブログ投稿が公開データストアで発見された。LayerX SecurityのRoy Pazとケンブリッジ大学のAlexandre Pauwelsの2人のサイバーセキュリティ研究者が、暗号化されていない公開検索可能なデータベースでこの資料を発見した。 Anthropicの広報担当者は、この新モデルが「ステップチェンジ」を表すAI性能を示し、「これまでに構築した中で最も高性能」であると述べた。同社は「推論、コーディング、サイバーセキュリティにおいて意味のある進歩」を遂げた汎用モデルを開発していると発表した。このデータ流出により、Anthropicのブログに関連する約3,000件の未公開アセットが公開アクセス可能な状態になった。
前例のないサイバーセキュリティリスク
流出したブログ投稿によると、Mythosは「サイバー能力において他のすべてのAIモデルを大きく上回っている」とされ、「ディフェンダーの努力を大きく上回るペースで脆弱性を悪用できるモデルの波の前兆」となると警告されている。Anthropicは政府高官に対し、Mythosが2026年に大規模サイバー攻撃の可能性を大幅に高めると非公開で警告しており、このモデルは野生的な洗練度と精密さで企業、政府、地方自治体システムに侵入するエージェントを可能にする。 Dark Readingの調査では、サイバーセキュリティ専門家の48%が、エージェント型AIを2026年の最大の攻撃ベクターとして挙げており、これはディープフェイクやその他すべてを上回る結果となった。市場も敏感に反応し、iShares Expanded Tech-Software Sector ETF(IGV)は3%近く下落、ビットコインも66,000ドルまで急落した。
POINT
AnthropicのClaude Mythosは同社最強のAIモデルで、サイバー脅威の専門家から「ハッカーの夢の武器」と呼ばれている。政府関係者への非公開警告により、AI主導のサイバー攻撃の新時代が到来する可能性が示唆されている。
慎重なリリース戦略と市場への影響
Anthropicは、このリスクのために、モデルのリリースをサイバーディフェンダーに焦点を当てた戦略を計画しており、「組織にアーリーアクセスでリリースし、AI主導の脅威の差し迫った波に対してコードベースの堅牢性を改善する先手を打たせる」としている。現在、少数のアーリーアクセス顧客とモデルをテストしている。 サイバーセキュリティ株は一朝にして数十億ドルを失い、CrowdStrikeは昼食前に7.5%下落した。流出したドラフトでは、MythosはプロダクトネームCapybaraとして記述されており、Anthropicの現在のフラッグシップOpusラインを上回る新しいモデル階層を表している。
AITAKE編集部の見方
今回のClaude Mythos流出は、単なるセキュリティインシデントを超えて、AI開発における透明性と安全性のバランスという根本的な課題を浮き彫りにしています。Anthropicが政府関係者に非公開で警告を行っていたという事実は、このモデルが真に革新的であると同時に、社会に深刻な脅威をもたらす可能性があることを示しています。 特に注目すべきは、サイバーセキュリティ業界への影響です。従来の防御型セキュリティソリューションがAI主導の攻撃に対してどこまで有効性を保てるかという疑問が市場に広がっています。これは日本企業にとっても、AI導入と並行してサイバーセキュリティ戦略の根本的な見直しが必要になることを意味します。 今後、フロンティアAIモデルの開発と公開には、より厳格なガバナンス体制と段階的リリース戦略が不可欠となるでしょう。Anthropicのアプローチは、responsible AIの新しいスタンダードを設定する可能性があります。
Source: Fortune