Anthropic、危険すぎて公開できないAIモデル「Mythos」を開発
「Mythos」は主要OSやブラウザに数千の脆弱性を発見。セキュリティ懸念により40社の限定コンソーシアムにのみ提供。

限定公開される「Mythos」の脅威
AnthropicのClaude Mythos Previewは、すべての主要なオペレーティングシステムとWebブラウザで数千の高重要度の脆弱性をすでに発見している。同社はMythosが危険すぎて一般公開できないとしている。 Mythosは、破壊的なサイバーセキュリティの可能性により、ユーザーから制限された最初のAIモデルである。MythosPreviewはこれらの能力を持つよう明示的に訓練されておらず、むしろコード、推論、自律性の一般的な改善の下流結果として現れた。モデルを脆弱性の修正により効果的にする同じ改善が、それらを悪用することにもより効果的にしている。
Project Glasswingによる限定的な展開
Anthropicは、重要なソフトウェアインフラを構築または維持する40以上の追加組織のグループにアクセスを拡張し、モデルを使用してファーストパーティとオープンソースシステムの両方をスキャンして保護できるようにしている。このイニシアチブは、Amazon Web Services、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksを起業パートナーとしてまとめている。 Anthropicはこれらの取り組みにMythos Previewの使用クレジットとして最大1億ドル、オープンソースセキュリティ組織への直接寄付として400万ドルをコミットしている。Firefoxブラウザ開発者のMozillaは、AnthropicのClaude Mythos AIの初期版が内部テストでブラウザの271の脆弱性を特定するのに役立ったと発表し、これらのバグは今週パッチされた。
ポイント
Mythosは27年前のOpenBSDのバグを含む、10年から20年前のシステムの脆弱性を発見。500万回のテストでも検出されなかったコード行の欠陥も発見し、テストで見つかった数千のゼロデイの99%が4月7日のプレスリリース時点で未対策だった。
サイバーセキュリティへの影響と懸念
MythosのようなAI能力によって支援される可能性のある敵対者は、複雑なキルチェーンを実行し、ゼロデイ攻撃を開発し、効果的に武器化する能力の欠如により、従来は準同等国と分類されていなかった国家であるイランと北朝鮮である。Mythosがプライベートプレビューから脱却し、世界の他の地域に展開されるにつれ、もしそれらがガードレールを無効化できるなら、それらの国がサイバー作戦を国力の手段としてより良く活用できるときである。 制御された評価で、Mythos Previewが明示的に指示され、ネットワークアクセスを与えられた場合、脆弱なネットワークで多段階攻撃を実行し、自律的に脆弱性を発見して悪用できることが観察された。これは人間の専門家が数日かかる作業である。過去数週間で、AnthropicのMythos Previewはすべての主要なオペレーティングシステムとWebブラウザを含む数千のゼロデイ脆弱性を特定した。
AITAKE編集部の見方
Anthropicの「Mythos」は、AIの能力がサイバーセキュリティ分野で新たな転換点に達したことを明確に示している。従来、ゼロデイ脆弱性の発見は高度に専門化した人間の専門家の領域だったが、AIがこの領域で人間を上回る性能を示したことは革命的だ。 Project Glasswingのアプローチは適切だが、技術の拡散を完全に制御することは困難である。中国などの競合国が同様の技術を開発する可能性もあり、防御と攻撃の均衡が大きく変化する可能性がある。特に注目すべきは、AIが27年間発見されなかった脆弱性を見つけたことで、既存のセキュリティ対策の根本的な見直しが必要になるだろう。 企業は今すぐパッチ適用の自動化、AIベースの脆弱性スキャン導入、ゼロトラスト・アーキテクチャの強化など、防御態勢の抜本的な強化を図る必要がある。
Source: Anthropic