AnthropicのClaude Mythos Preview、サイバーセキュリティ能力で一般公開制限
AI史上最高のサイバー能力を持つモデルが、全主要OSとブラウザで数千の脆弱性を発見。Anthropicが「Project Glasswing」でセキュリティパートナーのみに提供

革命的なサイバーセキュリティ能力、一般公開を制限
Anthropicは4月7日、新型AIモデル「Claude Mythos Preview」を発表したが、そのサイバーセキュリティ能力が前例のないレベルに達したため、一般公開を見送ると発表した。同モデルは既に数千の高深刻度脆弱性を発見しており、全主要オペレーティングシステムと全主要ウェブブラウザで未知の脆弱性を発見している。 発見された脆弱性には、27年間未発見だったOpenBSDの脆弱性や、500万回の自動テストをすり抜けたFFmpegライブラリの16年前のバグが含まれる。これらの発見は、AIがサイバーセキュリティ分野で人間の専門家を上回る能力を持つことを実証している。
「Project Glasswing」で限定的な展開
Anthropicは、Mythos Previewの強力な能力を悪用される可能性を懸念し、「Project Glasswing」という新たなサイバーセキュリティイニシアチブを立ち上げた。このプロジェクトには、Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、Nvidia、Palo Alto Networksなど12の主要企業が参加している。 Anthropicは、Project Glasswingに1億ドルのモデル利用クレジットを提供し、さらにオープンソースセキュリティ組織に400万ドルの直接寄付を行う。このモデルへのアクセスは、重要なソフトウェアインフラを構築・維持する約40の追加組織にも拡大される。
POINT
Claude Mythos Previewは、従来のOpus 4.6が脆弱性をエクスプロイトに変換する成功率が0%に近かったのに対し、72.4%の成功率を記録している
具体的な発見事例と技術的進歩
OpenBSDの27年前の脆弱性は、1998年に追加されたSACK実装における微妙な欠陥で、攻撃者がTCP接続を通じて任意のOpenBSDホストをクラッシュさせることを可能にする。FFmpegの16年前のH.264コーデックの脆弱性は、自動テストツールが500万回も実行した箇所にあったにも関わらず、従来の手法では発見されなかった。 さらに同モデルは、4つの脆弱性を連鎖させた複雑なウェブブラウザエクスプロイトを作成し、レンダラーとOSの両方のサンドボックスを回避することにも成功している。これらの能力は、最上級の人間のハッカーでも困難とされる高度な攻撃手法を自動化できることを示している。
AITAKE編集部の見方
Claude Mythos Previewの発表は、AI技術がサイバーセキュリティ分野に与える影響の転換点となる可能性が高い。Anthropicが「AI の進歩のペースを考えると、このような能力が普及するのに時間はかからず、安全な展開にコミットしていないアクターに渡る可能性がある」と警告している点は、業界全体が真剣に受け止めるべき課題だ。 Project Glasswingのアプローチは、強力なAI技術の責任ある展開の新しいモデルとなり得る。しかし、この技術が悪意あるアクターの手に渡ることを完全に防ぐことは困難であり、サイバーセキュリティ業界全体でのより包括的な対応策の検討が急務となっている。日本企業も、この技術革新に対応するための戦略的な準備を進める必要があるだろう。
Source: Anthropic