Anthropic、最強AIモデル「Claude Mythos」を限定公開
サイバーセキュリティリスクを理由に一般公開を見送り、選ばれた約50組織のみが防御的セキュリティスキャンに利用可能に

最強のAIモデルが発見した脆弱性の規模
Anthropic社が開発した「Claude Mythos Preview」は、同社が「これまでに開発した中で最も強力なAIモデル」と位置づけており、脆弱性の発見と悪用において人間の最高レベルの専門家を上回る能力を持つことが明らかになった。このモデルは既に数千件の重大度の高い脆弱性を発見しており、すべての主要なオペレーティングシステムと主要なWebブラウザにおいて未知の脆弱性(ゼロデイ脆弱性)を特定している。 発見された脆弱性の中には、27年前からOpenBSDに存在していた古いバグも含まれており、一部の脆弱性は何年もの間検出されずにいた。また、このモデルは4つの脆弱性を連鎖させたWebブラウザエクスプロイトの作成や、LinuxとOSでの権限昇格エクスプロイトの自律的な取得といった高度な攻撃手法も実証している。
Project Glasswingによる限定公開の理由
Anthropic社は、このモデルが前例のないサイバーセキュリティリスクをもたらし、今年中に大規模なAI主導のサイバー攻撃の可能性を大幅に高めると警告している。このため、同社はClaude Mythos Previewの一般公開を行わない計画であることを明言している。 代わりに、Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksといった主要企業を含む約50の組織に対して、防御的セキュリティ業務および重要なソフトウェアインフラの構築・保守を目的としてアクセスを提供している。Anthropicは、この取り組みに最大1億ドルの利用クレジットと、オープンソースセキュリティ組織への400万ドルの直接寄付を提供している。
POINT
Claude Mythosは人間の専門家を上回る脆弱性発見能力を持つが、悪用される可能性を考慮してProject Glasswingという限定的な防御プログラムでのみ利用可能
政府への事前報告と業界への影響
Anthropicは、Project Glasswingの開始前に、サイバーセキュリティ・インフラセキュリティ庁(CISA)やAI標準革新センター(CAISI)を含む米国政府高官に対してMythosの攻撃的・防御的能力について事前説明を行った。 サイバーセキュリティ企業Corridorの最高製品責任者Alex Stamos氏は、「オープンウェイトモデルが基盤モデルのバグ発見能力に追いつくまで約6ヶ月しかない」と警告している。また、財務長官Scott BessentとFRB議長Jerome Powellは、Mythosやその他のAIから生じるサイバーセキュリティリスクについて、主要銀行CEOとの非公開会議を開催するなど、政府レベルでの対応も進んでいる。
AITAKE編集部の見方
Claude Mythosの能力と制限的な公開方針は、AIの発達がサイバーセキュリティ分野に与える深刻な影響を物語っている。特に注目すべきは、Anthropicが危険なサイバーセキュリティ行動のためにMythosを訓練していないにもかかわらず、この能力が自然に発現した点だ。これはAIの能力向上が予測困難であることを示している。 Project Glasswingは防御側に一時的な優位性をもたらす可能性があるが、根本的な問題は残る。AIによる攻撃能力の民主化が進むと、高度なサイバー攻撃が低コストで実行可能になる。日本企業も、従来のセキュリティ対策の見直しとAI時代に適応した防御戦略の構築が急務となるだろう。
Source: Anthropic