Anthropic「Claude Mythos」が意図せず流出—最強AIモデルの深刻なセキュリティリスク
AI企業Anthropicの設定ミスにより、史上最も強力なAIモデル「Claude Mythos」の詳細が流出。同社は「サイバーセキュリティにおいて前例のないリスク」を警告している。

史上最強AIモデルの意図しない公開
Anthropicの内部文書が、同社が開発した「Claude Mythos」と呼ばれるAIモデルについて、「これまでに開発した中で最も強力なAIモデル」として説明していることが、公開可能な検索データストアに意図せず保存されていた草稿ブログ記事により判明した。同社の広報担当者は、このモデルを「ステップチェンジ」であり「これまでに構築した中で最も有能」であると確認した。 この流出は、Anthropicのコンテンツ管理システムの設定エラーにより、約3,000の未公開資産が公開アクセス可能になったことが原因で、LayerX SecurityのRoy Pazとケンブリッジ大学のAlexandre Pauwelsが発見し、FortuneがAnthropicに木曜日に通知した後、同社はアクセスを制限した。
「Capybara」ティアの導入と高度な能力
文書によると、「Capybara」は新しいモデルティアの名称で、これまで最も強力だったOpusモデルよりもさらに大型で知能的だが、より高価なものとされている。以前の最高モデルであるClaude Opus 4.6と比較して、Capybaraはソフトウェアコーディング、学術的推論、サイバーセキュリティなどのテストで劇的に高いスコアを獲得している。 Anthropicの広報担当者は「推論、コーディング、サイバーセキュリティにおいて意味のある進歩を遂げた汎用モデルを開発している」とし、「その能力の強さを考慮して、リリース方法について慎重に検討している」と述べた。
POINT
Mythosは「サイバー能力において現在他のAIモデルを大きく上回っており、防御者の努力をはるかに上回る方法で脆弱性を悪用できるモデルの波を予兆している」とAnthropic自身が警告
市場への即座の影響とセキュリティ懸念
この流出が報じられた後、複数のサイバーセキュリティ企業の株価が下落し、Palo Alto Networks(PANW)が約7%、CrowdStrike(CRWD)が約6.4%下落し、Zscaler(ZS)は約5.8%、Fortinet(FTNT)は約4%下落した。Stifelのアナリスト、Adam Borgは「通常のハッカーを国家レベルの敵対者に押し上げる可能性のある究極のハッキングツールになる可能性がある」と述べた。 Anthropicは草稿の中で「Claude Mythosのリリース準備において、私たちは特別な注意を払い、自社のテストで学ぶこと以上にリスクを理解したい」とし、特に短期的なサイバーセキュリティリスクの評価に焦点を当てていると述べた。
AITAKE編集部の見方
今回の流出事件は、AI企業が直面する新たなジレンマを浮き彫りにしている。最も皮肉なのは、「前例のないサイバーセキュリティリスク」を警告するモデルの詳細が、同社自身のセキュリティ設定ミスにより公開されたことだ。これは、AIの急速な進歩が企業の情報管理能力を上回っている現実を示している。 Claude Mythosの登場は、AI業界における新たな転換点となる可能性が高い。サイバーセキュリティ分野における能力の飛躍的向上は、防御側と攻撃側の軍拡競争を加速させる恐れがある。Anthropicが慎重な段階的リリースを計画していることは賢明だが、このような強力なツールが悪意のある行為者の手に渡った場合の影響は計り知れない。日本企業も、AI主導のサイバー攻撃に対する防御体制の強化を急ぐ必要があるだろう。
Source: Fortune