Anthropic「Claude Mythos」データ流出で判明した史上最強AIモデル
内部データ約3,000ファイルが露出し、コードネーム「カピバラ」の詳細が明らかに。サイバーセキュリティ分野で「前例のないリスク」を持つ最強モデルとして開発中。

史上最強AIモデル「Mythos」の詳細が流出
3月末、Anthropicの内部データストアのセキュリティ設定ミスにより、約3,000件の未公開ファイルが意図せず公開状態となった。流出した社内文書には「これまでに開発した中で最も強力なAIモデル」と記載されたClaude Mythosの詳細が含まれており、同社は「ステップチェンジ」と表現する革新的な性能向上を実現したと記されている。 社内では「Capybara(カピバラ)」のコードネームで呼ばれるこのモデルは、既存のOpusモデルを上回る新たな階層として位置づけられている。Anthropicの広報担当者は「推論、コーディング、サイバーセキュリティにおいて意義深い進歩を遂げた汎用モデル」と説明している。
「前例のないサイバーセキュリティリスク」への警戒
流出した草稿ブログ記事では、Mythosが「前例のないサイバーセキュリティリスク」を持つと明記されている。従来の最上位モデルClaude Opus 4.6と比較して、ソフトウェアコーディング、学術的推論、サイバーセキュリティテストで劇的に高いスコアを記録している。 Mythosプレビュー版は、これまで検出困難だった重要なバグを発見する能力があり、同社は数千件の高危険度・重要度の脆弱性を特定したと報告している。特筆すべきは、16年間未発見だったFFmpegの脆弱性を発見したことで、自動テストツールが500万回も見逃していた問題を見つけ出した。
POINT
Mythosは一般公開されず、「Project Glasswing」として12の主要パートナー企業とさらに40の組織に限定提供され、防御的サイバーセキュリティ業務に活用される
限定展開と政府機関との協議
Anthropicは悪用防止のため、Mythosへのアクセスを厳格に制限しており、一般公開の予定はない。Amazon、Apple、Microsoft、Cisco、CrowdStrikeなどの主要企業が防御的セキュリティ作業のためにアクセス権を得ている。 同社は米国政府機関、特にサイバーセキュリティ・インフラセキュリティ庁(CISA)やAI標準・革新センターと継続的な協議を行っている。Project Glasswingには最大1億ドルの利用クレジットを提供し、400万ドルをオープンソースセキュリティ組織に寄付する。
AITAKE編集部の見方
今回のデータ流出は、AIの急激な能力向上とセキュリティ管理の複雑さを浮き彫りにした。皮肉にも、サイバーセキュリティリスクを警告するモデルの情報が、セキュリティ不備により流出したのは象徴的だ。 Mythosの限定展開戦略は賢明だが、悪意のある開発者による類似技術の開発は防げない。今後は防御技術の向上と国際的なAI安全基準の策定が急務となる。日本企業もサイバーセキュリティ対策の抜本的見直しが必要な転換点を迎えている。
Source: Fortune