Anthropic「Mythos」史上最強AI、データ流出で発覚
コンテンツ管理システムのミスでClaude Mythosが偶然露見。同社は「ステップチェンジ」級の能力向上と「前例のないサイバーセキュリティリスク」を認める。

データ流出で露見した最強AIモデル
3月26日、Anthropicのコンテンツ管理システムのミスにより、未発表の新AIモデル「Claude Mythos」の存在がデータ流出により発覚した。この流出により、約3,000の未公開アセットが一般公開され、Fortune誌がセキュリティ研究者と共に内部文書を確認後、同社に通知した。流出した草稿ブログポストでは、Mythosを「これまで開発したAIモデルの中で群を抜いて最も強力なモデル」と記述している。 Anthropicの広報担当者は、新モデルがAIパフォーマンスにおいて「ステップチェンジ」を表し、「これまで構築した中で最も高性能なモデル」であると語った。同社は推論、コーディング、サイバーセキュリティにおいて意義深い進歩を持つ汎用モデルを開発していると説明している。
新ティア「Capybara」の登場
流出した文書では、AnthropicがOpusモデルの上位に位置する新たなティア「Capybara」を導入予定であることが判明した。Capybaraは、従来最高性能だったOpusよりもさらに大型で高性能だが、コストも大幅に高くなると記述されている。前モデルのClaude Opus 4.6と比較して、ソフトウェアコーディング、学術的推論、サイバーセキュリティなどのテストで劇的に高いスコアを記録したとされる。 現在、同社は少数の早期アクセス顧客とモデルをテストしており、慎重なロールアウト戦略を計画している。モデルの実行コストが非常に高く、一般リリースに向けて大幅な効率化が必要だと草稿ブログでは言及されている。
POINT
流出した内部文書によると、Claude Mythosは「前例のないサイバーセキュリティリスク」を抱えており、Anthropicは特に慎重にリリースを進める方針を取っている。
サイバーセキュリティへの深刻な脅威
流出した内部文書は、モデルがソフトウェアの脆弱性を迅速に発見・悪用することで、サイバーセキュリティリスクを大幅に高め、サイバー軍拡競争を加速させる可能性があると警告している。内部文書では、Mythosが「サイバー能力において他のAIモデルを大きく上回り」、「防御者の努力を大幅に上回るスピードで脆弱性を悪用できるモデルの波を予兆している」との記述もある。 Anthropicは「Claude Mythosのリリースに向けて特別な注意を払い、自社テストを超えたリスクを理解したい」と述べ、特にサイバーセキュリティの近距離リスクの評価に焦点を当てている。同社はまず企業のセキュリティチームにMythosを展開し、少数の早期アクセス顧客とサイバーセキュリティ能力をテストしている。
AITAKE編集部の見方
今回のClaude Mythosの流出は、AI開発における透明性と安全性のバランスという根本的な課題を浮き彫りにしている。Anthropicが「責任あるAI」を掲げながらも、自社のセキュリティ管理で重大なミスを犯したことは皮肉といえる。しかし、同社がモデルのサイバーセキュリティリスクを公然と認め、段階的なリリース戦略を取る姿勢は評価できる。 サイバーセキュリティ株が下落し、市場に動揺が広がったことからも、この技術がもたらすインパクトの大きさがうかがえる。AI技術の進歩が防御側を上回るスピードで進む現状では、企業や政府機関はAI駆動のサイバー脅威に対する準備を急ぐ必要がある。Mythosの正式リリース時期は不明だが、AIの「ステップチェンジ」が現実となる日は確実に近づいている。
Source: Fortune