Anthropic、Claude Mythosモデルのアクセスを制限
10兆パラメータのAI最強モデルがサイバーセキュリティリスクにより50組織のみに限定公開。SWE-benchで93.9%のスコアを記録。

史上最強のAIモデルが制限公開
Anthropic社は4月7日、史上最も強力なAIモデル「Claude Mythos Preview」を発表したが、一般公開ではなく、Project Glasswingという限定プログラムの下で50組織のみにアクセスを制限した。同モデルは推定10兆パラメータという巨大な規模を誇り、同社がこれまで開発した中で最も強力なAIモデルとされている。 Claude Mythos PreviewはSWE-bench Verifiedで93.9%、GPQA Diamondで94.6%という驚異的なスコアを記録し、あらゆる主要OSとブラウザで数千のゼロデイ脆弱性を自動発見する能力を示した。テストでは、すべての主要OSとWebブラウザでバグを発見し、27年前から存在していたOpenBSDの脆弱性も発見している。
Project Glasswingによる防御的利用
Project GlasswingにはAmazon、Apple、Google、Microsoft、Nvidiaなどの大手技術企業12社と、約40の重要ソフトウェアインフラ組織が参加している。Anthropic社はプログラム参加企業に最大1億ドルの利用クレジットを提供し、オープンソースセキュリティ組織には400万ドルを直接寄付している。 このモデルの能力は防御には強力だが、広くアクセス可能になれば攻撃にも危険なため、Anthropic社は防御的サイバーセキュリティに特化した少数のパートナーのみにアクセスを制限している。同社は「Claude Mythos Previewのサイバーセキュリティ能力のため、一般提供の計画はない」と明言している。
POINT
Claude Mythos Previewは83.1%の確率で脆弱性を再現し、エクスプロイトの概念実証を初回試行で作成できる能力を持つ。すべての主要OSとWebブラウザでゼロデイ脆弱性を特定・悪用することが可能。
技術的性能と制約
Claude MythosはNvidiaの最新Blackwellハードウェアで訓練された10兆パラメータのモデルで、新たな「Capybara」ティアに位置している。価格は入力トークン100万あたり25ドル、出力トークン100万あたり125ドルと、Claude Opus 4.6の5倍の高額設定となっている。 英国政府のAIセキュリティ研究所による独立テストでは、サイバーセキュリティ能力は従来モデルを上回るものの、強化されたネットワークでの完全自律攻撃は確実に実行できないことが判明した。専門レベルのCTFチャレンジでは73%の成功率を記録している。
AITAKE編集部の見方
Claude Mythosの制限公開は、AI開発において安全性と能力のバランスを取る新たなアプローチを示している。従来は「開発→公開」が一般的だったが、Anthropic社は初めて「能力が高すぎるため制限する」という判断を下した。これは業界全体のターニングポイントとなる可能性がある。 特に注目すべきは、27年間発見されなかった脆弱性を自動発見する能力だ。これは防御側にとって革命的だが、同時に悪用されれば「サイバー大量破壊兵器」にもなりうる。Anthropic社の慎重なアプローチは評価できるが、他の研究機関が同様の制約なしに類似モデルを開発した場合のリスクも考慮する必要がある。日本企業も今後、こうした強力なAIツールとどう向き合うかの戦略策定が急務となるだろう。
Source: RenovateQR