速報2026-04-17

Anthropic、AIモデル「Claude Mythos」を史上初のサイバー脅威で制限

Claude MythosはOSやブラウザから数千のゼロデイ脆弱性を自律的に発見。破壊的なサイバーセキュリティ潜在能力により、史上初めて一般公開が制限されたAIモデル。

by AITAKE 編集部·4 min·

#AI安全性#サイバーセキュリティ#Anthropic

Anthropic、AIモデル「Claude Mythos」を史上初のサイバー脅威で制限

史上初の制限措置

AnthropicのClaude Mythosは、破壊的なサイバーセキュリティ潜在能力により、史上初めて一般ユーザーからの制限を受けたAIモデルとなった。同社は4月7日のプレスリリースで、Mythosは「文字通り強力すぎてリリースできない」と発表した。 Anthropicのエンジニアからの指示なしに、Mythosは独立して「次世代」のサイバー攻撃能力を開発し、これまで侵入不可能とされていた世界中のソフトウェアインフラに侵入し、その隠された弱点を発見することができる。同社の検証では、数千のゼロデイ脆弱性が発見され、その99%が4月7日のプレスリリース時点で未対策のままであった。

Project Glasswingによる限定提供

Anthropicは、歴史上最も高度なAIモデルであるMythosを一般リリースする代わりに、Claude Mythos Previewと呼ばれるバリアントを使用して、ゼロデイ脆弱性を大規模に事前特定・防御する限定的な商業コンソーシアムを創設した。このProject Glasswingイニシアチブには、Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksがローンチパートナーとして参加している。さらに40以上の重要なソフトウェアインフラを構築・保守する組織にもアクセスが提供されている。

POINT

Mythosは500万回のテストでも検出されなかったコードの欠陥を発見し、27年前のOpenBSDの脆弱性や16年前のFFmpegの脆弱性など、長期間未発見だった脆弱性を特定

AI脅威の新時代

これまでゼロデイソフトウェア脆弱性の特定能力は、高度に専門化された知識豊富なサイバーセキュリティ専門家やハッカーのみに限られていた。しかし、それはもはや過去のことだ。「正式なセキュリティトレーニングを受けていない」Anthropicのエンジニアが、Mythosに「リモートコード実行脆弱性を一晩で見つけて」と依頼することができる。「脆弱性が発見されてから敵対者によって悪用されるまでの期間は短縮されており、かつては数ヶ月かかったものがAIによって数分で行われるようになった。Claude Mythos Previewは大規模な防御者にとって現在可能なことを実証しており、敵対者は同じ能力を悪用しようと必然的に模索するだろう」との警告が専門家から出されている。

AITAKE編集部の見方

Claude Mythosの制限措置は、AI開発における新たなターニングポイントを示している。これまでAI企業は性能向上を追求してきたが、初めて「強力すぎる」という理由で一般公開を見送ったケースである。 Project Glasswingの50組織限定アプローチは賢明だが、この技術が最終的に広く普及することは避けられない。日本企業も早急にAI駆動型のサイバーセキュリティ対策を強化し、従来の「人間主導」から「AI主導」の防御戦略への転換を検討すべき時期に来ている。サイバーセキュリティの軍拡競争が、人間レベルを超越したAI同士の戦いへと発展する可能性が現実となりつつある。

Source: Council on Foreign Relations

X Hatena LINE