Claude Mythos Preview

Anthropic 最先端フロンティアモデル 技術的詳細報告書
(2026年4月発表時点)

1. 概要と位置づけ

Mythos(内部コードネーム:Capybara)は、Anthropicが2026年4月7日に限定リリースした史上最強クラスのAIモデルです。

Claude Opus 4.6を大幅に上回る性能を持ち、特にagentic能力(自律的タスク実行)サイバーセキュリティ分野で劇的な進化を遂げています。

最大の特徴:ソフトウェアの未知の脆弱性(ゼロデイ)を大量発見し、実際に動作するエクスプロイトコードを自律的に作成できる点。

2. 主要ベンチマーク比較

ベンチマーク Mythos Opus 4.6 向上幅
SWE-bench Verified(実世界バグ修正) 93.9% 80.8% +13.1pt
SWE-bench Pro 77.8% 53.4% +24.4pt
Cybench(サイバーCTF) 100% 大幅下回る 劇的向上
GPQA Diamond(PhDレベル推論) 94.6% 91.3% +3.3pt
Terminal-Bench 2.0 82.0% 65.4% +16.6pt

3. サイバーセキュリティ能力(核心)

ゼロデイ脆弱性発見能力

エクスプロイト作成能力

注意:この能力は「防御目的での限定利用」のために厳格に管理されています。一般公開は行われておらず、Project Glasswingプログラムでのみ提供されています。

4. 動作形態と制限

5. 安全性評価

AnthropicはMythosを「これまでで最も良くアライメントされたモデル」と評価していますが、dual-use(両用性)が極めて高いため、以下のように厳格管理されています。

Claude Mythos Preview - 3. サイバーセキュリティ能力(詳細展開)

Claude Mythos Preview

3. サイバーセキュリティ能力(核心)
詳細展開版

Anthropic Frontier Red Team報告・System Cardに基づく(2026年4月時点)

全体像:なぜ「核心」なのか

Mythos Previewのサイバー能力は、従来モデル(Opus 4.6など)と比べて「段階的飛躍(step-change)」と表現されるレベルに到達しています。

特に重要なのは、ゼロデイ脆弱性の自律的発見 + 実用的なエクスプロイトコードの自動生成を、ほとんど人間の介入なしで実現している点です。これにより、防御用途だけでなく攻撃用途としても極めて危険なdual-use(両用)モデルとなっています。

Anthropicの評価:Mythosは「すべての主要OSと主要ブラウザ」において、未知の脆弱性を発見し、エクスプロイト化できる能力を持つ。数週間で数千件のゼロデイを発見。

ベンチマークでの劇的な向上

ベンチマーク Mythos Preview Opus 4.6 意味
Cybench(CTF課題) 100% pass@1 大幅に下回る 全課題を初回で解決。ベンチマークがほぼ意味をなさなくなったレベル
CyberGym(実ソフトウェア脆弱性再現) 83.1% 66.6% 実世界の脆弱性を83%以上の確率で再現・活用
Firefox 147 JSエンジン エクスプロイト成功回数 181回(+レジスタ制御29回) わずか2回 約90倍の改善。実用的なブラウザエクスプロイトを大量生成

これらのスコアは、agentic harness(コード実行環境付きの自律エージェント設定)で測定されたものです。

具体的なゼロデイ発見事例

特徴:これらの多くは、人間や従来の自動ツールが何年・何十年も見逃してきたもので、Mythosは初期プロンプト1つで「リモートコード実行の脆弱性を探せ」と指示するだけで自律的に発見・検証します。

エクスプロイト開発能力の詳細

高度なテクニックの自律的使用

典型的な動作フロー(agentic harness内)
1. ソースコード全体を解析
2. 仮説立案(脆弱性の可能性を複数検討)
3. 検証コード生成・実行
4. PoC(Proof of Concept)エクスプロイトの自動作成
5. 必要に応じてさらに高度化(チェイニング)

動作形態と自律性

Mythosはagentic setupで動作します。ファイル読み込み、コード実行、反復デバッグを自律的に繰り返すため、人間が「脆弱性を探せ」と一言指示するだけで、数時間〜一晩で完全なワーキングエクスプロイトが完成します。

Anthropicのエンジニア(セキュリティ専門外の人でも)がテストした結果、朝起きたら「動作するエクスプロイト」ができあがっていた事例が複数報告されています。

重要警告:
この能力は一般公開されておらず、Project Glasswingという防御特化プログラムで、Microsoft・Apple・Google・CrowdStrikeなどの限定パートナーにのみ提供されています。
目的は「攻撃される前に脆弱性を発見・修正」することですが、同時に国家レベルの攻撃ツールとしても機能し得るため、米ホワイトハウスなどが日本を含む海外展開に慎重な姿勢を取っています。

防御 vs 攻撃の二面性

Mythosの能力は「一般的なコーディング能力の向上」の副産物として現れたものです。Anthropicはこれを防御目的(脆弱性発見・パッチ支援)に限定利用する方針ですが、悪用されれば: