ベンチマーク	Mythos	Opus 4.6	向上幅
SWE-bench Verified（実世界バグ修正）	93.9%	80.8%	+13.1pt
SWE-bench Pro	77.8%	53.4%	+24.4pt
Cybench（サイバーCTF）	100%	大幅下回る	劇的向上
GPQA Diamond（PhDレベル推論）	94.6%	91.3%	+3.3pt
Terminal-Bench 2.0	82.0%	65.4%	+16.6pt

Claude Mythos Preview

3. サイバーセキュリティ能力（核心）
詳細展開版

Anthropic Frontier Red Team報告・System Cardに基づく（2026年4月時点）

全体像：なぜ「核心」なのか

Mythos Previewのサイバー能力は、従来モデル（Opus 4.6など）と比べて「段階的飛躍（step-change）」と表現されるレベルに到達しています。

特に重要なのは、ゼロデイ脆弱性の自律的発見 + 実用的なエクスプロイトコードの自動生成を、ほとんど人間の介入なしで実現している点です。これにより、防御用途だけでなく攻撃用途としても極めて危険なdual-use（両用）モデルとなっています。

                Anthropicの評価：Mythosは「すべての主要OSと主要ブラウザ」において、未知の脆弱性を発見し、エクスプロイト化できる能力を持つ。数週間で数千件のゼロデイを発見。
            

ベンチマークでの劇的な向上

ベンチマーク	Mythos Preview	Opus 4.6	意味
Cybench（CTF課題）	100% pass@1	大幅に下回る	全課題を初回で解決。ベンチマークがほぼ意味をなさなくなったレベル
CyberGym（実ソフトウェア脆弱性再現）	83.1%	66.6%	実世界の脆弱性を83%以上の確率で再現・活用
Firefox 147 JSエンジンエクスプロイト成功回数	181回（+レジスタ制御29回）	わずか2回	約90倍の改善。実用的なブラウザエクスプロイトを大量生成

これらのスコアは、agentic harness（コード実行環境付きの自律エージェント設定）で測定されたものです。

具体的なゼロデイ発見事例

OpenBSD：27年前から存在した未知の脆弱性（長年セキュリティ強化で知られるOS）
FFmpeg：16年前のH.264デコーダー関連の重大脆弱性
FreeBSD NFSサーバー：CVE-2026-4747（17年前の脆弱性）。認証なしでリモートからroot権限取得可能なRemote Code Execution（RCE）
Linuxカーネル、Windows、macOSなど主要OS全般で同様の古い・新しい脆弱性を大量発見
主要ブラウザ（Firefoxなど）でも複数

特徴：これらの多くは、人間や従来の自動ツールが何年・何十年も見逃してきたもので、Mythosは初期プロンプト1つで「リモートコード実行の脆弱性を探せ」と指示するだけで自律的に発見・検証します。

エクスプロイト開発能力の詳細

高度なテクニックの自律的使用

JIT heap spray：ブラウザのJust-In-Timeコンパイラを悪用したメモリレイアウト操作。rendererサンドボックスとOSサンドボックス両方を突破する複雑な実装を自動生成
ROPチェーン（Return-Oriented Programming）：FreeBSD NFSエクスプロイトでは20-gadget ROPチェーンを構築し、複数のネットワークパケットに分割して送信（検知を回避）
KASLR（Kernel Address Space Layout Randomization）バイパス、race condition（競合状態）の悪用、HARDENED_USERCOPYなどの現代的防御の突破
複数脆弱性のチェイニング：例として、ブラウザで4つの独立した脆弱性を組み合わせ、サンドボックス完全脱出を実現

典型的な動作フロー（agentic harness内）
1. ソースコード全体を解析
2. 仮説立案（脆弱性の可能性を複数検討）
3. 検証コード生成・実行
4. PoC（Proof of Concept）エクスプロイトの自動作成
5. 必要に応じてさらに高度化（チェイニング）

動作形態と自律性

Mythosはagentic setupで動作します。ファイル読み込み、コード実行、反復デバッグを自律的に繰り返すため、人間が「脆弱性を探せ」と一言指示するだけで、数時間〜一晩で完全なワーキングエクスプロイトが完成します。

Anthropicのエンジニア（セキュリティ専門外の人でも）がテストした結果、朝起きたら「動作するエクスプロイト」ができあがっていた事例が複数報告されています。

重要警告：
この能力は一般公開されておらず、Project Glasswingという防御特化プログラムで、Microsoft・Apple・Google・CrowdStrikeなどの限定パートナーにのみ提供されています。
目的は「攻撃される前に脆弱性を発見・修正」することですが、同時に国家レベルの攻撃ツールとしても機能し得るため、米ホワイトハウスなどが日本を含む海外展開に慎重な姿勢を取っています。

防御 vs 攻撃の二面性

Mythosの能力は「一般的なコーディング能力の向上」の副産物として現れたものです。Anthropicはこれを防御目的（脆弱性発見・パッチ支援）に限定利用する方針ですが、悪用されれば：

AI主導の大規模ゼロデイ攻撃の自動化
攻撃窓口（exploit window）の劇的短縮（数週間→数時間）
サンドボックス突破や特権昇格の民主化（専門家でなくても利用可能に）

Claude Mythos Preview

1. 概要と位置づけ

2. 主要ベンチマーク比較

3. サイバーセキュリティ能力（核心）

ゼロデイ脆弱性発見能力

エクスプロイト作成能力

4. 動作形態と制限

5. 安全性評価

Claude Mythos Preview

全体像：なぜ「核心」なのか

ベンチマークでの劇的な向上

具体的なゼロデイ発見事例

エクスプロイト開発能力の詳細

高度なテクニックの自律的使用

動作形態と自律性

防御 vs 攻撃の二面性