新AIモデルClaude Fable 5の一般提供

この記事で分かること
新AIモデルClaude Fable 5の一般提供
Claude Fable 5の特徴は何か
危険なプロンプトかどのように判断するのか
なぜ一般公開したのか

この記事で分かること

1. Claude Fable 5 の特徴

数日規模の複雑な課題を単独で処理する「長期自律実行力」と、一発でアプリを構築できる圧倒的なコード生成力を持つ初の一般向けモデルです。高度な視覚解析（ビジョン）や自己検証能力も備えています。

2. 危険なプロンプトの判断方法

セキュリティ専用の自動分類器が、サイバー攻撃や兵器製造などの悪意ある意図を瞬時に点数化します。リスクを検知したグレーな要求は、出力を即座に遮断するか、安全な旧モデル「Opus 4.8」へ自動迂回させます。

3. なぜ一般公開したのか

「動的フォールバック」等の防御策が完成し、悪用を防ぎつつ開放できると判断したためです。他社との開発競争が激化する中、防御側のエンジニアに強力な武器を届け、社会全体の利便性を高める狙いがあります。

新AIモデルClaude Fable 5の一般提供

　Anthropic社は2026年6月9日、従来の最上位モデル（Opusシリーズ）を凌駕する圧倒的な性能を持つ「ミュトス（Mythos）級」の新しいAIモデル「Claude Fable 5」の一般提供を開始しました。

　凄まじい破壊力を持つ高性能AIを一般に開放する一方で、「サイバー攻撃などの悪用指示を徹底的に拒否する」強力な安全対策（ガードレール）が組み込まれている点が大きな特徴となっています。

Claude Fable 5の特徴は何か

　米Anthropic社が一般公開した「Claude Fable 5」は、最難関のナレッジワークやコーディング問題を解くために設計された、初の一般向け「ミュトス（Mythos）級」フロンティアモデルです。

　従来のClaude Opus 4.8を大きく上回る知能を持ち、その最大の特徴は「人間がつきっきりで指示を出さなくても、AIが自分で考えて数時間〜数日規模のタスクを完結できる自律性」にあります。

　具体的な主要特徴は以下の5点に集約されます。

1. 長期自律実行（Long-horizon Autonomy）

　これまでのAIのように「1往復の指示で終わる」のではなく、複雑で曖昧な目標に対して自ら計画を立て、進捗を検証し、必要に応じて修正しながら非同期で実行を続けることができます。

自己検証・自己改善： タスクの途中でノートを取り（メモ機能）、過去のプロセスを参照しながら自律的にスキルをアップデートします。
エージェントの統率： 複数のサブエージェント（子AI）を並列で走らせ、それらと連携しながら大規模なプロジェクトを回す能力が飛躍的に向上しました。

2. 異次元のコーディング・ゲーム生成能力

　開発者向けベンチマークで圧倒的なスコアを叩き出しており、単一のプロンプト（短い指示）から「3Dレンダリングを含むブラウザゲーム」を丸ごと一本一発でビルドできるほどのコード生成力を持ちます。

SWE-Bench-Pro： 競合他社の最新モデルを大きく引き離す80.3%を記録。
デバッグ・リポジトリ解析： セキュリティ領域を除くコードベースのバグ発見において、リポジトリの履歴まで遡って高精度に検出します。

3. 高度なマルチモーダル・ビジョン（視覚解析）

　PDFやドキュメント内に埋め込まれた、極めて高密度なグラフ、チャート、回路図、複雑な表（テーブル）の意図を正確に読み解きます。

金融分析、法務、建築、データアナリティクスなど、これまで人間が目視で確認していた書類業務を自動化できます。
画像が反転していたり、ぼやけていたり、ノイズがある場合でも、AI自身が「bash」や「crop（切り抜き）」ツールを使って画像を補正して認識する訓練を受けています。

4. 動的フォールバック（Opus 4.8への迂回）による安全対策

　「ミュトス級」のパワーが悪用されるのを防ぐため、強力な安全分類器（セーフティ・クラシファイア）が常時作動しています。

サイバー攻撃（マルウェアやエクスプロイトの作成）、生物・化学兵器、医療リスクに絡む危険なプロンプトを検知すると、自動的に手前の段階で出力を遮断します。
完全に拒絶するだけでなく、セッション全体の約5%とされる危険な要求に対しては、自動的に一段マイルドな旧モデル「Claude Opus 4.8」へ処理を裏側でルーティング（迂回）させる仕組みを導入しています。これにより、一般的な開発業務を阻害せずに高い安全性を担保しています。

5. 巨大なコンテキスト窓と仕様

　長時間の自律運用を支えるため、基本仕様も大幅に強化されています。

項目	仕様スペック
デフォルト・コンテキスト窓	100万（1M）トークン
最大出力トークン	1回あたり最大12.8万（128k）トークン
インプット料金	$10 / 100万トークン（Opus 4.8の約2倍）
アウトプット料金	$50 / 100万トークン（Opus 4.8の約2倍）
データ保管ポリシー	悪用パターン検出のため30日間のトラフィック保持が必須（ゼロデータリテンションは適用不可）

ベンチマーク比較（エンジニアリング能力）

　複雑な開発タスクへの適応力を示す「SWE-Bench-Pro」のスコアでは、他社の追随を許さない性能を見せています。

AIモデル	SWE-Bench-Pro スコア
Claude Fable 5	80.3%
OpenAI GPT-5.5	58.6%
Google DeepMind Gemini 3.1 Pro	54.2%

　危険なサイバー攻撃コードの作成やバイオ実験プロセスのシミュレーションなど、制限領域のタスクを「制限なし」で実行できる生の状態のモデルは「Claude Mythos 5」と呼ばれ、こちらは一般には解放されず、政府機関や特定の防衛パートナー（Project Glasswing）にのみ限定提供されています。

Claude Fable 5は、数日規模のタスクを単独でこなす「長期自律実行力」と圧倒的なコード生成力を持つ初の一般向けミュトス級AIです。悪用検知時に安全な旧モデルへ迂回する動的フォールバック等、強力な防衛策を備えています。

危険なプロンプトかどのように判断するのか

　Claude Fable 5がプロンプトの危険性を判断する仕組みは、主に「多層防御システム」と「AI憲法（Constitutional AI）」の組み合わせに基づいています。具体的には、以下の3つのステップで瞬時に判断と処理を行っています。

1. リアルタイムのセーフティ・クラシファイア（自動分類器）

　ユーザーからプロンプトが入力された瞬間、メインのAIが読み込む前に、セキュリティ専用に訓練された高速・高精度の小型AI（分類器）が割り込みます。

　ここで、テキストに含まれる「意図」や「キーワード」を解析し、以下の有害カテゴリに該当するかを点数化（スコアリング）します。

サイバー攻撃： ゼロデイ脆弱性の悪用コード、マルウェア作成の指示
生物・化学兵器： 危険な化合物の合成手順、ウイルスの培養方法
インフラ破壊： 電力網や通信網への攻撃シミュレーション

2. 「AI憲法（Constitutional AI）」による内省

　Anthropic社独自のアプローチとして、AI自身に「守るべき憲法（原則）」を学習させています。上記の分類器でグレーゾーン（危険か判断が難しいライン）と判定された場合、Fable 5はメインの処理に入る前に「この指示に従うことは、人類の安全を脅かさないか？」「悪用されるリスクはないか？」を自律的に内省し、原則に反すると判断した場合は出力を拒否します。

3. 動的判定と「Opus 4.8」へのフォールバック

　判断の結果、危険度が高いとみなされたプロンプトに対しては、システムが自動で処理のルートを切り替えます。

明らかに黒（アウト）： 出力を即座に遮断し、「倫理的・安全上の観点から実行できない」と通知（良心的拒否）。
グレー（判断が微妙、または悪用のリスクがある高難度タスク）： 「Fable 5」での実行をストップし、裏側で自動的に一段マイルドで制限の強い旧モデル「Claude Opus 4.8」へ処理を迂回（フォールバック）させます。これにより、一般的な開発者が行う通常のデバッグ作業などを誤って完全に拒絶してしまう「過剰拒否」を防いでいます。

　このように、「専用AIによる瞬時の足切り」と「AI自身の倫理的な内省（憲法）」、そして「安全な旧モデルへの自動迂回」を組み合わせることで、高度な知能の悪用を未然に防いでいます。

セキュリティ専用の小型AI（分類器）が、サイバー攻撃や兵器製造などの悪意ある意図を瞬時に点数化します。判断が難しいグレーな要求は、AIが自身の倫理原則（AI憲法）で内省し、安全な旧モデルへ自動で迂回させます。

なぜ一般公開したのか

　米Anthropic社が、これほど危険で強力な「ミュトス級」AIをあえて一般公開（Fable 5としてリリース）した理由は、主に次の3点にあります。

1. 「知能の高さ」と「悪用ブロック」の両立に成功したため

　最大の理由は、同社の安全技術（アラインメント）が大きく進歩したことです。

　これまでは「強力すぎるAIは悪用される」として公開を控えていましたが、危険なプロンプトを検知して旧モデルへ迂回させる「動的フォールバック」や、高度な安全分類器の精度が完成域に達しました。「これなら一般に開放しても、安全にコントロールできる」と判断したためです。

2. 善意のエンジニアや研究者に「防衛の武器」を持たせるため

　サイバーセキュリティの領域では、悪意あるハッカーだけでなく、防御側（ホワイトハッカーや開発者）も強力なAIを使えなければ対抗できないという現実があります。

　バグの修正、システムの堅牢化、科学研究などのスピードを劇的に加速させるため、社会全体の利益（ベネフィット）がリスクを上回ると判断されました。

3. 激化するAI開発競争（対OpenAIなど）への対抗

　商業的な戦略も大きく絡んでいます。OpenAI社やGoogle社が次世代の超高性能モデルの投入・一般公開を進める中、Anthropicとしても「最も安全で、かつ最強の自律AI」のポジションを確立し、市場のシェアやエンタープライズ（企業）契約を勝ち取る必要があったためです。

　「安全に公開できるだけの防御技術が整った」という自信を背景に、「防衛・開発の現場に最強の武器を届けたい」という大義名分と、「他社に遅れを取れない」というビジネス上の競争原理が働いた結果といえます。

「動的フォールバック」等の安全対策の完成により、悪用を防ぎつつ一般開放できると判断したためです。他社との開発競争が激化する中、防御側のエンジニアに強力な武器を届け、社会全体の利便性を高める狙いがあります。