Anthropic、最上位AI「Claude Fable 5」発表。“ミュトス級”モデルを初めて一般公開

米Anthropicは6月9日（現地時間）、新たな大規模言語モデル（LLM）「Claude Fable 5」と「Claude Mythos 5」を発表した。Claude Fable 5は一般ユーザー向けに提供される最上位モデルで、これまで限定公開されてきた“ミュトス級（Mythosクラス）”の能力を初めて広く開放する。一方のClaude Mythos 5は、サイバー防衛や生命科学研究など特定分野の信頼された組織向けに提供される。

Anthropicのモデル体系では、Haiku、Sonnet、Opusに続く新たな最上位クラスとしてFableとMythosが位置付けられる。従来のフラッグシップモデルだったOpusクラスを上回る性能を持つとされ、同社は「これまで一般提供してきたどのモデルよりも高性能」と説明している。

今回発表されたFable 5とMythos 5は同じ基盤モデルを採用しており、性能面の差はない。違いは安全機能の有無で、Fable 5には一般公開に向けた保護機能が組み込まれている一方、Mythos 5は一部の保護機能を解除した構成となる。

背景には、2026年4月に発表された「Claude Mythos Preview」の存在がある。同モデルは高度なサイバーセキュリティ能力を備え、脆弱性発見や攻撃手法の分析などで高い能力を示した一方、悪用された場合のリスクも大きいと判断され、政府機関や重要インフラ事業者、セキュリティ研究者など限られた組織にのみ提供されていた。

Anthropicはその後数カ月にわたり安全対策を強化。高リスクな用途を検知して制御する仕組みを整備したことで、Mythos級モデルの一般提供に踏み切った。

Fable 5には独立した分類システムが組み込まれており、サイバーセキュリティ、生物・化学、モデル蒸留（ディスティレーション）に関するリクエストを検知すると、応答を「Claude Opus 4.8」へ自動的に切り替える。ユーザーには切り替えが通知される。

さらにAnthropicは、フロンティアLLM開発を支援する用途にも独自の制限を設けている。この場合はユーザーへの通知やモデル切り替えは行われず、プロンプトの修正や応答内容の調整によって能力を制限する仕組みを採用した。同社によると、この制限の影響を受けるのは全体トラフィックの約0.03％、利用組織ベースでは0.1％未満という。

保護機能は比較的保守的に設定されているが、Anthropicによればフォールバックが発生するのはセッション全体の5％未満で、95％以上の利用ではFable 5本来の性能が利用できるとしている。

名称にも両モデルの関係性が反映されている。「Fable」はラテン語の「fabula（語られるもの）」に由来し、「Mythos」はギリシャ語で神話を意味する。同社は意味の近い言葉を用いることで、同じ基盤モデルであることを示したとしている。

Fable 5は同日から提供を開始した。APIおよび従量課金型Enterpriseプランでは全面提供されるほか、Amazon Bedrock、Microsoft Foundry、GitHub Copilotなどでも利用できる。

Claudeの無料プランを含む各プランでも利用可能だが、Pro、Max、Team、シート課金型Enterpriseプランでは6月22日まで追加費用なしで提供し、6月23日以降は利用クレジット制へ移行する予定。需要予測が難しいことから段階的な展開を採用しており、十分な提供能力を確保できれば標準機能として組み込む方針を示している。

APIでのモデル名は「claude-fable-5」。料金は入力100万トークン当たり10ドル、出力100万トークン当たり50ドルに設定された。

ソフトウェア開発から科学研究まで最高水準の性能をうたう

Anthropicによると、Fable 5とMythos 5はソフトウェア開発、知識労働、画像認識、科学研究など幅広い分野で最先端水準の性能を達成したという。

ソフトウェア開発分野では、コーディング評価指標「SWE-Bench Pro」で80.3％を記録。決済サービス企業Stripeによる初期評価では、5000万行規模のRubyコードベース移行作業を1日で完了したという。人手であればチーム全体で2カ月以上を要すると見積もられていた作業だった。

複雑な知識労働でも性能向上が見られ、文書を横断した推論や図表の解釈、問題解決能力が改善したとしている。

画像認識能力も大きく向上した。Anthropicはデモとして、『ポケットモンスターファイアレッド』をゲーム画面のスクリーンショットのみを入力情報として最初から最後までクリアした事例を公開した。マップ情報やナビゲーション補助、ゲーム内部の状態データなどは与えていないという。

さらに科学図表から数値を抽出したり、スクリーンショットのみからWebアプリのソースコードを再構築したりすることも可能としている。

長時間の自律的な作業も強みとして挙げられている。Anthropicは、数日間にわたる研究作業や複雑なプロジェクトにおいて従来モデルとの差が広がるとしている。

科学研究分野では、Mythos 5を活用した事例として、138種の動物にわたる単一細胞データの組み立てや独自機械学習モデルの設計を紹介。生命科学分野ではタンパク質設計や創薬候補探索などでも成果を挙げたという。

Mythos 5は当面、サイバー防衛プログラム「Project Glasswing」の参加組織向けに提供される。同プログラムには約200の組織が参加しており、Anthropicは米政府と連携しながら「信頼アクセスプログラム」を通じて提供先を段階的に拡大する計画だ。

また、生物・化学分野の制限を解除したMythosクラスモデルを生命科学研究者向けに提供する枠組みも用意する。創薬や新たな治療法の研究加速につなげたい考えだ。

安全性評価では、モデルのアライメントはOpus 4.8とおおむね同等だった一方、自傷・自殺に関する一部の応答や子どもの安全に関する一部領域で改善の余地が確認された。Anthropicは、claude.aiのシステムプロンプト更新によって大半の問題に対応済みとしており、今後の学習にも反映すると説明している。

保護機能の堅牢性については、外部研究者による1000時間超のバグ報奨金プログラムやレッドチーム検証を実施した結果、あらゆる場面で安全機能を無効化できる汎用的なジェイルブレイク手法は確認されなかったという。

なお、保護機能が作動した際の挙動は利用環境によって異なる。Web版やデスクトップ版、モバイルアプリではOpus 4.8への自動フォールバックが行われるが、Messages APIでは標準設定のままでは応答がブロックされる。開発者側で再試行処理やフォールバック機能を実装するか、サーバー側の自動フォールバック機能を有効化する必要がある。

このほかAnthropicは、Mythosクラスおよびそれ以上の性能を持つ将来モデルについて、すべてのトラフィックを30日間保持する新たなポリシーを導入する。収集したデータはモデル学習には利用せず、サイバー攻撃やジェイルブレイクへの対策、安全機能の改善などに活用するとしている。

情報ソース