Claude Fable 5、拒否理由とフォールバック動作の見え方を明確化

2026.06.11 モデル Anthropic

AnthropicはClaude Fable 5の安全機構について、ユーザーや開発者に見える情報を増やした。安全分類器により処理できないリクエストでは、Claude CodeでOpus 4.8へのフォールバック通知を表示し、APIでは拒否理由を返す。

Claude Fable 5では、リクエスト時と応答生成中に安全分類器が動く。Messages APIでは拒否時のstop_reasonとしてrefusalが返り、Claude Fable 5ではstop_details.categoryにreasoning_extractionが入る場合もある。reasoning_extractionは、モデルの出力や内部推論を複製・逆解析しようとする使い方を制限するカテゴリだ。

強いモデルを一般提供するほど、安全制約がいつ働いたのかを利用者が理解できることは重要になる。今回の更新は、単に拒否するだけでなく、Claude CodeとAPIの両方で挙動を説明し、フィードバックで分類器を調整する方向を示している。

RELATED LINKS