Blog

Fable 5 : comment Anthropic a bridé son IA la plus puissante pour le grand public

Claude

Deux modèles, un seul cerveau : Fable 5 et Mythos 5 sont la même IA, séparée uniquement par des garde-fous. Enquête sur le bridage silencieux, le projet Glasswing, la fracture d'accès et ce que tout ça révèle de la stratégie Anthropic.

Le 9 juin 2026, Anthropic a annoncé simultanément deux modèles : Claude Fable 5, disponible pour tous, et Claude Mythos 5, réservé à une poignée d'organisations triées. Ce que l'entreprise a glissé en note de bas de page - les deux sont le même modèle de base - est la chose la plus importante à comprendre pour saisir où va l'IA en 2026.

Le dossier en vidéo

Le décryptage complet en vidéo (12 min) sur la chaîne Blokby.

L'annonce qui change la donne : un seul modèle, deux visages

Le key art officiel de Claude Fable 5

L'annonce du 9 juin 2026 a une structure inhabituelle. Anthropic présente Fable 5 comme "le modèle le plus capable jamais rendu accessible au public", puis mentionne Mythos 5 dans la même note de presse - avec cette phrase : les deux partagent le même modèle sous-jacent, Fable 5 portant des garde-fous supplémentaires.

Today we're launching Claude Fable 5, the most capable model we've ever released to the public. Fable 5 is a Mythos class model with safeguards that make it ready for general use.

~Anthropic, annonce officielle du 9 juin 2026

Ce que cette formulation ne dit pas explicitement : ce que tu reçois avec Fable 5, c'est la même intelligence que Mythos 5, mais avec des zones entières neutralisées. Ce n'est pas un modèle "moins puissant" au sens de l'entraînement - c'est le même cerveau, avec des verrous posés à la couche de déploiement.

La rupture de nomenclature est tout aussi notable. Depuis sa création, Anthropic nommait ses modèles par des formes poétiques : Haiku (la forme la plus courte), Sonnet (registre intermédiaire), Opus (la forme longue et la plus ambitieuse). Fable 5 inaugure une nouvelle logique : "Mythos" n'est plus un descripteur poétique, c'est une classe de capacité. Un bracket, pas un registre.

La hiérarchie Anthropic en juin 2026 : Haiku, Sonnet, Opus restent des registres poétiques. Fable 5 inaugure la classe Mythos.

Ce changement signale une chose sur la roadmap : Anthropic traite désormais le haut de gamme comme une ligne produit distincte, potentiellement capable d'accueillir plusieurs modèles différents dans le même "bracket Mythos". Opus 4.8 reste disponible, mais il n'est plus le sommet - il est le modèle vers lequel Fable 5 redirige les requêtes jugées trop sensibles.

Project Glasswing : le modèle qu'Anthropic avait refusé de libérer

Claude, par Anthropic

Pour comprendre Fable 5, il faut remonter au 7 avril 2026 - deux mois plus tôt. Ce jour-là, Anthropic dévoile Claude Mythos Preview et annonce immédiatement qu'il ne sera pas distribué à ses clients payants.

La raison invoquée : lors des tests internes, Mythos Preview avait trouvé des milliers de vulnérabilités zero-day inconnues dans les principaux systèmes d'exploitation et navigateurs web. Le modèle pouvait enchaîner plusieurs failles individuellement faibles en séquences d'attaque sophistiquées, décrites comme "impractical to construct manually". Anthropic le qualifie de "currently far ahead of any other AI models in cyber capabilities".

Its ability to find and exploit software vulnerabilities autonomously made it too dangerous to release without controlled industry preparation.

Anthropic· Colombia One, avril 2026

Ce refus de libération est sans précédent dans l'industrie IA grand public. Les labos publient généralement leurs modèles et ajustent ensuite. Anthropic fait l'inverse : il retient le modèle, déclare un programme d'accès contrôlé, et donne deux mois pour développer les garde-fous.

Ce programme, c'est Project Glasswing. Environ 50 organisations de cybersécurité défensive y sont intégrées, avec 100 millions de dollars de crédits d'usage et 4 millions de dollars de dons à des groupes open-source. L'objectif déclaré : utiliser Mythos pour trouver et divulguer des vulnérabilités critiques avant que des capacités équivalentes n'atteignent les réseaux criminels.

Parmi les partenaires Glasswing figurent Apple et NVIDIA - confirmés par Engadget. La NSA accède également à Mythos 5 dans le cadre de ce programme, selon Heise Online. Ce contexte a même conduit la Maison-Blanche à revoir sa politique de régulation de l'IA.

Deux mois plus tard, le 9 juin 2026, Fable 5 est la résolution de ce refus : le même modèle, rendu accessible grâce aux garde-fous développés et testés pendant le programme Glasswing.

Le mécanisme de bridage : trois classifieurs, des refus en HTTP 200

Voici comment le bridage fonctionne concrètement. Fable 5 intègre trois classifieurs IA qui surveillent chaque requête en temps réel et décident si elle doit être traitée par Fable 5 ou réacheminée vers Opus 4.8.

Un seul modèle de base, deux chemins de déploiement : Mythos 5 brut pour Glasswing, Fable 5 avec classifieurs pour le public.

Les trois domaines couverts par ces classifieurs :

Cybersécurité. Exploitation de vulnérabilités, piratage offensif automatisé. C'est le classifieur central, celui dont l'existence a justifié le refus d'avril. Comme le montre le graphique ci-dessous, Mythos 5 atteint 88,4 % sur les benchmarks offensifs (Firefox, OSS-Fuzz, CyberGym, CyScenarioBench), tandis que Fable 5 reste à 0,0 % sur tous ces tests : le bridage est total.

Capacité cyber offensive : Mythos 5 jusqu'à 88,4 %, Fable 5 à 0 %. La preuve visuelle du bridage.

Biologie et chimie. Requêtes liées aux armes biologiques, à la synthèse d'agents dangereux. C'est ici que les faux positifs posent problème : des utilisateurs signalent des déclenchements sur des requêtes anodines, comme l'interprétation d'un bilan sanguin.

Distillation et recherche IA. Le troisième classifieur cible les tentatives d'extraction de capacités du modèle par des concurrents - et, selon la controverse, la recherche IA avancée en général. C'est lui qui concentre la polémique.

Every Claude model has safeguards. Our safety systems for Fable 5 automatically review requests that touch on high-risk areas like cybersecurity or biology. Those requests are then redirected to Opus 4.8.

Anthropic, system card Fable 5· Doc API officielle

Le détail technique qui pose le plus de questions : quand un classifieur se déclenche, Fable 5 ne renvoie pas un message d'erreur ni un refus explicite. Il répond en HTTP 200, avec la réponse d'Opus 4.8 à la place. L'utilisateur ne sait pas que son modèle a changé sous ses pieds.

En termes de fréquence, Anthropic indique que moins de 5 % des sessions déclenchent ce repli. Ce chiffre global masque des disparités : le troisième classifieur (distillation) n'affecterait que 0,03 % du trafic selon la system card de 319 pages - mais c'est précisément ce classifieur qui touche les chercheurs en IA.

La robustesse aux attaques adversariales (jailbreaks) est par ailleurs réelle : Fable 5 résiste à 94,6 % des tentatives de contournement, contre 43,4 % pour Opus 4.8.

Fable 5 résiste à 94,6 % des jailbreaks, contre 43,4 % pour Opus 4.8.

Les performances réelles : roi du code, pas roi partout

Fable 5 est présenté par Anthropic comme état de l'art sur "presque tous les benchmarks". C'est vrai pour plusieurs catégories, mais "presque" fait le travail dans cette phrase.

Codage agentique : Fable 5 écrase la concurrence sur SWE-Bench Pro (80,3 %) et FrontierCode Diamond (29,3 %).

Le domaine où Fable 5 s'impose sans ambiguïté : le codage.

Sur FrontierCode Diamond - le benchmark de code de production difficile de Cognition - Fable 5 atteint 29,3 % contre 13,4 % pour Opus 4.8 et 5,7 % pour GPT-5.5. Stripe a migré une base de code de 50 millions de lignes Ruby en une journée grâce à ce niveau de capacité agentique.

Mais le tableau s'équilibre sur le raisonnement scientifique doctoral. Le benchmark GPQA Diamond (questions au niveau doctorat en biologie, chimie, physique) est remporté par Gemini 3.1 Pro avec 94,3 %, devant GPT-5.5 (92,8 %) et Fable 5 (91,3 %). Nuance éditoriale importante : c'est précisément dans les domaines biologie et chimie que les classifieurs de Fable 5 sont actifs. La performance mesurée sur GPQA Diamond pour Fable 5 est donc la performance filtrée, pas la performance brute du modèle de base.

14 benchmarks officiels Anthropic. Note : sur les benchmarks marqués d'étoiles (biologie, cyber), Fable 5 retombe au niveau d'Opus 4.8 à cause des fallbacks.

Côté utilisation ordinateur (computer use), Fable 5 marque 85,0 % sur OSWorld-Verified contre 78,7 % pour GPT-5.5. En raisonnement général (Humanity's Last Exam), il atteint 64,5 % contre 52,2 % pour GPT-5.5. Sur ces usages non bridés, l'avance est nette.

Le cas des démos illustre les capacités réelles du modèle. Fable 5 finit Pokémon FireRed de A à Z uniquement par la vision - sans accès à la mémoire du jeu, seulement des screenshots bruts.

Fable 5 termine Pokémon FireRed à la seule vision, sans accès direct à la mémoire du jeu.

Dans un autre registre, Mythos 5 (version non bridée) a accéléré certains aspects de la conception de médicaments environ 10 fois et produit des hypothèses scientifiques originales préférées dans 80 % des comparaisons en aveugle. 9 sur 14 complexes protéiques conçus pour des maladies immunitaires, neurodégénératives et musculaires ont donné de forts candidats thérapeutiques.

Des protéines thérapeutiques conçues par Mythos 5 : 9 sur 14 complexes ont produit des candidats sérieux.

La controverse "secret sabotage" : le classifieur qui fâche les chercheurs

La polémique principale ne porte pas sur le bridage cyber ou bio - ces deux domaines sont généralement compris du public comme justifiables. Elle porte sur le troisième classifieur, dit "distillation", et sur ce qu'il bloque réellement.

La system card de Fable 5 - un document de 319 pages - révèle que ce classifieur réduit volontairement les réponses concernant le développement IA avancé, sans notification visible à l'utilisateur. Contrairement aux deux premiers classifieurs (cyber et bio) qui sont mentionnés publiquement, celui-ci est posé en note technique dans un document que très peu de gens lisent.

Nathan Lambert, chercheur chez AI2, qualifie Anthropic d'"anti-science" et dénonce un accès retiré de manière "souterraine" aux modèles de pointe pour les chercheurs externes. Dean Ball, de la Foundation for American Innovation, utilise directement l'expression "secret sabotage". Jeremy Howard (Fast AI) pointe l'asymétrie : l'équipe interne d'Anthropic accède aux capacités de recherche frontière, tandis que les chercheurs externes en sont privés.

La confusion est renforcée par la présentation marketing d'Anthropic. Dans ses comparatifs de benchmarks, l'entreprise affiche le score le plus élevé entre Mythos 5 et Fable 5 sans indiquer quelle version l'utilisateur standard obtient réellement. Une biologiste qui regarde la performance GPQA Diamond et souscrit à Fable 5 pour ce benchmark reçoit en réalité une version filtrée sur son domaine - elle ne le saura que si elle lit attentivement les 319 pages.

La justification d'Anthropic sur le troisième classifieur mêle deux motivations distinctes : protection contre la distillation (un concurrent qui extrairait les capacités du modèle en le questionnant massivement) et précaution sur la recherche IA avancée. Cette ambiguïté entre protection commerciale et censure scientifique est exactement ce qui nourrit les critiques.

Rétention 30 jours : même les clients ZDR ne sont pas épargnés

Parmi les nouvelles conditions d'utilisation de Fable 5, une règle passe souvent sous le radar mais concerne les utilisateurs enterprise directement : la rétention obligatoire de 30 jours sur toutes les requêtes.

La politique officielle Anthropic est explicite : "Prompts submitted to, and outputs generated by, Mythos-class models are retained for 30 days for trust and safety purposes." Ce qui est notable, c'est que cette politique s'applique même aux clients ayant un accord de zéro rétention de données (ZDR) : workspaces ZDR dans Claude Console, Claude Code Enterprise avec ZDR, accès via AWS Bedrock, Google Cloud Agent Platform ou Microsoft Foundry avec ZDR.

Les accès aux données sont loggués et traçables. Les employés Anthropic ne peuvent accéder aux conversations que si elles sont signalées pour un préjudice sérieux potentiel, ou sur demande écrite du client. Après 30 jours, suppression automatique - sauf enquête de sécurité en cours ou obligation légale.

Pour les équipes qui traitent des données sensibles (code propriétaire, données financières, documents légaux), cette rétention obligatoire n'est pas neutre. TechCrunch notait qu'elle "pourrait créer un précédent" dans l'industrie : c'est la première fois qu'un accord ZDR est explicitement contourné au niveau du modèle.

La fracture d'accès : deux vitesses, une "permanent underclass"

Accès à deux vitesses : Mythos 5 non bridé pour les partenaires Glasswing, Fable 5 bridé pour le public - au double du prix d'Opus 4.8.

Le lancement de Fable 5 institue formellement un système d'accès à deux niveaux. D'un côté, Mythos 5 non bridé pour les partenaires Glasswing. De l'autre, Fable 5 bridé et plus cher pour le reste.

L'abonnement Max à 100 dollars par mois inclut Fable 5 jusqu'au 22 juin 2026. À partir du 23 juin, il faut payer à l'usage. Un abonnement Max peut être épuisé en 9 minutes sur des tâches intensives.

La phrase qui a circulé sur X après l'annonce : "The permanent underclass everyone keeps tweeting about has a start date now: June 23."

Ce que cette formulation saisit : les développeurs avec des budgets limités seront contraints d'utiliser des modèles plus anciens, moins performants, tandis que les organisations bien financées accèdent aux capacités supérieures de Mythos. L'avantage de productivité se compose exponentiellement.

La situation est aggravée par les classifieurs décrits comme "hypersensitifs" : ils font fréquemment basculer des requêtes inoffensives vers Opus 4.8, de sorte que même les utilisateurs Fable 5 payants reçoivent parfois Opus 4.8 sans le savoir.

CaractéristiqueFable 5 (grand public)Mythos 5 (Glasswing)
Modèle de baseIdentiqueIdentique
Classifieurs cyberActif (redirige)Inactif
Classifieurs bio/chimieActif (redirige)Inactif
Classifieur distillationActif (redirige)Inactif
Rétention 30 joursObligatoireObligatoire
Prix entrée10 $/M tokensAccès négocié
Fenêtre contexte1M tokens1M tokens
Accès via API publiqueOuiNon

Ce que ça révèle de la stratégie Anthropic

Rassembler les éléments donne un tableau cohérent, même si certains choix d'Anthropic peuvent être lus à plusieurs niveaux.

Premier élément : Anthropic a déposé son prospectus IPO auprès de la SEC. La coïncidence du timing (lancement de Fable 5 - le modèle le plus impressionnant de l'histoire de l'entreprise - et dépôt IPO simultané) n'est pas anodine. Les benchmarks de codage, les démos spectaculaires (Pokémon, Factorio, drug design), la narrative "modèle le plus puissant du monde accessible au public" - tout cela sert aussi une valorisation.

Deuxième élément : l'architecture "même modèle, accès différencié" est une ligne produit, pas seulement une décision de sécurité. Traiter le haut de gamme comme un bracket "Mythos" avec des niveaux d'accès différents selon le profil client est une posture commerciale solide, que la justification sécuritaire vienne en premier ou en second.

Anthropic has ruined OpenAI's whole model roadmap.

Robert Corson· Analyste IA, commentaire public

La réaction d'OpenAI est révélatrice : un membre de l'équipe Codex a répondu au lancement avec "feeling pretty good about things", sous-entendant une réponse en préparation. La fenêtre critique est connue : avant le 23 juin, date de bascule tarifaire de Fable 5.

Troisième élément : la question de la gouvernance. Mythos 5 non bridé disponible pour la NSA, Apple et NVIDIA, mais pas pour les chercheurs académiques, les biologistes indépendants, les développeurs sans budget - c'est un choix politique autant que technique. Anthropic défend ce choix par la sécurité. Ses critiques le lisent comme la capture d'une technologie transformatrice par un club d'organisations sélectionnées, avec une justification sécuritaire comme verrou.

La vraie question qui reste ouverte : est-ce qu'un modèle bridé silencieusement est plus ou moins dangereux qu'un modèle qui refuse explicitement ? Fable 5 choisit la première option. L'utilisateur reçoit une réponse - juste pas celle du modèle qu'il pensait utiliser. C'est un pari que la "plausible mediocrity" est préférable au refus visible. Ce pari divise la communauté IA depuis le 9 juin.

Fable 5 est réel, puissant, et disponible. Mais la version que tu utilises n'est pas la version la plus puissante disponible. Cette distinction, Anthropic l'assume explicitement pour la première fois. Elle sera difficile à effacer.

Pour aller plus loin

Fable 5 est le modèle le plus documenté qu'Anthropic ait jamais publié - avec une system card de 319 pages et une documentation API détaillée. La vidéo officielle de lancement donne la vision d'ensemble en deux minutes.

La vidéo officielle de lancement de Claude Fable 5 par Anthropic (juin 2026).

Les sources primaires pour aller plus loin :

Claude Fable 5 et Mythos 5 - Annonce officielle
L'annonce source : les deux modèles, les benchmarks revendiqués, Stripe 50M lignes, drug design x10, disponibilité et tarifs.
anthropic.com
Doc API : claude-fable-5 et claude-mythos-5
Specs techniques : model IDs, contexte 1M tokens, sortie 128k, adaptive thinking, refus en HTTP 200, rétention 30j, dispo Bedrock/Vertex/Foundry.
platform.claude.com
Anthropic accusé de 'secret sabotage' par des chercheurs en IA
Fortune documente les accusations de Nathan Lambert, Jeremy Howard et Dean Ball sur le classifieur distillation et le bridage silencieux de la recherche IA.
fortune.com
Les garde-fous Mythos alimentent la crainte d'une 'permanent underclass'
Gizmodo analyse la date du 23 juin comme point de bascule, les classifieurs hypersensibles, et la fracture d'accès entre organisations riches et développeurs indépendants.
gizmodo.com
Heise : Fable 5 comme variante restreinte de Mythos 5
Analyse technique du classifieur distillation, des faux positifs (bilans sanguins), et du contexte NSA/Glasswing.
heise.de
Anthropic construit Mythos et refuse de le publier (avril 2026)
Le récit d'avril : Mythos Preview dévoilé puis immédiatement retenu, milliers de zero-days, Project Glasswing et 100M$ de crédits.
colombiaone.com
Politique de rétention des données pour les modèles Mythos-class
La source primaire sur la rétention 30 jours obligatoire, y compris pour les clients ZDR, avec la justification officielle Anthropic.
support.claude.com
Fable 5, le modèle le plus controversé d'Anthropic
The Neuron décortique la 'plausible mediocrity', l'interdiction par statut professionnel (biologistes), et le tableau comparatif opaque Mythos/Fable.
theneurondaily.com

Fable 5 est disponible dès maintenant sur l'API Claude, Claude Code, Amazon Bedrock, Vertex AI et Microsoft Foundry. Si tu travailles sur des tâches de codage ou de raisonnement général non sensible, la différence avec Opus 4.8 est mesurable. Si tu travailles en biologie, cybersécurité ou recherche IA - sache que tu pourrais recevoir Opus 4.8 sans qu'on te le dise.