Retour au feed
Simon Willison·

Initial impressions of Claude Fable 5

Signal
82
Hype
25
En 3 lignesAnthropic lance Claude Fable 5 et Claude Mythos 5 avec 1M tokens de contexte, 128k tokens max en sortie, knowledge cutoff janvier 2026. Fable 5 inclut des garde-fous stricts ; Mythos 5 sans classifieurs de sécurité. Tarification : $10/M input, $50/M output (2× Opus 4.5-4.8). Willison rapporte performances solides après 5.5h de tests.

## Claude Fable 5 & Mythos 5 : ce que les chiffres disent vraiment

### 1. Le contexte immédiat

Anthropic sort simultanément deux modèles distincts — Fable 5 et Mythos 5 — avec une architecture de capacités identiques mais une philosophie de déploiement opposée. Fable 5 embarque des classifieurs de sécurité stricts au point qu'Anthropic a dû créer un mécanisme de fallback automatique dans l'API : si une requête déclenche un refus, le système peut basculer vers un modèle alternatif sans intervention du développeur. Mythos 5, lui, tourne sans ces classifieurs. C'est une bifurcation explicite du produit selon le profil de risque de l'utilisateur, pas un simple tier de prix.

Le knowledge cutoff à janvier 2026 mérite attention : c'est plusieurs mois au-delà de la plupart des modèles concurrents actuellement en production, ce qui donne un avantage factuel mesurable sur des requêtes portant sur des événements récents.

### 2. La structure tarifaire et ce qu'elle implique

$10/M tokens en entrée, $50/M tokens en sortie. C'est exactement le double de Claude Opus 4.5/4.6/4.7/4.8. Pour calibrer : GPT-4o tourne autour de $2.50/$10, Gemini 1.5 Pro autour de $1.25/$5 sur les volumes standards. Fable 5 se positionne donc dans la tranche premium absolue du marché, aux côtés de GPT-4.5 et des offres o3 d'OpenAI.

Point notable : pas de surcoût pour les longues fenêtres de contexte. Avec 1M tokens de contexte disponibles, cela change le calcul économique pour les cas d'usage RAG-free — ingérer un codebase entier ou un corpus documentaire sans infrastructure vectorielle devient financièrement prévisible. À $10/M input, un contexte plein de 1M tokens coûte $10 par appel, ce qui reste élevé mais linéaire.

Les 128 000 tokens de sortie maximum sont significatifs : c'est 4× la limite de sortie standard de la plupart des modèles (32k). Pour la génération de code longue, les rapports structurés ou les synthèses exhaustives, cette limite supérieure réduit le besoin de chaînage de prompts.

### 3. Le test de connaissance factuelle : signal réel

Le test de Simon Willison sur ses propres projets open source illustre une différence qualitative concrète. Opus 4.8 produit une liste courte (4 projets principaux) avec une mise en garde explicite sur l'incertitude. Fable 5, sur la même requête avec la même faute de frappe, génère apparemment une liste nettement plus exhaustive et datée — ce que Willison décrit comme le "big model smell" : un sentiment de densité de connaissance supérieure.

Ce n'est pas un benchmark synthétique. C'est un test de rappel factuel sur un sujet où l'évaluateur est l'expert de référence. La différence entre les deux réponses pointe vers une capacité de mémorisation et d'organisation de l'information entraînée significativement plus large chez Fable 5.

### 4. Qui perd dans cette configuration

**Les utilisateurs d'Opus 4.x existants** : la migration implique un doublement immédiat des coûts. Pour des pipelines à volume élevé (millions de tokens/jour), le passage à Fable 5 n'est pas anodin sans ROI démontrable sur la qualité.

**Les fournisseurs de solutions RAG** : si un modèle à 1M tokens de contexte sans surcoût peut remplacer une architecture de retrieval complexe pour certains cas d'usage, la proposition de valeur des couches d'indexation vectorielle se réduit. Pas d'élimination, mais compression du périmètre.

**Les concurrents sur le segment "sans garde-fous"** : Mythos 5 attaque directement le marché des modèles non-censurés (Mistral, certains déploiements Llama) avec des capacités frontier. C'est une pression directe sur l'argument "les modèles open-weight sont nécessaires pour les cas d'usage sensibles".

**Les équipes de sécurité chez Anthropic elles-mêmes** : le mécanisme de fallback automatique sur refus est une concession opérationnelle. Il reconnaît implicitement que des classifieurs trop agressifs dégradent l'expérience développeur au point de nécessiter une infrastructure de contournement intégrée.

La vitesse est mentionnée comme un point faible par Willison après 5,5h de tests — "slow" est son terme. Pour des applications interactives temps-réel, c'est une contrainte architecturale non négligeable. Fable 5 semble optimisé pour la qualité de sortie, pas pour la latence.

Lire la source
Ton avis ?
ClaudeAnthropicBenchmarks

Résumé généré par Claude — vérifié par l'humain