Un modello AI ha imparato a correggersi da solo
Anthropic lancia Fable 5, modello AI con auto-correzione integrata, capace di lavorare autonomamente per giorni su compiti complessi.
Il modello Fable 5 introduce un loop di auto-correzione prima riservato ad architetture esterne
Il dettaglio che cambia tutto
I modelli tradizionali funzionano come funzioni stateless: ricevono input, producono output, si fermano. Fable 5 introduce un loop che fino a oggi era prerogativa di architetture agentiche costruite a mano, con scaffolding esterno, catene di prompt e supervisione umana. Adesso quel loop è dentro il modello. Secondo Anthropic, Fable 5 è in grado di lavorare su task di coding e knowledge work per giorni consecutivi senza intervento umano, mantenendo coerenza e aggiornando le proprie strategie in corso d’opera. Le prestazioni, stando alla documentazione ufficiale, superano quelle di qualsiasi modello reso disponibile in precedenza dalla società — e il vantaggio cresce proporzionalmente alla complessità e alla durata del compito. Aggiunge anche capacità di visione che vanno oltre il semplice riconoscimento di immagini: il modello comprende diagrammi, grafici e tabelle annidati in file e PDF, aprendo la strada a lavori pesanti in ambito finanziario, legale, analitico e architetturale.
Sotto il cofano: da Mythos a Fable
La domanda ovvia è: come è stato possibile? La risposta si chiama Project Rainier. Il cluster — ora completamente operativo e annunciato come uno dei più grandi al mondo per il calcolo AI — utilizza quasi mezzo milione di chip Trainium2 di AWS e offre oltre cinque volte la potenza di calcolo impiegata da Anthropic per addestrare i modelli precedenti. È su questa infrastruttura che è stato possibile spingere il training a una scala sufficiente per ottenere comportamenti emergenti come l’auto-valutazione e l’aggiornamento autonomo delle competenze.
Ma c’è un dettaglio architetturale che vale la pena capire: Fable 5 e Mythos 5 sono lo stesso modello base. La differenza è che in Mythos 5 alcune tutele sono rimosse in aree specifiche. Fable 5 è, letteralmente, un modello di classe Mythos reso sicuro per uso generale. Questa separazione — stesso motore, due configurazioni di sicurezza — è una scelta ingegneristica precisa: permette di addestrare e ottimizzare un unico modello e poi applicare strati di allineamento differenziati a seconda del contesto d’uso. Mythos 5, nella sua versione senza restrizioni, sarà inizialmente distribuito attraverso Project Glasswing, in collaborazione con il governo degli Stati Uniti, come aggiornamento di Claude Mythos Preview. Entrambi i modelli sono disponibili su Amazon Bedrock al prezzo di 10 dollari per milione di token in input e 50 per milione di token in output — meno della metà rispetto a Claude Mythos Preview.
Cosa cambia per chi costruisce
Ed è qui che emergono le implicazioni più concrete per chi sviluppa software. Claude Mythos Preview — il predecessore diretto distribuito nell’ambito di Project Glasswing con circa cinquanta partner — ha identificato oltre diecimila vulnerabilità di severità alta o critica nei software più importanti a livello sistemico. Secondo i dati di Anthropic, il modello ha trovato falle in ogni sistema operativo e browser web principale. Non si tratta di fuzzing automatizzato nel senso tradizionale: il modello analizza il codice, formula ipotesi sulle superfici di attacco, costruisce i propri harness di test e verifica i risultati — esattamente il loop di auto-valutazione descritto come caratteristica centrale di Fable 5.
Per uno sviluppatore o un team di sicurezza, questo significa che lo strumento non aspetta di essere guidato attraverso un file alla volta. Si muove su basi di codice reali, di dimensioni reali, con una continuità operativa che un analista umano non può sostenere per giorni. Il modello sa anche quando ha torto: verifica il proprio lavoro prima di segnalare un risultato, riducendo il rumore dei falsi positivi che tradizionalmente affossano l’utilità pratica degli strumenti di analisi statica automatica.
Resta aperta una tensione che nessun comunicato stampa risolve: un agente che si auto-corregge, costruisce i propri criteri di valutazione e lavora in autonomia per giorni pone domande serie sul controllo del processo. Non sulla malevolenza del modello — che è un problema separato — ma sulla verificabilità delle sue decisioni intermedie. Quando un modello sviluppa i propri harness di test, chi valida i criteri con cui quei test sono stati progettati? Claude Fable 5 sposta il ruolo del costruttore da esecutore di task a supervisore di un agente. La competenza richiesta non scompare: si trasforma. E la domanda da porsi non è più “cosa sa fare questo modello?”, ma “come imposto una collaborazione con qualcosa che trova vulnerabilità prima di me e si corregge da solo prima di riferirmelo?”