Cos'è Fable 5 e in cosa si differenzia dai modelli tradizionali?

Fable 5 è un modello AI che introduce un loop di auto-correzione interno, a differenza dei modelli tradizionali che funzionano come funzioni stateless (input-output). Questo loop, prima prerogativa di architetture agentiche con scaffolding esterno, è ora integrato nel modello, permettendogli di lavorare su task di coding e knowledge work per giorni consecutivi senza intervento umano, mantenendo coerenza e aggiornando le proprie strategie.

Quale infrastruttura ha permesso lo sviluppo di Fable 5?

Lo sviluppo è stato possibile grazie a Project Rainier, un cluster che utilizza quasi mezzo milione di chip Trainium2 di AWS, offrendo oltre cinque volte la potenza di calcolo impiegata per addestrare i modelli precedenti di Anthropic. Questa infrastruttura ha permesso di spingere il training a una scala sufficiente per ottenere comportamenti emergenti come l'auto-valutazione e l'aggiornamento autonomo delle competenze.

Quanto costa utilizzare Fable 5 e Mythos 5?

Entrambi i modelli sono disponibili su Amazon Bedrock al prezzo di 10 dollari per milione di token in input e 50 dollari per milione di token in output, meno della metà rispetto a Claude Mythos Preview.

Come cambia il ruolo del costruttore con l'uso di Fable 5?

Fable 5 sposta il ruolo del costruttore da esecutore di task a supervisore di un agente. La competenza richiesta si trasforma: la domanda non è più 'cosa sa fare questo modello?', ma 'come impostare una collaborazione con qualcosa che trova vulnerabilità prima di me e si corregge da solo prima di riferirmelo?'.

News 3 hours ago

Un modello AI ha imparato a correggersi da solo

Q: Quali sono le capacità di visione di Fable 5?

Fable 5 ha capacità di visione che vanno oltre il semplice riconoscimento di immagini: comprende diagrammi, grafici e tabelle annidati in file e PDF, aprendo la strada a lavori in ambito finanziario, legale, analitico e architetturale.

Q: Quali risultati ha ottenuto Claude Mythos Preview nell'analisi della sicurezza?

Claude Mythos Preview ha identificato oltre diecimila vulnerabilità di severità alta o critica nei software più importanti a livello sistemico, trovando falle in ogni sistema operativo e browser web principale. Il modello analizza il codice, formula ipotesi sulle superfici di attacco, costruisce i propri harness di test e verifica i risultati, riducendo i falsi positivi.

Q: Quali sono le implicazioni dell'auto-correzione di Fable 5 per il controllo del processo?

Un agente che si auto-corregge, costruisce i propri criteri di valutazione e lavora in autonomia per giorni pone domande serie sulla verificabilità delle sue decisioni intermedie. Quando un modello sviluppa i propri harness di test, sorge la questione di chi valida i criteri con cui quei test sono stati progettati.

Anthropic lancia Fable 5, modello AI con auto-correzione integrata, capace di lavorare autonomamente per giorni su compiti complessi.

Il modello Fable 5 introduce un loop di auto-correzione prima riservato ad architetture esterne

Il dettaglio che cambia tutto

I modelli tradizionali funzionano come funzioni stateless: ricevono input, producono output, si fermano. Fable 5 introduce un loop che fino a oggi era prerogativa di architetture agentiche costruite a mano, con scaffolding esterno, catene di prompt e supervisione umana. Adesso quel loop è dentro il modello. Secondo Anthropic, Fable 5 è in grado di lavorare su task di coding e knowledge work per giorni consecutivi senza intervento umano, mantenendo coerenza e aggiornando le proprie strategie in corso d’opera. Le prestazioni, stando alla documentazione ufficiale, superano quelle di qualsiasi modello reso disponibile in precedenza dalla società — e il vantaggio cresce proporzionalmente alla complessità e alla durata del compito. Aggiunge anche capacità di visione che vanno oltre il semplice riconoscimento di immagini: il modello comprende diagrammi, grafici e tabelle annidati in file e PDF, aprendo la strada a lavori pesanti in ambito finanziario, legale, analitico e architetturale.

Sotto il cofano: da Mythos a Fable

La domanda ovvia è: come è stato possibile? La risposta si chiama Project Rainier. Il cluster — ora completamente operativo e annunciato come uno dei più grandi al mondo per il calcolo AI — utilizza quasi mezzo milione di chip Trainium2 di AWS e offre oltre cinque volte la potenza di calcolo impiegata da Anthropic per addestrare i modelli precedenti. È su questa infrastruttura che è stato possibile spingere il training a una scala sufficiente per ottenere comportamenti emergenti come l’auto-valutazione e l’aggiornamento autonomo delle competenze.

Ma c’è un dettaglio architetturale che vale la pena capire: Fable 5 e Mythos 5 sono lo stesso modello base. La differenza è che in Mythos 5 alcune tutele sono rimosse in aree specifiche. Fable 5 è, letteralmente, un modello di classe Mythos reso sicuro per uso generale. Questa separazione — stesso motore, due configurazioni di sicurezza — è una scelta ingegneristica precisa: permette di addestrare e ottimizzare un unico modello e poi applicare strati di allineamento differenziati a seconda del contesto d’uso. Mythos 5, nella sua versione senza restrizioni, sarà inizialmente distribuito attraverso Project Glasswing, in collaborazione con il governo degli Stati Uniti, come aggiornamento di Claude Mythos Preview. Entrambi i modelli sono disponibili su Amazon Bedrock al prezzo di 10 dollari per milione di token in input e 50 per milione di token in output — meno della metà rispetto a Claude Mythos Preview.

Cosa cambia per chi costruisce

Ed è qui che emergono le implicazioni più concrete per chi sviluppa software. Claude Mythos Preview — il predecessore diretto distribuito nell’ambito di Project Glasswing con circa cinquanta partner — ha identificato oltre diecimila vulnerabilità di severità alta o critica nei software più importanti a livello sistemico. Secondo i dati di Anthropic, il modello ha trovato falle in ogni sistema operativo e browser web principale. Non si tratta di fuzzing automatizzato nel senso tradizionale: il modello analizza il codice, formula ipotesi sulle superfici di attacco, costruisce i propri harness di test e verifica i risultati — esattamente il loop di auto-valutazione descritto come caratteristica centrale di Fable 5.

Per uno sviluppatore o un team di sicurezza, questo significa che lo strumento non aspetta di essere guidato attraverso un file alla volta. Si muove su basi di codice reali, di dimensioni reali, con una continuità operativa che un analista umano non può sostenere per giorni. Il modello sa anche quando ha torto: verifica il proprio lavoro prima di segnalare un risultato, riducendo il rumore dei falsi positivi che tradizionalmente affossano l’utilità pratica degli strumenti di analisi statica automatica.

Resta aperta una tensione che nessun comunicato stampa risolve: un agente che si auto-corregge, costruisce i propri criteri di valutazione e lavora in autonomia per giorni pone domande serie sul controllo del processo. Non sulla malevolenza del modello — che è un problema separato — ma sulla verificabilità delle sue decisioni intermedie. Quando un modello sviluppa i propri harness di test, chi valida i criteri con cui quei test sono stati progettati? Claude Fable 5 sposta il ruolo del costruttore da esecutore di task a supervisore di un agente. La competenza richiesta non scompare: si trasforma. E la domanda da porsi non è più “cosa sa fare questo modello?”, ma “come imposto una collaborazione con qualcosa che trova vulnerabilità prima di me e si corregge da solo prima di riferirmelo?”

Scritto da Luca Verdi

Developer e tech writer. Spiega la tecnologia dal punto di vista tecnico senza perdere di vista l'accessibilità. Ex software engineer, ora si dedica al giornalismo tech.

Startup

Editorials Pick's

Amazon

Apple

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

Un modello AI ha imparato a correggersi da solo