OpenAI non controlla più la qualità di Codex
OpenAI Codex ha 5 milioni di utenti settimanali, ma il 33% degli output soffre di degenerazione testuale. L'addestramento in due fasi riduce il problema.
Il 20% degli utenti Codex sono non sviluppatori, con tassi di degenerazione testuale fino al 33%
Quando OpenAI ha aperto Codex a utenti non tecnici, l’idea era semplice: tradurre linguaggio naturale in codice eseguibile. Oggi 5 milioni di utenti Codex lo usano ogni settimana, e i non sviluppatori il 20% di Codex rappresentano una fetta in rapida espansione — crescita tripla dei non sviluppatori rispetto agli sviluppatori stessi. OpenAI ha risposto con plugin per ruolo e annotazioni e l’offerta include 62 app e 110 competenze. Ma l’accessibilità ha un costo tecnico che pochi considerano: la degenerazione testuale.
Il prezzo dell’accessibilità: modelli che entrano in loop
Ottimizzazione diretta delle preferenze — il paper di Hugging Face che analizza le famiglie open-source — misura proprio questo: quanto spesso un modello ricade in un loop di ripetizione invece di generare testo coerente. I tassi di degenerazione dal 33% nei modelli vanilla mostrano che quasi un output su tre può essere spazzatura. Il fine-tuning supervisionato (SFT) aiuta, ma SFT riduce degenerazione ma non basta per la produzione. La soluzione emerge da un secondo passaggio addestrativo: addestramento in due fasi riduce degenerazione su ogni famiglia testata, con riduzione media raggiunge il 59,4% e un riduzione massima dell’87,6%.
Per chi costruisce pipeline AI significa che l’architettura di addestramento a due stadi non è un optional: è la differenza tra un assistente affidabile e un generatore di rumore.
Google I/O 2026: creatività assistita, qualità da validare
Nemmeno Google sfugge all’incognita qualità. Per I/O 2026 l’azienda ha usato strumenti AI per l’evento su larga scala: la creazione del film TPU Training Day ha coinvolto modelli sperimentali DeepMind e Gemini Omni, mentre Nano Banana per primi fotogrammi ha generato stilizzazioni da footage grezzo. L’identità visiva — gradiente a quattro colori e icone — è stata assemblata con trasparenze sovrapposte. Persino la colonna sonora ha sfruttato AI: Jellectronica prodotti AI per I/O 2026 per tradurre i movimenti delle meduse luna in suono usando Lyria 3 Pro. Il risultato è esteticamente impressionante, ma la domanda sotterranea resta: quante iterazioni, quanti filtri umani sono serviti per evitare che un modello entrasse in loop durante la generazione? La risposta tecnica è che ogni strato creativo richiede un controllo di qualità che al momento nessun modello garantisce da solo.