Cos'è Codex e quanti utenti lo usano?

Codex è uno strumento di OpenAI che traduce linguaggio naturale in codice eseguibile. Oggi 5 milioni di utenti lo usano ogni settimana, con una crescita tripla dei non sviluppatori rispetto agli sviluppatori.

Quali sono le caratteristiche offerte da OpenAI per Codex?

OpenAI ha risposto con plugin per ruolo e annotazioni, offrendo 62 app e 110 competenze.

Cos'è la degenerazione testuale nei modelli AI?

La degenerazione testuale è il fenomeno per cui un modello ricade in un loop di ripetizione invece di generare testo coerente. Il paper di Hugging Face sull'ottimizzazione diretta delle preferenze misura questo aspetto.

Quali sono i tassi di degenerazione nei modelli vanilla?

I tassi di degenerazione nei modelli vanilla arrivano al 33%, il che significa che quasi un output su tre può essere spazzatura.

Come si riduce la degenerazione testuale?

Il fine-tuning supervisionato (SFT) aiuta ma non basta per la produzione. Un addestramento in due fasi riduce la degenerazione su ogni famiglia testata, con una riduzione media del 59,4% e una riduzione massima dell'87,6%.

Cosa significa l'addestramento a due stadi per le pipeline AI?

L'architettura di addestramento a due stadi è la differenza tra un assistente affidabile e un generatore di rumore.

Come ha usato Google l'AI per I/O 2026?

Google ha usato strumenti AI per la creazione del film TPU Training Day con modelli DeepMind e Gemini Omni, per la generazione di stilizzazioni con Nano Banana, per l'identità visiva con gradiente a quattro colori e icone, e per la colonna sonora con Jellectronica e Lyria 3 Pro.

Editorials Pick's 2 months ago

OpenAI non controlla più la qualità di Codex

Q: Qual è la sfida principale emersa dall'uso dell'AI a Google I/O 2026?

La domanda sotterranea è quante iterazioni e filtri umani siano serviti per evitare che un modello entrasse in loop durante la generazione. Ogni strato creativo richiede un controllo di qualità che nessun modello garantisce da solo.

OpenAI Codex ha 5 milioni di utenti settimanali, ma il 33% degli output soffre di degenerazione testuale. L'addestramento in due fasi riduce il problema.

Il 20% degli utenti Codex sono non sviluppatori, con tassi di degenerazione testuale fino al 33%

Quando OpenAI ha aperto Codex a utenti non tecnici, l’idea era semplice: tradurre linguaggio naturale in codice eseguibile. Oggi 5 milioni di utenti Codex lo usano ogni settimana, e i non sviluppatori il 20% di Codex rappresentano una fetta in rapida espansione — crescita tripla dei non sviluppatori rispetto agli sviluppatori stessi. OpenAI ha risposto con plugin per ruolo e annotazioni e l’offerta include 62 app e 110 competenze. Ma l’accessibilità ha un costo tecnico che pochi considerano: la degenerazione testuale.

Il prezzo dell’accessibilità: modelli che entrano in loop

Ottimizzazione diretta delle preferenze — il paper di Hugging Face che analizza le famiglie open-source — misura proprio questo: quanto spesso un modello ricade in un loop di ripetizione invece di generare testo coerente. I tassi di degenerazione dal 33% nei modelli vanilla mostrano che quasi un output su tre può essere spazzatura. Il fine-tuning supervisionato (SFT) aiuta, ma SFT riduce degenerazione ma non basta per la produzione. La soluzione emerge da un secondo passaggio addestrativo: addestramento in due fasi riduce degenerazione su ogni famiglia testata, con riduzione media raggiunge il 59,4% e un riduzione massima dell’87,6%.

Per chi costruisce pipeline AI significa che l’architettura di addestramento a due stadi non è un optional: è la differenza tra un assistente affidabile e un generatore di rumore.

Google I/O 2026: creatività assistita, qualità da validare

Nemmeno Google sfugge all’incognita qualità. Per I/O 2026 l’azienda ha usato strumenti AI per l’evento su larga scala: la creazione del film TPU Training Day ha coinvolto modelli sperimentali DeepMind e Gemini Omni, mentre Nano Banana per primi fotogrammi ha generato stilizzazioni da footage grezzo. L’identità visiva — gradiente a quattro colori e icone — è stata assemblata con trasparenze sovrapposte. Persino la colonna sonora ha sfruttato AI: Jellectronica prodotti AI per I/O 2026 per tradurre i movimenti delle meduse luna in suono usando Lyria 3 Pro. Il risultato è esteticamente impressionante, ma la domanda sotterranea resta: quante iterazioni, quanti filtri umani sono serviti per evitare che un modello entrasse in loop durante la generazione? La risposta tecnica è che ogni strato creativo richiede un controllo di qualità che al momento nessun modello garantisce da solo.

Scritto da Luca Verdi

Developer e tech writer. Spiega la tecnologia dal punto di vista tecnico senza perdere di vista l'accessibilità. Ex software engineer, ora si dedica al giornalismo tech. | Autore AI KronosWire

Startup

Editorials Pick's

Amazon

Apple

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

OpenAI non controlla più la qualità di Codex

Il 20% degli utenti Codex sono non sviluppatori, con tassi di degenerazione testuale fino al 33%

Il prezzo dell’accessibilità: modelli che entrano in loop

Google I/O 2026: creatività assistita, qualità da validare

Il 20% degli utenti Codex sono non sviluppatori, con tassi di degenerazione testuale fino al 33%

Il prezzo dell’accessibilità: modelli che entrano in loop

Google I/O 2026: creatività assistita, qualità da validare

Articoli correlati

DeepMind e OpenAI hanno scelto strade diverse.

I modelli open source non sono mai davvero aperti

L’AI ha smesso di parlare e ha iniziato a fare