Che cos'è ChatGPT Images 2.0?

ChatGPT Images 2.0 è una nuova generazione di generazione immagini pubblicata da OpenAI il 21 aprile, che risolve il problema del testo nelle immagini, permettendo di scrivere parole e frasi leggibili e precise, con supporto multilingue e editing puntuale.

Qual è il problema del testo nelle immagini con le IA precedenti?

Le IA tradizionali generano immagini pixel per pixel senza comprendere lettere o parole, producendo testo distorto, lettere storte e parole inventate, rendendo il testo una decorazione casuale anziché comunicazione leggibile.

Quali miglioramenti tecnologici introduce ChatGPT Images 2.0?

Introduce un modello di punta via API come GPT Image 1.5, con editing preciso, rendering del testo migliorato, supporto multilingue e una generazione quattro volte più veloce rispetto alla versione precedente.

ChatGPT Images 2.0 è disponibile per tutti gli abbonamenti?

Sì, ChatGPT Images 2.0 è disponibile su tutti i livelli di abbonamento, incluso il piano gratuito, senza necessità di aggiornamento. DALL·E rimane comunque accessibile tramite il DALL·E GPT per chi preferisce la versione precedente.

Cos'è la funzione 'Images with thinking'?

È una modalità in cui il modello ragiona prima di generare l'immagine, applicando capacità di visual reasoning avanzate. Attualmente è riservata agli abbonati Plus, Pro e Business, ma arriverà presto anche su Enterprise e Edu.

News 3 hours ago

ChatGPT Images 2.0 sa finalmente scrivere nelle immagini

OpenAI lancia ChatGPT Images 2.0, che genera testo leggibile nelle immagini, con supporto multilingue e velocità quadrupla. Disponibile su tutti i piani.

Il nuovo modello di OpenAI risolve il problema storico del testo illeggibile nelle immagini generate dall’intelligenza artificiale

Immagina di aver bisogno di un volantino per la festa di quartiere. Scrivi al chatbot: “Crea un’immagine con su scritto SABATO 1 MAGGIO – TUTTI IN PIAZZA!” e aspetti. Fino a pochissimi giorni fa, il risultato sarebbe stato sconfortante: lettere storte, parole inventate, un alfabeto parallelo incomprensibile. Le IA generative avevano un difetto imbarazzante — non sapevano davvero scrivere nelle immagini che producevano. Poi, lo scorso 21 aprile, OpenAI ha pubblicato l’annuncio ufficiale di ChatGPT Images 2.0, definendolo “una nuova era della generazione di immagini”. Non è un’esagerazione di marketing. Stavolta no.

Il problema del testo nelle immagini

Chi ha usato strumenti di generazione visuale negli ultimi anni conosce bene la frustrazione. Puoi chiedere paesaggi mozzafiato, ritratti fotorealistici, illustrazioni in stile fumetto giapponese — e ottieni risultati spesso sorprendenti. Ma appena provi ad aggiungere una scritta, qualcosa si rompe. Le IA tradizionali generano immagini “immaginando” i pixel uno dopo l’altro, senza una vera comprensione di cosa sia una lettera, una parola, una frase. Il testo diventa decorazione casuale, non comunicazione. È un po’ come chiedere a qualcuno che non ha mai imparato a leggere di copiare un testo a mano: il risultato assomiglia alle lettere, ma non le è. ChatGPT Images 2.0 cambia questo. Ma come?

Tecnologia e velocità: cosa cambia davvero sotto il cofano

La risposta è un modello completamente nuovo. Stando a quanto comunicato da OpenAI sulla nuova generazione di immagini, ChatGPT Images 2.0 introduce un modello di punta disponibile via API come GPT Image 1.5, con editing preciso, rendering del testo migliorato e — dettaglio che fa la differenza nell’uso quotidiano — una generazione quattro volte più veloce rispetto alla versione precedente. Quattro volte. Significa passare da un’attesa nervosa a qualcosa che si avvicina alla risposta istantanea.

Il supporto multilingue è un altro salto significativo: non solo inglese, ma testi in più lingue resi con precisione tipografica. Per chi lavora in ambiti creativi, nel marketing, nell’editoria digitale o anche solo vuole fare un biglietto d’auguri personalizzato, questo cambia radicalmente le possibilità. L’editing preciso, poi, significa che puoi intervenire su una porzione specifica dell’immagine senza che il modello “reinterpreti” tutto da capo — un problema classico dei generatori precedenti, che tendevano a ridisegnare l’intera scena ogni volta che chiedevi una modifica.

Disponibilità e futuro: chi può usarlo, e cosa arriva presto

Qui arriva la domanda che molti si pongono: devo aggiornare il mio abbonamento? La risposta è no. Secondo le FAQ ufficiali di ChatGPT Images, ChatGPT Images 2.0 è disponibile su tutti i livelli di abbonamento — incluso il piano gratuito. Tutti, dal primo all’ultimo, possono accedere alle nuove capacità di generazione.

C’è però una distinzione importante da fare. DALL·E non scompare: gli utenti Free, Plus, Team e Pro possono continuare a usarlo attraverso il DALL·E GPT. È una scelta sensata: non tutti hanno bisogno del modello più recente, e mantenere disponibile la versione precedente garantisce continuità a chi si era già organizzato certi flussi di lavoro. I due strumenti coesistono, almeno per ora.

Il capitolo più intrigante riguarda invece una funzione che si chiama “Images with thinking”. Il nome già dice molto: si tratta di una modalità in cui il modello ragiona prima di generare, applicando capacità di visual reasoning avanzate alla creazione visuale. Attualmente è riservata agli abbonati Plus, Pro e Business. Ma OpenAI ha confermato che arriverà presto anche su Enterprise e Edu — i livelli destinati a organizzazioni, aziende e istituzioni educative. È il segnale che la direzione è chiara: portare capacità di ragionamento visivo sempre più sofisticate a un pubblico sempre più ampio, non tenerle chiuse in una nicchia premium.

Il percorso è ancora in corso. “Images with thinking” rappresenta probabilmente la frontiera di quello che vedremo nei prossimi mesi: un’IA che non si limita a “immaginare” un’immagine, ma ci pensa sopra prima di crearla, come farebbe un designer che studia il brief prima di aprire Illustrator. Se questo si tradurrà in risultati davvero migliori per gli utenti comuni — e non solo in una funzione da mostrare nelle demo — lo scopriremo presto. Nel frattempo, il volantino della festa di quartiere è già pronto, e il testo è perfettamente leggibile.

Scritto da Marco Rossi

Giornalista tech con 10 anni di esperienza nel settore. Appassionato di innovazione e early adopter incallito. Ama raccontare come la tecnologia cambia la vita quotidiana delle persone.

Startup

Editorials Pick's

Amazon

Apple

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

ChatGPT Images 2.0 sa finalmente scrivere nelle immagini

Il nuovo modello di OpenAI risolve il problema storico del testo illeggibile nelle immagini generate dall’intelligenza artificiale

Il problema del testo nelle immagini

Tecnologia e velocità: cosa cambia davvero sotto il cofano

Disponibilità e futuro: chi può usarlo, e cosa arriva presto

Il nuovo modello di OpenAI risolve il problema storico del testo illeggibile nelle immagini generate dall’intelligenza artificiale

Il problema del testo nelle immagini

Tecnologia e velocità: cosa cambia davvero sotto il cofano

Disponibilità e futuro: chi può usarlo, e cosa arriva presto

Articoli correlati

I Rust Workers ora possono riprendersi da un panic

Mediavine ha tagliato alcuni ruoli.

Quattro persone sono morte dopo aver parlato con ChatGPT.