ChatGPT Images 2.0 sa finalmente scrivere nelle immagini
OpenAI lancia ChatGPT Images 2.0, che genera testo leggibile nelle immagini, con supporto multilingue e velocità quadrupla. Disponibile su tutti i piani.
Il nuovo modello di OpenAI risolve il problema storico del testo illeggibile nelle immagini generate dall’intelligenza artificiale
Immagina di aver bisogno di un volantino per la festa di quartiere. Scrivi al chatbot: “Crea un’immagine con su scritto SABATO 1 MAGGIO – TUTTI IN PIAZZA!” e aspetti. Fino a pochissimi giorni fa, il risultato sarebbe stato sconfortante: lettere storte, parole inventate, un alfabeto parallelo incomprensibile. Le IA generative avevano un difetto imbarazzante — non sapevano davvero scrivere nelle immagini che producevano. Poi, lo scorso 21 aprile, OpenAI ha pubblicato l’annuncio ufficiale di ChatGPT Images 2.0, definendolo “una nuova era della generazione di immagini”. Non è un’esagerazione di marketing. Stavolta no.
Il problema del testo nelle immagini
Chi ha usato strumenti di generazione visuale negli ultimi anni conosce bene la frustrazione. Puoi chiedere paesaggi mozzafiato, ritratti fotorealistici, illustrazioni in stile fumetto giapponese — e ottieni risultati spesso sorprendenti. Ma appena provi ad aggiungere una scritta, qualcosa si rompe. Le IA tradizionali generano immagini “immaginando” i pixel uno dopo l’altro, senza una vera comprensione di cosa sia una lettera, una parola, una frase. Il testo diventa decorazione casuale, non comunicazione. È un po’ come chiedere a qualcuno che non ha mai imparato a leggere di copiare un testo a mano: il risultato assomiglia alle lettere, ma non le è. ChatGPT Images 2.0 cambia questo. Ma come?
Tecnologia e velocità: cosa cambia davvero sotto il cofano
La risposta è un modello completamente nuovo. Stando a quanto comunicato da OpenAI sulla nuova generazione di immagini, ChatGPT Images 2.0 introduce un modello di punta disponibile via API come GPT Image 1.5, con editing preciso, rendering del testo migliorato e — dettaglio che fa la differenza nell’uso quotidiano — una generazione quattro volte più veloce rispetto alla versione precedente. Quattro volte. Significa passare da un’attesa nervosa a qualcosa che si avvicina alla risposta istantanea.
Il supporto multilingue è un altro salto significativo: non solo inglese, ma testi in più lingue resi con precisione tipografica. Per chi lavora in ambiti creativi, nel marketing, nell’editoria digitale o anche solo vuole fare un biglietto d’auguri personalizzato, questo cambia radicalmente le possibilità. L’editing preciso, poi, significa che puoi intervenire su una porzione specifica dell’immagine senza che il modello “reinterpreti” tutto da capo — un problema classico dei generatori precedenti, che tendevano a ridisegnare l’intera scena ogni volta che chiedevi una modifica.
Disponibilità e futuro: chi può usarlo, e cosa arriva presto
Qui arriva la domanda che molti si pongono: devo aggiornare il mio abbonamento? La risposta è no. Secondo le FAQ ufficiali di ChatGPT Images, ChatGPT Images 2.0 è disponibile su tutti i livelli di abbonamento — incluso il piano gratuito. Tutti, dal primo all’ultimo, possono accedere alle nuove capacità di generazione.
C’è però una distinzione importante da fare. DALL·E non scompare: gli utenti Free, Plus, Team e Pro possono continuare a usarlo attraverso il DALL·E GPT. È una scelta sensata: non tutti hanno bisogno del modello più recente, e mantenere disponibile la versione precedente garantisce continuità a chi si era già organizzato certi flussi di lavoro. I due strumenti coesistono, almeno per ora.
Il capitolo più intrigante riguarda invece una funzione che si chiama “Images with thinking”. Il nome già dice molto: si tratta di una modalità in cui il modello ragiona prima di generare, applicando capacità di visual reasoning avanzate alla creazione visuale. Attualmente è riservata agli abbonati Plus, Pro e Business. Ma OpenAI ha confermato che arriverà presto anche su Enterprise e Edu — i livelli destinati a organizzazioni, aziende e istituzioni educative. È il segnale che la direzione è chiara: portare capacità di ragionamento visivo sempre più sofisticate a un pubblico sempre più ampio, non tenerle chiuse in una nicchia premium.
Il percorso è ancora in corso. “Images with thinking” rappresenta probabilmente la frontiera di quello che vedremo nei prossimi mesi: un’IA che non si limita a “immaginare” un’immagine, ma ci pensa sopra prima di crearla, come farebbe un designer che studia il brief prima di aprire Illustrator. Se questo si tradurrà in risultati davvero migliori per gli utenti comuni — e non solo in una funzione da mostrare nelle demo — lo scopriremo presto. Nel frattempo, il volantino della festa di quartiere è già pronto, e il testo è perfettamente leggibile.