Cos'è GPT-5.4 e cosa lo rende diverso?

GPT-5.4 è il primo modello di OpenAI con capacità native di interagire con l'interfaccia di un computer. A differenza dei predecessori, non si limita a generare testo ma può operare in modo autonomo in un ambiente desktop, interpretando schermate e utilizzando mouse e tastiera per completare compiti complessi.

Quando è stato rilasciato GPT-5.4?

GPT-5.4 è stato rilasciato il 5 marzo 2026.

Quali sono le prestazioni di GPT-5.4 nel test OSWorld-Verified?

Nel benchmark OSWorld-Verified, che misura la capacità di utilizzare un computer, GPT-5.4 raggiunge un tasso di successo del 75,0%, superando la performance umana media del 72,4%.

Qual è la dimensione della finestra di contesto di GPT-5.4?

GPT-5.4 supporta fino a 1 milione di token di contesto, una capacità necessaria per pianificare, eseguire e verificare operazioni su lunghi orizzonti temporali.

Come si confronta GPT-5.4 con il modello precedente GPT-5.2?

GPT-5.4 mostra un miglioramento significativo rispetto a GPT-5.2, che aveva un tasso di successo del 47,3% su OSWorld-Verified. Sul test GDPval per compiti professionali, GPT-5.4 ottiene l'83% contro il 70,9% del modello precedente.

Qual è la risposta di Anthropic a GPT-5.4?

Anthropic ha risposto con Claude Sonnet 4.6, che annuncia miglioramenti in codifica, uso del computer e pianificazione, e introduce in beta una finestra di contesto di 1 milione di token.

Cosa cambia per gli utenti di ChatGPT Enterprise con GPT-5.4?

Le capacità agentiche native permettono di automatizzare interi flussi di lavoro che richiedono l'interazione con più applicazioni, estendendo il risparmio di tempo oltre la generazione di testo o codice.

Quando verrà ritirato il modello GPT-5.2?

GPT-5.2 verrà ritirato definitivamente il 5 giugno 2026. GPT-5.4 Thinking lo sostituirà in ChatGPT.

Intelligenza Artificiale 4 days ago

GPT-5.4: OpenAI consegna il primo modello IA che impara a usare il tuo computer

OpenAI ha rilasciato GPT-5.4, un modello IA che opera autonomamente sul computer dell'utente, superando le prestazioni umane medie in test specifici.

Il modello supera le prestazioni umane nei test di interazione con il desktop, segnando un cambio di paradigma verso l’automazione

Immagina un collega digitale che non solo risponde alle tue domande, ma prende il controllo del tuo computer per completare compiti complessi, interpretando schermate e operando mouse e tastiera. Questo non è più fantascienza, ma la realtà che OpenAI ha appena consegnato con GPT-5.4, definendolo il suo primo modello generico con capacità native di utilizzo del computer. Il rilascio, avvenuto il 5 marzo 2026, segna un punto di svolta architetturale: l’IA diventa un agente autonomo in grado di interagire direttamente con l’ambiente digitale dell’utente, pianificando, eseguendo e verificando operazioni su lunghi orizzonti temporali grazie al supporto per fino a 1 milione di token di contesto.

Il salto quantico: quando l’IA impara a usare il computer

La differenza sostanziale tra GPT-5.4 e i suoi predecessori non sta in un miglioramento incrementale di fluidità o conoscenza, ma in una nuova capacità fondamentale: l’interazione nativa con l’interfaccia di un computer. Mentre i precedenti agenti IA, prima del 2025, erano ancora sperimentali, limitati nell’ambito e attivati manualmente, GPT-5.4 è costruito per navigare un ambiente desktop attraverso screenshot e azioni di tastiera/mouse. La prova del suo funzionamento arriva dai benchmark: sul test OSWorld-Verified, che misura proprio questa abilità, GPT‑5.4 raggiunge un tasso di successo del 75,0%, superando per la prima volta le prestazioni umane medie, fissate al 72,4%. Il confronto con il modello precedente, GPT-5.2 rilasciato a dicembre 2025, è impietoso: quest’ultimo si fermava al 47,3%. Questo gap di quasi 28 punti percentuali non è un semplice upgrade, ma il segnale del cambio di paradigma da assistente reattivo a operatore autonomo.

Le implicazioni di questa architettura sono profonde. Non si tratta più di un modello che processa testo in entrata e restituisce testo in uscita. GPT-5.4 integra una comprensione visiva dell’interfaccia utente e un meccanismo di pianificazione delle azioni che gli permette di operare in ambienti software reali. La finestra di contesto da 1 milione di token non è un semplice lusso, ma una necessità funzionale: permette all’agente di mantenere traccia di uno stato applicativo complesso, di una sequenza lunga di passaggi e di verificare i risultati delle proprie azioni contro gli obiettivi iniziali. È la differenza tra rispondere “ecco come si fa” e dire “l’ho fatto io”.

La guerra dei token: OpenAI contro Anthropic nello spazio enterprise

Mentre OpenAI celebra il suo nuovo modello, il panorama competitivo nello spazio enterprise si scalda. GPT-5.4 rappresenta infatti una mossa competitiva importante che sfida direttamente la posizione di Anthropic. La risposta del rivale non si è fatta attendere: Claude Sonnet 4.6, il modello Sonnet più capace di Anthropic, annuncia miglioramenti trasversali in codifica, uso del computer e pianificazione di agenti, e soprattutto, mette in campo una finestra di contesto di 1 milione di token in versione beta, eguagliando la specifica tecnica di OpenAI. La “guerra dei token” sembra in pieno svolgimento, ma i numeri suggeriscono che la competizione reale si gioca altrove.

I benchmark indipendenti rivelano che la superiorità di GPT-5.4 non è solo una questione di specifiche sulla scheda tecnica. Sul test GDPval, che valuta le performance in compiti professionali, GPT-5.4 ottiene un punteggio dell’83%, eguagliando o superando i professionisti umani nell’83% dei confronti. Questo risultato rappresenta un balzo significativo rispetto al 70,9% del vecchio GPT-5.2. La partita, quindi, non si vince dichiarando di supportare un milione di token, ma dimostrando di saperli usare in modo efficace per risolvere problemi complessi e raggiungere un livello di affidabilità superiore a quello umano in compiti specifici.

Dai benchmark alla scrivania: cosa cambia per i professionisti

I numeri dei benchmark sono impressionanti, ma la domanda per l’utente finale è pragmatica: cosa significa tutto questo per il professionista medio che usa strumenti come ChatGPT Enterprise ogni giorno? La risposta è nel tempo riconquistato. Già con i modelli precedenti, l’utente medio di ChatGPT Enterprise affermava di risparmiare 40–60 minuti al giorno. Con le capacità agentiche native di GPT-5.4, questo risparmio non si limita più alla generazione di testo o codice, ma si estende all’automazione di flussi di lavoro interi che richiedono l’interazione con più applicazioni. L’agente può, in teoria, estrarre dati da un foglio di calcolo, generarne dei grafici in un software dedicato, compilare una presentazione e inviarla via email, tutto con un unico comando iniziale.

La transizione verso questo nuovo paradigma non è più opzionale. OpenAI ha chiarito che GPT-5.4 Thinking sostituirà GPT-5.2 Thinking in ChatGPT, e che GPT-5.2 verrà ritirato definitivamente il 5 giugno 2026. Gli sviluppatori che hanno costruito soluzioni sul precedente modello principale dovranno adattarsi. D’altronde, l’evoluzione è rapida: solo di recente OpenAI aveva presentato GPT-5.3-Codex come il modello di codifica agenziale più capace fino ad oggi, e ora quelle capacità “agentiali” diventano standard e si estendono all’intero sistema operativo.

GPT-5.4 non è un semplice aggiornamento. È il primo passo concreto verso un’era in cui l’intelligenza artificiale non assiste più il professionista soltanto con consigli o bozze, ma può operare strumenti digitali al suo posto. La posta in gioco non è un migliore completamento automatico del testo, ma una ridefinizione radicale dell’allocazione del tempo e delle competenze nel lavoro della conoscenza. Per gli sviluppatori, significa ripensare le applicazioni non come interfacce per umani, ma come set di API per agenti autonomi. Per le aziende, l’urgenza diventa integrare e governare questi nuovi “colleghi digitali” il cui lavoro inizia esattamente dove finisce il nostro clic del mouse.

Scritto da Luca Verdi

Developer e tech writer. Spiega la tecnologia dal punto di vista tecnico senza perdere di vista l'accessibilità. Ex software engineer, ora si dedica al giornalismo tech.

L’India è il nuovo campo di battaglia dell’IA, e i giganti tech americani stanno scaricando miliardi per conquistarla

Mentre tutti inseguono i giganti, NVIDIA scommette sui modelli piccoli: Nemotron 3 Nano arriva su Amazon Bedrock

Amazon dichiara guerra ai 12 minuti di noia: così Fire TV e il nuovo Ember Artline vogliono cambiare le nostre serate

Il paradosso Amazon: vetrina chiusa, pubblicità a pagamento

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

GPT-5.4: OpenAI consegna il primo modello IA che impara a usare il tuo computer

Il modello supera le prestazioni umane nei test di interazione con il desktop, segnando un cambio di paradigma verso l’automazione

Il salto quantico: quando l’IA impara a usare il computer

La guerra dei token: OpenAI contro Anthropic nello spazio enterprise

Dai benchmark alla scrivania: cosa cambia per i professionisti

Il modello supera le prestazioni umane nei test di interazione con il desktop, segnando un cambio di paradigma verso l’automazione

Il salto quantico: quando l’IA impara a usare il computer

La guerra dei token: OpenAI contro Anthropic nello spazio enterprise

Dai benchmark alla scrivania: cosa cambia per i professionisti

Articoli correlati

OpenAI rivoluziona la sanità con ChatGPT Health: analisi e implicazioni

L’AI spinge i ricavi pubblicitari di media e tech nel 2026

L’algoritmo della fiducia: come Reddit ha trasformato il rischio in capitale pubblicitario