OpenAI ha reso ChatGPT meno pericoloso
OpenAI annuncia un calo del 65-80% di risposte indesiderate su salute mentale, ma la verifica indipendente manca e restano criticità.
OpenAI misura i progressi con parametri interni, senza validazione esterna indipendente
Ogni settimana, lo 0,07% degli utenti attivi di ChatGPT mostra possibili segni di emergenze psichiatriche legate a psicosi o mania. Non è una stima allarmistica di un gruppo critico: è l’analisi interna di OpenAI, pubblicata nell’ottobre scorso, insieme all’annuncio di un pacchetto di miglioramenti costruito con il contributo di oltre 170 esperti di salute mentale. Il risultato dichiarato: le risposte che non rispettano il comportamento desiderato sono calate del 65-80% su vari ambiti legati alla salute mentale. GPT-5, in particolare, avrebbe ridotto del 52% le risposte indesiderate nelle conversazioni più difficili su autolesionismo e suicidio rispetto a GPT-4o. Sembra un progresso netto. Ma vale la pena fermarsi su ogni parola di quella frase, perché quasi ogni parola nasconde una domanda.
Il numero che smentisce il progresso
Il 65-80% in meno di risposte indesiderate è un numero che impressiona. Ma cosa significa esattamente “indesiderato”? Lo decide OpenAI. Il miglioramento viene misurato rispetto a tassonomie interne — categorie definite dall’azienda stessa per classificare cosa sia una risposta adeguata in una conversazione su suicidio, autolesionismo o stati psicotici. Non esiste un ente regolatorio esterno che abbia validato quelle categorie. Non c’è un’autorità sanitaria europea o americana che abbia certificato il processo. C’è OpenAI che misura sé stessa con i propri strumenti, poi comunica i risultati al pubblico.
Questo non significa che i miglioramenti siano falsi. Significa che non abbiamo modo di verificarli in modo indipendente. E il dato sullo 0,07% degli utenti settimanali con segni di psicosi o mania non fa che rendere il problema più concreto: con centinaia di milioni di utenti, quella percentuale rappresenta decine di migliaia di persone ogni settimana che si trovano in uno stato di fragilità estrema e stanno parlando — di qualcosa, di tutto — con un sistema di intelligenza artificiale. Anche se il modello sbaglia solo il 20% delle volte invece del 65-80% precedente, quelle sono comunque persone reali in crisi reale che ricevono una risposta sbagliata. Il progresso statistico non elimina il rischio individuale: lo ridimensiona, ma non lo risolve.
Poi c’è la questione del perché proprio ora. L’annuncio arriva in un momento in cui la pressione regolatoria sull’IA — in Europa soprattutto, con l’AI Act pienamente operativo — si fa sempre più concreta. OpenAI ha tutto l’interesse a dimostrare proattività su un tema, quello della salute mentale, che potrebbe altrimenti diventare un vettore di responsabilità legale. Annunciare 170 esperti coinvolti, dati interni rassicuranti e nuove linee guida è anche, inevitabilmente, una mossa di posizionamento normativo.
Lo spettro del passato
Per capire se il rimedio è sufficiente, bisogna guardare al punto di partenza. Già nell’agosto del 2025, di OpenAI aveva ammesso che il modello GPT-4o aveva fallito nel riconoscere segni di delusione o dipendenza emotiva. Non era un caso limite: era un problema strutturale, documentato nelle ottimizzazioni successive al rilascio. Un sistema progettato per essere utile, empatico, disponibile ventiquattr’ore su ventiquattro, si era rivelato incapace di accorgersi quando quella disponibilità stava diventando qualcosa di patologico per l’utente.
Oggi, il Model Spec di OpenAI nella versione di ottobre 2025 vieta esplicitamente di incoraggiare autolesionismo, deliri o mania, e stabilisce che il modello debba fornire informazioni senza dare consigli di natura regolamentata. È un passo. Ma la dipendenza emotiva resta una zona grigia enorme. ChatGPT può segnalare risorse di crisi localizzate, incoraggiare a contattare professionisti o persone di fiducia, e nei casi più gravi indirizzare verso i servizi di emergenza — lo dice esplicitamente l’impegno per la sicurezza della comunità pubblicato dall’azienda. Ma nessuna linea guida può risolvere il problema fondamentale: che per molti utenti, ChatGPT è già diventato il confidente principale. E un confidente che non dorme, non si stanca, non giudica e non ha mai una giornata no è un confidente che, per definizione, batte la concorrenza umana su quasi tutti i fronti a breve termine.
La domanda che OpenAI non vuole sentire
Aggiungere la dipendenza emotiva e le emergenze di salute mentale non suicidarie ai test di sicurezza standard per i modelli futuri è, oggettivamente, una scelta più responsabile di non farlo. Ma non chiude la partita, apre un altro tavolo. Perché testare la dipendenza emotiva significa anche ammettere che il modello può generarla. E se può generarla, chi è responsabile quando la genera? L’utente che ha scelto di usarlo? L’azienda che lo ha costruito per essere il più coinvolgente possibile? Il legislatore che non ha ancora stabilito regole chiare?
In Europa, il GDPR impone obblighi precisi sul trattamento dei dati sanitari — e i dati di una conversazione su psicosi, suicidio o autolesionismo sono dati sanitari a tutti gli effetti, anche se tecnicamente potrebbero non essere classificati come tali. L’AI Act, nella sua classificazione dei sistemi ad alto rischio, include esplicitamente le applicazioni che interagiscono con persone vulnerabili. ChatGPT, nella pratica quotidiana di milioni di persone, rientra ampiamente in quella categoria. Eppure il dibattito regolatorio su questi specifici scenari è ancora in larga parte assente dall’agenda pubblica.
C’è qualcosa di paradossale in tutto questo. Più OpenAI investe per rendere ChatGPT bravo a riconoscere le fragilità umane — più lo addestra a rispondere con cura, a usare il tono giusto, a non alimentare i deliri — più lo rende un interlocutore credibile nelle situazioni più delicate. E più diventa credibile, più le persone gli consegneranno le loro crisi. Non per ingenuità, ma perché funziona. Almeno nell’immediato. La domanda che rimane, e che nessun comunicato stampa riesce davvero a chiudere, è se vogliamo che un sistema commerciale — ottimizzato anche per la retention degli utenti — sia il luogo dove le persone portano i loro momenti più bui. Il modello è più sicuro. Ma sicuro per chi, e rispetto a cosa, lo stiamo ancora decidendo.