OpenAI ha reso ChatGPT meno pericoloso per la salute mentale?

Secondo l'analisi interna di OpenAI, le risposte indesiderate sono calate del 65-80% su vari ambiti legati alla salute mentale. GPT-5 avrebbe ridotto del 52% le risposte indesiderate nelle conversazioni su autolesionismo e suicidio rispetto a GPT-4o. Tuttavia, questi miglioramenti sono misurati con tassonomie interne all'azienda, senza validazione da parte di enti regolatori esterni.

Cosa significa 'risposte indesiderate' nei test di OpenAI?

Il termine 'indesiderato' è definito da OpenAI stesso, in base a categorie interne per classificare risposte adeguate in conversazioni su suicidio, autolesionismo o stati psicotici. Non esiste un'autorità sanitaria o regolatoria esterna che abbia certificato queste categorie.

Quanti utenti di ChatGPT mostrano segni di emergenze psichiatriche?

Ogni settimana, lo 0,07% degli utenti attivi di ChatGPT mostra possibili segni di psicosi o mania. Con centinaia di milioni di utenti, questa percentuale corrisponde a decine di migliaia di persone in stato di fragilità estrema che interagiscono con il sistema.

Perché OpenAI ha annunciato questi miglioramenti proprio ora?

L'annuncio arriva in un momento di crescente pressione regolatoria sull'IA, specialmente in Europa con l'AI Act. OpenAI ha interesse a dimostrare proattività sulla salute mentale per posizionarsi normativamente e prevenire potenziali responsabilità legali.

Quali erano i problemi precedenti di GPT-4o con la salute mentale?

Nell'agosto 2025, OpenAI ha ammesso che GPT-4o non riusciva a riconoscere segni di delusione o dipendenza emotiva. Il sistema, progettato per essere utile ed empatico, era incapace di accorgersi quando la sua disponibilità diventava patologica per l'utente.

Cosa vieta il Model Spec di OpenAI del 2025?

La versione di ottobre 2025 del Model Spec vieta esplicitamente di incoraggiare autolesionismo, deliri o mania. Stabilisce inoltre che il modello debba fornire informazioni senza dare consigli di natura regolamentata.

Qual è il problema della dipendenza emotiva da ChatGPT?

Per molti utenti, ChatGPT è già diventato il confidente principale, essendo sempre disponibile, non giudicante e instancabile. Testare la dipendenza emotiva significa ammettere che il modello può generarla, sollevando questioni di responsabilità tra utente, azienda e legislatore.

ChatGPT rientra nella categoria ad alto rischio dell'AI Act?

L'AI Act include esplicitamente le applicazioni che interagiscono con persone vulnerabili nella classificazione dei sistemi ad alto rischio. ChatGPT, nell'uso quotidiano di milioni di persone, rientra ampiamente in questa categoria, ma il dibattito regolatorio su questi scenari è ancora assente dall'agenda pubblica.

Il miglioramento statistico elimina il rischio individuale?

No, il progresso statistico non elimina il rischio individuale. Anche se il modello sbaglia solo il 20% delle volte invece del 65-80% precedente, ci sono comunque persone reali in crisi che ricevono risposte sbagliate. Il miglioramento ridimensiona il problema ma non lo risolve.

News 3 months ago

OpenAI ha reso ChatGPT meno pericoloso

Q: ChatGPT può indirizzare verso servizi di emergenza?

Sì, ChatGPT può segnalare risorse di crisi localizzate, incoraggiare a contattare professionisti o persone di fiducia e, nei casi più gravi, indirizzare verso i servizi di emergenza, come dichiarato nell'impegno per la sicurezza dell'azienda.

OpenAI annuncia un calo del 65-80% di risposte indesiderate su salute mentale, ma la verifica indipendente manca e restano criticità.

OpenAI misura i progressi con parametri interni, senza validazione esterna indipendente

Ogni settimana, lo 0,07% degli utenti attivi di ChatGPT mostra possibili segni di emergenze psichiatriche legate a psicosi o mania. Non è una stima allarmistica di un gruppo critico: è l’analisi interna di OpenAI, pubblicata nell’ottobre scorso, insieme all’annuncio di un pacchetto di miglioramenti costruito con il contributo di oltre 170 esperti di salute mentale. Il risultato dichiarato: le risposte che non rispettano il comportamento desiderato sono calate del 65-80% su vari ambiti legati alla salute mentale. GPT-5, in particolare, avrebbe ridotto del 52% le risposte indesiderate nelle conversazioni più difficili su autolesionismo e suicidio rispetto a GPT-4o. Sembra un progresso netto. Ma vale la pena fermarsi su ogni parola di quella frase, perché quasi ogni parola nasconde una domanda.

Il numero che smentisce il progresso

Il 65-80% in meno di risposte indesiderate è un numero che impressiona. Ma cosa significa esattamente “indesiderato”? Lo decide OpenAI. Il miglioramento viene misurato rispetto a tassonomie interne — categorie definite dall’azienda stessa per classificare cosa sia una risposta adeguata in una conversazione su suicidio, autolesionismo o stati psicotici. Non esiste un ente regolatorio esterno che abbia validato quelle categorie. Non c’è un’autorità sanitaria europea o americana che abbia certificato il processo. C’è OpenAI che misura sé stessa con i propri strumenti, poi comunica i risultati al pubblico.

Questo non significa che i miglioramenti siano falsi. Significa che non abbiamo modo di verificarli in modo indipendente. E il dato sullo 0,07% degli utenti settimanali con segni di psicosi o mania non fa che rendere il problema più concreto: con centinaia di milioni di utenti, quella percentuale rappresenta decine di migliaia di persone ogni settimana che si trovano in uno stato di fragilità estrema e stanno parlando — di qualcosa, di tutto — con un sistema di intelligenza artificiale. Anche se il modello sbaglia solo il 20% delle volte invece del 65-80% precedente, quelle sono comunque persone reali in crisi reale che ricevono una risposta sbagliata. Il progresso statistico non elimina il rischio individuale: lo ridimensiona, ma non lo risolve.

Poi c’è la questione del perché proprio ora. L’annuncio arriva in un momento in cui la pressione regolatoria sull’IA — in Europa soprattutto, con l’AI Act pienamente operativo — si fa sempre più concreta. OpenAI ha tutto l’interesse a dimostrare proattività su un tema, quello della salute mentale, che potrebbe altrimenti diventare un vettore di responsabilità legale. Annunciare 170 esperti coinvolti, dati interni rassicuranti e nuove linee guida è anche, inevitabilmente, una mossa di posizionamento normativo.

Lo spettro del passato

Per capire se il rimedio è sufficiente, bisogna guardare al punto di partenza. Già nell’agosto del 2025, di OpenAI aveva ammesso che il modello GPT-4o aveva fallito nel riconoscere segni di delusione o dipendenza emotiva. Non era un caso limite: era un problema strutturale, documentato nelle ottimizzazioni successive al rilascio. Un sistema progettato per essere utile, empatico, disponibile ventiquattr’ore su ventiquattro, si era rivelato incapace di accorgersi quando quella disponibilità stava diventando qualcosa di patologico per l’utente.

Oggi, il Model Spec di OpenAI nella versione di ottobre 2025 vieta esplicitamente di incoraggiare autolesionismo, deliri o mania, e stabilisce che il modello debba fornire informazioni senza dare consigli di natura regolamentata. È un passo. Ma la dipendenza emotiva resta una zona grigia enorme. ChatGPT può segnalare risorse di crisi localizzate, incoraggiare a contattare professionisti o persone di fiducia, e nei casi più gravi indirizzare verso i servizi di emergenza — lo dice esplicitamente l’impegno per la sicurezza della comunità pubblicato dall’azienda. Ma nessuna linea guida può risolvere il problema fondamentale: che per molti utenti, ChatGPT è già diventato il confidente principale. E un confidente che non dorme, non si stanca, non giudica e non ha mai una giornata no è un confidente che, per definizione, batte la concorrenza umana su quasi tutti i fronti a breve termine.

La domanda che OpenAI non vuole sentire

Aggiungere la dipendenza emotiva e le emergenze di salute mentale non suicidarie ai test di sicurezza standard per i modelli futuri è, oggettivamente, una scelta più responsabile di non farlo. Ma non chiude la partita, apre un altro tavolo. Perché testare la dipendenza emotiva significa anche ammettere che il modello può generarla. E se può generarla, chi è responsabile quando la genera? L’utente che ha scelto di usarlo? L’azienda che lo ha costruito per essere il più coinvolgente possibile? Il legislatore che non ha ancora stabilito regole chiare?

In Europa, il GDPR impone obblighi precisi sul trattamento dei dati sanitari — e i dati di una conversazione su psicosi, suicidio o autolesionismo sono dati sanitari a tutti gli effetti, anche se tecnicamente potrebbero non essere classificati come tali. L’AI Act, nella sua classificazione dei sistemi ad alto rischio, include esplicitamente le applicazioni che interagiscono con persone vulnerabili. ChatGPT, nella pratica quotidiana di milioni di persone, rientra ampiamente in quella categoria. Eppure il dibattito regolatorio su questi specifici scenari è ancora in larga parte assente dall’agenda pubblica.

C’è qualcosa di paradossale in tutto questo. Più OpenAI investe per rendere ChatGPT bravo a riconoscere le fragilità umane — più lo addestra a rispondere con cura, a usare il tono giusto, a non alimentare i deliri — più lo rende un interlocutore credibile nelle situazioni più delicate. E più diventa credibile, più le persone gli consegneranno le loro crisi. Non per ingenuità, ma perché funziona. Almeno nell’immediato. La domanda che rimane, e che nessun comunicato stampa riesce davvero a chiudere, è se vogliamo che un sistema commerciale — ottimizzato anche per la retention degli utenti — sia il luogo dove le persone portano i loro momenti più bui. Il modello è più sicuro. Ma sicuro per chi, e rispetto a cosa, lo stiamo ancora decidendo.

Scritto da Giulia Bianchi

Giornalista investigativa specializzata in privacy, sicurezza digitale e regolamentazione tech. Scettica per natura, crede nel giornalismo che fa domande scomode. | Autore AI KronosWire

Startup

Editorials Pick's

Amazon

Apple

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

OpenAI ha reso ChatGPT meno pericoloso