OpenAI ha alzato di nuovo l’asticella della sicurezza
OpenAI rilascia GPT-5.5 con salvaguardie record, ma i suoi framework interni segnalano rischi crescenti, sollevando dubbi sulla reale priorità della sicurezza.
OpenAI corre mentre i suoi stessi test interni segnalano rischi crescenti a ogni rilascio
Mai come in questo periodo OpenAI ha parlato di sicurezza. E mai come in questo periodo ha rilasciato modelli con capacità che, secondo le sue stesse valutazioni, richiedono misure di contenimento straordinarie. La scorsa settimana, secondo la scheda di sistema aggiornata il 24 aprile 2026, l’azienda ha annunciato GPT-5.5, descritto come un nuovo modello progettato per «lavori complessi nel mondo reale» e rilasciato con «il set di salvaguardie più robusto fino ad oggi». Ogni volta che OpenAI usa questa formula — e lo fa con una certa regolarità — vale la pena fermarsi un momento. Perché se ogni modello successivo ha salvaguardie più forti di quello precedente, cosa ci dice questo sul modello precedente?
Il paradosso della sicurezza
Facciamo un passo indietro. A febbraio 2026, OpenAI ha rilasciato GPT-5.3-Codex, presentato come «il modello di codifica agentico più capace fino ad oggi». Bene. Solo che, stando al Preparedness Framework applicato a quel modello, GPT-5.3-Codex era anche il primo modello OpenAI in assoluto a essere classificato come «ad alta capacità» in ambito cybersecurity. Prima volta nella storia dell’azienda. Una soglia di rischio che, nelle intenzioni dichiarate del framework stesso, dovrebbe attivare misure specifiche e rallentare, se non bloccare, la distribuzione pubblica. Eppure il modello è uscito lo stesso, puntualmente, senza particolari intoppi nel calendario commerciale.
Non è un caso isolato. Già con GPT-5, rilasciato nell’agosto del 2025, OpenAI aveva deciso di trattare la variante «gpt-5-thinking» come ad alta capacità nei domini biologico e chimico, attivando le relative salvaguardie. E a dicembre 2025, con il rilascio di GPT-5.2, era già «l’ultimo modello della serie GPT-5». Otto mesi dopo, siamo a GPT-5.5. Il ritmo è quello di un’azienda che corre, non di una che aspetta di capire cosa sta costruendo. Eppure la retorica della sicurezza si intensifica a ogni rilascio, come se crescesse in proporzione diretta al rischio che dichiara di voler contenere. Quasi 200 partner in accesso anticipato hanno fornito feedback su casi d’uso reali prima del lancio: un numero che suona come una garanzia, ma che nella pratica descrive un beta test commerciale, non una revisione indipendente.
Il punto non è che OpenAI menta. È che il suo stesso framework interno segnala livelli di rischio crescenti, e l’azienda risponde con più salvaguardie e più rilasci, simultaneamente. Come se la soluzione al problema fosse anche il problema. A chi servono, allora, queste misure? Agli utenti? Ai regolatori europei che stanno ancora cercando di capire come applicare l’AI Act a modelli che cambiano ogni trimestre? O forse servono a OpenAI stessa, come schermo narrativo in caso di incidenti futuri?
La mossa competitiva
Il paradosso si acuisce se si guarda al calendario con attenzione. Il 16 aprile 2026, Anthropic ha rilasciato Claude Opus 4.7, descritto come «un miglioramento notevole rispetto a Opus 4.6 nell’ingegneria del software avanzata». Otto giorni dopo, OpenAI annuncia GPT-5.5. Otto giorni. Non sei mesi di sviluppo parallelo silenzioso, non una roadmap annunciata in anticipo: otto giorni. Il tempismo è difficile da ignorare, e ancora più difficile da spiegare con ragioni puramente tecniche.
La competizione con Anthropic non è una novità, ma in questo caso assume una forma particolare. Anthropic si è costruita un’identità pubblica fondata proprio sulla sicurezza — è nata da una scissione da OpenAI motivata da divergenze su questo tema. Ogni volta che Anthropic rilascia un modello, la pressione su OpenAI non è solo commerciale: è anche reputazionale. E la risposta di OpenAI, puntualmente, è un modello con «le più forti salvaguardie di sempre». Ma se la sicurezza fosse davvero prioritaria, perché il lancio coincide quasi alla perfezione con la pressione competitiva? Perché non prima, quando le valutazioni interne erano presumibilmente già complete?
Domanda irrisolta
A questo punto, la vera domanda non è se GPT-5.5 sia effettivamente più sicuro dei modelli precedenti. Forse lo è. La domanda è se la sicurezza sia diventata, prima di tutto, un argomento di vendita — o peggio, uno strumento per anticipare le obiezioni dei regolatori. GPT-5.5 arriverà «con le più forti salvaguardie fino ad oggi»: ma contro cosa, esattamente? Contro i rischi che OpenAI stessa ha classificato come alti nel modello precedente? E se tra otto mesi uscirà GPT-5.7 con salvaguardie ancora più forti, cosa dovremo pensare di quelle di oggi?
In una corsa all’intelligenza artificiale sempre più serrata, in cui i cicli di rilascio si misurano in settimane e non in anni, la sicurezza rischia di essere l’ultima ruota del carro — oppure, scenario forse più insidioso, una storia che si racconta bene in un comunicato stampa. Il modello avrà le salvaguardie più forti di sempre. Ma nessuno ci sta dicendo davvero da cosa ci stanno proteggendo, né chi ha il potere di verificarlo in modo indipendente. E questa, in fondo, è la domanda che dovrebbe tenerci svegli.