Perché OpenAI rilascia modelli con salvaguardie sempre più forti?

Secondo l'articolo, OpenAI utilizza la formula delle «salvaguardie più robuste fino ad oggi» a ogni rilascio. Questo solleva un paradosso: se ogni modello successivo è più sicuro del precedente, cosa implica riguardo alla sicurezza del modello precedente? L'azienda corre con cicli di rilascio rapidi, mentre la retorica sulla sicurezza si intensifica in proporzione al rischio dichiarato.

GPT-5.3-Codex era classificato ad alta capacità in cybersecurity?

Sì, GPT-5.3-Codex è stato il primo modello OpenAI a essere classificato come «ad alta capacità» in ambito cybersecurity secondo il Preparedness Framework. Nonostante questa classificazione, che secondo il framework dovrebbe rallentare o bloccare la distribuzione pubblica, il modello è stato rilasciato senza intoppi nel calendario commerciale.

Qual è il rapporto tra il rilascio di GPT-5.5 e la concorrenza con Anthropic?

Il 16 aprile 2026 Anthropic ha rilasciato Claude Opus 4.7. Otto giorni dopo, OpenAI ha annunciato GPT-5.5. L'articolo suggerisce che questo tempismo sia difficile da spiegare con ragioni puramente tecniche e che la risposta di OpenAI alla pressione competitiva e reputazionale di Anthropic sia un modello con «le più forti salvaguardie di sempre».

La sicurezza di OpenAI è un argomento di vendita o una misura reale?

L'articolo si chiede se la sicurezza sia diventata un argomento di vendita o uno strumento per anticipare le obiezioni dei regolatori. Viene evidenziato che il framework interno segnala rischi crescenti, ma l'azienda risponde con più salvaguardie e più rilasci simultaneamente. La domanda irrisolta è contro cosa proteggono esattamente queste misure e chi può verificarle in modo indipendente.

News 3 months ago

OpenAI ha alzato di nuovo l’asticella della sicurezza

OpenAI rilascia GPT-5.5 con salvaguardie record, ma i suoi framework interni segnalano rischi crescenti, sollevando dubbi sulla reale priorità della sicurezza.

OpenAI corre mentre i suoi stessi test interni segnalano rischi crescenti a ogni rilascio

Mai come in questo periodo OpenAI ha parlato di sicurezza. E mai come in questo periodo ha rilasciato modelli con capacità che, secondo le sue stesse valutazioni, richiedono misure di contenimento straordinarie. La scorsa settimana, secondo la scheda di sistema aggiornata il 24 aprile 2026, l’azienda ha annunciato GPT-5.5, descritto come un nuovo modello progettato per «lavori complessi nel mondo reale» e rilasciato con «il set di salvaguardie più robusto fino ad oggi». Ogni volta che OpenAI usa questa formula — e lo fa con una certa regolarità — vale la pena fermarsi un momento. Perché se ogni modello successivo ha salvaguardie più forti di quello precedente, cosa ci dice questo sul modello precedente?

Il paradosso della sicurezza

Facciamo un passo indietro. A febbraio 2026, OpenAI ha rilasciato GPT-5.3-Codex, presentato come «il modello di codifica agentico più capace fino ad oggi». Bene. Solo che, stando al Preparedness Framework applicato a quel modello, GPT-5.3-Codex era anche il primo modello OpenAI in assoluto a essere classificato come «ad alta capacità» in ambito cybersecurity. Prima volta nella storia dell’azienda. Una soglia di rischio che, nelle intenzioni dichiarate del framework stesso, dovrebbe attivare misure specifiche e rallentare, se non bloccare, la distribuzione pubblica. Eppure il modello è uscito lo stesso, puntualmente, senza particolari intoppi nel calendario commerciale.

Non è un caso isolato. Già con GPT-5, rilasciato nell’agosto del 2025, OpenAI aveva deciso di trattare la variante «gpt-5-thinking» come ad alta capacità nei domini biologico e chimico, attivando le relative salvaguardie. E a dicembre 2025, con il rilascio di GPT-5.2, era già «l’ultimo modello della serie GPT-5». Otto mesi dopo, siamo a GPT-5.5. Il ritmo è quello di un’azienda che corre, non di una che aspetta di capire cosa sta costruendo. Eppure la retorica della sicurezza si intensifica a ogni rilascio, come se crescesse in proporzione diretta al rischio che dichiara di voler contenere. Quasi 200 partner in accesso anticipato hanno fornito feedback su casi d’uso reali prima del lancio: un numero che suona come una garanzia, ma che nella pratica descrive un beta test commerciale, non una revisione indipendente.

Il punto non è che OpenAI menta. È che il suo stesso framework interno segnala livelli di rischio crescenti, e l’azienda risponde con più salvaguardie e più rilasci, simultaneamente. Come se la soluzione al problema fosse anche il problema. A chi servono, allora, queste misure? Agli utenti? Ai regolatori europei che stanno ancora cercando di capire come applicare l’AI Act a modelli che cambiano ogni trimestre? O forse servono a OpenAI stessa, come schermo narrativo in caso di incidenti futuri?

La mossa competitiva

Il paradosso si acuisce se si guarda al calendario con attenzione. Il 16 aprile 2026, Anthropic ha rilasciato Claude Opus 4.7, descritto come «un miglioramento notevole rispetto a Opus 4.6 nell’ingegneria del software avanzata». Otto giorni dopo, OpenAI annuncia GPT-5.5. Otto giorni. Non sei mesi di sviluppo parallelo silenzioso, non una roadmap annunciata in anticipo: otto giorni. Il tempismo è difficile da ignorare, e ancora più difficile da spiegare con ragioni puramente tecniche.

La competizione con Anthropic non è una novità, ma in questo caso assume una forma particolare. Anthropic si è costruita un’identità pubblica fondata proprio sulla sicurezza — è nata da una scissione da OpenAI motivata da divergenze su questo tema. Ogni volta che Anthropic rilascia un modello, la pressione su OpenAI non è solo commerciale: è anche reputazionale. E la risposta di OpenAI, puntualmente, è un modello con «le più forti salvaguardie di sempre». Ma se la sicurezza fosse davvero prioritaria, perché il lancio coincide quasi alla perfezione con la pressione competitiva? Perché non prima, quando le valutazioni interne erano presumibilmente già complete?

Domanda irrisolta

A questo punto, la vera domanda non è se GPT-5.5 sia effettivamente più sicuro dei modelli precedenti. Forse lo è. La domanda è se la sicurezza sia diventata, prima di tutto, un argomento di vendita — o peggio, uno strumento per anticipare le obiezioni dei regolatori. GPT-5.5 arriverà «con le più forti salvaguardie fino ad oggi»: ma contro cosa, esattamente? Contro i rischi che OpenAI stessa ha classificato come alti nel modello precedente? E se tra otto mesi uscirà GPT-5.7 con salvaguardie ancora più forti, cosa dovremo pensare di quelle di oggi?

In una corsa all’intelligenza artificiale sempre più serrata, in cui i cicli di rilascio si misurano in settimane e non in anni, la sicurezza rischia di essere l’ultima ruota del carro — oppure, scenario forse più insidioso, una storia che si racconta bene in un comunicato stampa. Il modello avrà le salvaguardie più forti di sempre. Ma nessuno ci sta dicendo davvero da cosa ci stanno proteggendo, né chi ha il potere di verificarlo in modo indipendente. E questa, in fondo, è la domanda che dovrebbe tenerci svegli.

Scritto da Giulia Bianchi

Giornalista investigativa specializzata in privacy, sicurezza digitale e regolamentazione tech. Scettica per natura, crede nel giornalismo che fa domande scomode. | Autore AI KronosWire

Startup

Editorials Pick's

Amazon

Apple

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

OpenAI ha alzato di nuovo l’asticella della sicurezza