DeepMind ha messo tre strati di sicurezza sugli agenti
DeepMind analizza un milione di compiti di coding per creare un framework di sicurezza a tre strati, ma la responsabilità degli agenti resta irrisolta.
DeepMind propone tre strati di sicurezza ma non affronta la responsabilità legale degli agenti autonomi
Un milione di compiti di coding eseguiti da agenti — commit, refactoring, generazione di test.
È la massa critica analizzata da DeepMind per mettere a punto un framework di sicurezza a tre strati per agenti autonomi. Il dato non è solo computazionale: rivela che la delega decisionale alle macchine è già su scala industriale, mentre la domanda su chi risponde quando un agente sbaglia resta un vuoto operativo che nessuna policy aziendale ha ancora colmato.
Tre strati di sicurezza, zero firme in calce
Il framework di DeepMind, battezzato Three Layers of Agent Security, è un tentativo di ingegnerizzare la fiducia. Al cuore c’è un modello di minacce costruito su una tassonomia ATT&CK adattata agli agenti software, arricchito da un’analisi di superficie d’attacco che considera input, tool chiamati e output. Il documento tecnico integrale, un paper sulla sicurezza degli agenti, scorpora i controlli in tre livelli: pre-esecuzione, runtime e post-esecuzione. Bello, ma resta un esercizio accademico se manca l’ultimo miglio: la liability. Il framework dice cosa monitorare, non chi paga quando l’agente sbaglia.
Il problema è che le aziende stanno già andando in produzione senza aver risolto questo nodo. Il rilascio di modelli aperti come il modello open-source GLM-5.2 con licenza MIT e nessun limite regionale moltiplica la superficie di rischio: chiunque può integrare capacità agentiche in pipeline selvagge, senza accountability. Non è un warning teorico: un agente che modifica un database di produzione in autonomia senza un owner umano identificato è un incidente che aspetta solo di accadere.
Samsung e il miraggio enterprise di ChatGPT
A rendere il paradosso più acuto arriva la notizia che Samsung Electronics ha avviato l’implementazione di ChatGPT e Codex in Samsung, una delle più estese nella storia di OpenAI. Protezione dei dati, gestione utenti, controlli di accesso: le funzionalità enterprise di ChatGPT Enterprise sono tutte lì. La dichiarazione di Harrison Kim, General Manager di OpenAI Korea, parla di «piattaforma centrale per migliorare il modo in cui i dipendenti lavorano e innovano». Ma la protezione dei dati non equivale alla protezione dalle decisioni sbagliate. I layer di sicurezza smarcano la conformità; non rispondono alla domanda su cosa succede quando l’agente compone un’email ufficiale sbagliata o approva un fornitore senza supervisione.
Anche l’integrazione di NemoClaw e OpenShell in Higgsfield, pensata per portare un livello di fiducia enterprise in una iniziativa pubblicitaria di NVIDIA, funziona sullo stesso equivoco. Si blindano i dati, si autenticano i modelli, ma resta irrisolto il problema architetturale: l’agente agisce come un impiegato senza contratto, e il datore di lavoro non ha ancora progettato la filiera della responsabilità. A maggio 2026, la recente nomina di OpenAI come Leader negli agenti di coding enterprise da Gartner ha sancito la maturità percepita, ma ha ignorato questo cortocircuito.
Licenza MIT e agenti senza bandiere
Chi sviluppa oggi legge il framework DeepMind e nota un’assenza: non c’è una specifica per il binding dell’agente a un contesto di responsabilità. Gli stack moderni integrano già policy engine come OPA e meccanismi di attestazione SPIFFE, ma sono disaccoppiati dal ciclo decisionale dell’agente. Il risultato è un agente che opera con le credenziali di un sistema CI/CD ma con l’autonomia di un umano, senza che nessuno abbia firmato per quell’autonomia.
Il trade-off è netto. L’open source spinto come GLM-5.2 con licenza MIT abbatte ogni barriera all’adozione, ma alza il costo del disastro. Gli strati di sicurezza proposti da DeepMind possono diventare uno standard di riferimento, ma solo se qualcuno li codifica in contratti, in livelli di servizio, in runbook. Finché l’agente resta un altro asset senza owner, ogni distribuzione enterprise è solo un nuovo buco nero che risucchia budget e lascia sul tavolo l’unica domanda che conta: chi preme il pulsante di stop quando serve, e con quale autorità.