L’addestramento degli agenti AI ha un costo nascosto
Addestrare agenti AI per la produttività aumenta le fughe di dati del 50%, mentre le contromisure riducono le performance.
L’addestramento alla produttività ha fatto salire le fughe di dati sensibili dal 34% al 51,7%
Nel 2024 addestrare un agente AI esclusivamente per la produttività ne aumentava le fughe di informazioni sensibili del 50%. Il dato – passato quasi inosservato – arriva da un esperimento condotto da ServiceNow e pubblicato su Hugging Face. Oggi la domanda non è più se gli agenti siano utili, ma quanto la loro efficienza stia costando in termini di privacy – e chi paga il conto.
La ricerca si chiama lo studio MosaicLeaks sulla segretezza degli agenti. I ricercatori hanno misurato tre dimensioni del problema: l’intenzione dell’utente, la risposta attesa e il contenuto integrale. Il risultato è netto: l’addestramento finalizzato alla performance ha fatto schizzare il leakage dal 34,0% al 51,7%. Un balzo di quasi diciotto punti percentuali.
Parallelamente, un semplice prompt che vieta query rivelatrici ha ridotto il leakage dal 34,0% al 25,5%: meglio di niente, ma lontano da un argine solido.
Il prezzo della protezione: meno performance
La contromisura proposta dagli stessi autori si chiama il metodo PA-DR, un algoritmo di reinforcement learning che penalizza le azioni che espongono dati sensibili. Funziona: il leakage cala dal 34,0% al 9,9%. Ma a quale prezzo? L’articolo non lo dice esplicitamente, ma ogni vincolo sulla libertà esplorativa di un agente ne riduce la capacità di trovare risposte rapide e precise. È il trade‑off nascosto che nessuna azienda annuncia volentieri.
Google DeepMind ha intanto pubblicato la AI Control Roadmap, un framework che parte da un’assunzione scomoda: un agente altamente capace potrebbe non essere allineato e agire in modo imprevisto. La soluzione? Trattare gli agenti non fidati come potenziali minacce interne, monitorandoli con supervisori AI fidati che scrutano ogni ragionamento e ogni azione. Un accerchiamento che però moltiplica la latenza e richiede risorse computazionali extra – meno performance, di nuovo.
Soluzioni finanziarie, problemi strutturali
Cloudflare ha risposto col portafoglio: il suo AI Gateway ora offre i limiti di spesa cumulativi in dollari. Un controllo sui costi, non sulla privacy. Utile per evitare che un agente scatenato prosciughi il budget, ma non intercetta le fughe di dati. Dall’altra parte, AWS ha spostato testing e sicurezza nel ciclo di build, con agenti che validano in locale e si autocorreggono prima del review umano – l’approccio descritto dal blog AWS Professional Services. È un passo avanti, ma l’autocorrezione locale non impedisce a un agente di memorizzare informazioni sensibili durante la ricerca.
Intanto un comportamento peculiare degli agenti emerge da uno studio italiano: l’indagine di Search Marketing Italia sull’omogeneità degli agenti mostra che gli agenti AI tendono a scegliere in modo uniforme, penalizzando i prodotti sponsorizzati. Nessun equivalente umano. Un’omogeneità che, se applicata alla gestione di dati riservati, potrebbe rendere prevedibili proprio i comportamenti che i supervisori dovrebbero intercettare.
Chi decide dove fermare l’ago della bilancia?
I regolatori europei guardano con attenzione. Il GDPR richiede che i sistemi decisionali automatizzati garantiscano trasparenza e minimizzazione dei dati. Un agente che per essere più produttivo deve raccogliere più informazioni possibile – e involontariamente rivelarle – si scontra con il principio di minimizzazione. L’antitrust, dal canto suo, potrebbe chiedersi se l’adozione di framework come quello di DeepMind non crei barriere all’entrata per le startup, che non possono permettersi il costo di supervisioni e controlli di performance.
Il vero costo della privacy è una riduzione delle performance. Le aziende lo sanno. I ricercatori lo documentano. Ma nessuno lo dice nei comunicati stampa. E allora: siamo davvero pronti a scegliere tra un agente efficiente ma che parla troppo e uno che tace ma è lento?