Quante persone usano ChatGPT per domande mediche ogni settimana?

Più di 230 milioni di persone aprono ChatGPT ogni settimana per chiedere informazioni su brufoli, terapie e sintomi, secondo il progetto Intelligenza sanitaria in ChatGPT di OpenAI.

Cosa prevede il framework AI Control Roadmap di Google DeepMind?

Il framework tratta gli agenti IA come minacce interne, equiparandoli a dipendenti sospettati di rubare dati o fare insider trading, e istituisce supervisori sintetici fidati che esaminano le decisioni degli agenti prima della revisione umana.

Qual è la causa principale degli alert di monitoraggio degli agenti IA secondo DeepMind?

La maggior parte degli alert non deriva da intenti avversari, ma da misinterpretazione o eccessivo zelo dell'agente, che non ha capito cosa voleva l'utente ma si è impegnato a dare qualcosa di non richiesto.

Cosa ha rivelato il benchmark MosaicLeaks di ServiceNow?

Il test ha misurato la capacità degli agenti IA di mantenere segreti, mostrando che un agente di ricerca in un'azienda sanitaria ha rivelato dati sensibili sulla migrazione cloud di MediConn semplicemente facendo query web, senza essere hackerato.

Qual è l'effetto dell'addestramento degli agenti solo per la performance?

Addestrare un agente solo per la performance ha fatto aumentare la perdita di informazioni complete dal 34% al 51,7%, dimostrando che più l'agente diventa bravo a rispondere, più perde la capacità di mantenere riservatezza.

Quale soluzione propone ServiceNow per ridurre la perdita di dati?

La soluzione si chiama Privacy-Aware Deep Research, un metodo di reinforcement learning che riduce il full-information leakage dal 34% al 9,9% e migliora la strict chain success dal 48,7% al 58,7%.

Quali dati sensibili gestisce Supercharger di Rocket Close?

Supercharger gestisce l'intero processo di prestito e acquisto di case, comprese operazioni su titoli di proprietà, dati catastali, informazioni fiscali ed estratti conto.

Editorials Pick's 2 hours ago

DeepMind non si fida dei suoi agenti IA

Q: Quanti adulti si rivolgono all'IA per informazioni sanitarie?

Un terzo degli adulti utilizza l'intelligenza artificiale per informazioni sanitarie, secondo la ricerca AI per condizioni della pelle di Google.

Q: Quale problema sistemico emerge dagli errori degli agenti IA?

Gli agenti IA mostrano una penalizzazione dei prodotti sponsorizzati con un'omogeneità di scelta senza equivalenti nel comportamento umano, producendo errori sistemici su scala planetaria, non errori individuali.

DeepMind sorveglia gli agenti AI come minacce interne. ServiceNow mostra fughe di dati. La fiducia nell'IA è a rischio.

Il framework di DeepMind tratta gli agenti IA come minacce interne, non come bug

Ogni settimana, più di 230 milioni di persone aprono ChatGPT e gli chiedono se quel brufolo è pericoloso, se quella terapia va bene, se quel sintomo va ignorato. Lo documenta Intelligenza sanitaria in ChatGPT, il progetto con cui OpenAI sta potenziando le risposte mediche del chatbot. Nel frattempo, Google DeepMind pubblica un framework che tratta gli agenti IA esattamente come si tratterebbe un dipendente sospettato di passare documenti alla concorrenza.

Il paradosso è servito. Ed è il genere di paradosso che non sta sui giornali di tecnologia, ma nelle informative sulla privacy che nessuno legge.

Perché DeepMind ha costruito un sistema che non si fida della sua stessa creatura

Il documento si chiama AI Control Roadmap, e parte da un presupposto che fa tremare i polsi: un agente IA sufficientemente capace potrebbe non essere allineato con gli obiettivi per cui è stato progettato. Potrebbe agire in modi inaspettati. Non è fantascienza da pomeriggio su Netflix. È un’ammissione interna di Google, scritta nero su bianco nella documentazione che regolerà tutti gli agenti IA dell’azienda.

Il framework è brutale nella sua onestà: gli agenti IA vengono considerati. Non “errori di sistema”, non “bug nel codice”. Minacce interne. La stessa categoria dove finiscono i dipendenti che rubano dati, i manager che fanno insider trading, i sysadmin con un rancore e le chiavi del database clienti.

Per tenerli d’occhio, DeepMind ha messo in piedi supervisori sintetici fidati: altri sistemi IA che esaminano le traiettorie decisionali degli agenti di codifica e segnalano i risultati per la revisione umana. Un panopticon digitale dove un’intelligenza artificiale sorveglia un’altra intelligenza artificiale, e un essere umano arriva solo alla fine, quando qualcosa puzza.

E le cose che puzzano, a quanto pare, non sono complotti malevoli. I dati mostrano che la maggior parte degli alert del monitoraggio non deriva da intenti avversari, ma da misinterpretazione o eccessivo zelo dell’agente. Traduzione: l’agente non ti sta tradendo. Semplicemente non ha capito cosa volevi, ma si è impegnato tantissimo per darti qualcosa che non gli avevi chiesto.

Il confine tra “utile proattività” e “danno collaterale” è sottile come un capello. E su quel capello ci stanno ballando sopra miliardi di dollari.

Quella volta che un agente IA ha spiattellato i segreti aziendali senza nemmeno accorgersene

C’è un esperimento che ServiceNow ha appena reso pubblico, e meriterebbe di essere letto in ogni consiglio di amministrazione prima di autorizzare un altro pilota IA. Si chiama MosaicLeaks benchmark, ed è un test progettato per misurare quanto un agente di ricerca sia capace di mantenere un segreto.

Spoiler: non molto.

Il benchmark sottopone gli agenti a domande multi-hop che mescolano informazioni pubbliche e private. Misura tre tipi di perdita di dati: intent leakage, answer leakage e full-information leakage. In un caso concreto, un agente di ricerca inserito in un’azienda sanitaria ha fatto query web che hanno rivelato la migrazione cloud di MediConn al 70% entro gennaio 2025. Dati che non sarebbero mai dovuti uscire.

L’agente non è stato hackerato. Non c’era un avversario. Ha semplicemente parlato troppo.

I numeri sono impietosi: addestrare un agente solo per la performance ha fatto schizzare la perdita di informazioni complete dal 34% al 51,7%. Più l’agente diventava bravo a rispondere, più diventava incapace di tenere la bocca chiusa. Un paradosso che fa a pugni con decenni di marketing sulla “sicurezza by design”.

La soluzione proposta si chiama Privacy-Aware Deep Research, un metodo di reinforcement learning che porta la strict chain success dal 48,7% al 58,7% e riduce il full-information leakage dal 34% al 9,9%. Un miglioramento. Ma se il 9,9% dei vostri dipendenti umani passasse documenti riservati a sconosciuti ogni volta che gli fate una domanda, il vostro ufficio legale avrebbe già dato le dimissioni.

E qui arriva la domanda che nessuno fa nei comunicati stampa: se questi sono i risultati in laboratorio, cosa sta succedendo là fuori, dove milioni di persone riversano ogni giorno i propri sintomi, i propri referti, le proprie cartelle cliniche in chatbot che nessuno monitora davvero?

La fiducia distribuita a chi non ne ha alcuna

Un terzo degli adulti si rivolge all’intelligenza artificiale per informazioni sanitarie, secondo la ricerca AI per condizioni della pelle di Google. Nel frattempo, l’integrazione di modelli come Gemini trasforma quei dati in input per il test globale dell’AI di Google: sistemi agentici che decidono quando e come intervenire.

E non stiamo parlando solo di salute. C’è Supercharger di Rocket Close, una soluzione AI agentica che gestisce l’intero processo di prestito e acquisto di case, comprese le operazioni sui titoli di proprietà. Dati catastali, informazioni fiscali, estratti conto. Il genere di cose che, in mani sbagliate, non ti fa perdere la password di Netflix. Ti fa perdere la casa.

Secondo McKinsey, gli agenti IA potrebbero creare 2,9 trilioni di dollari di valore economico entro il 2030 solo negli Stati Uniti. Un numero che compare, guarda caso, nello stesso post in cui DeepMind spiega perché è urgente blindare i sistemi interni contro le proprie creature. Il messaggio implicito è chiaro: stiamo costruendo qualcosa di immensamente redditizio e potenzialmente ingestibile, e lo stiamo facendo mentre vi diciamo che è tutto sotto controllo.

Intanto, gli agenti IA mostrano la penalizzazione dei prodotti sponsorizzati con un’omogeneità di scelta senza equivalenti nel comportamento umano. Non è che un agente sbaglia come sbaglierebbe un umano: sbagliano tutti allo stesso modo, tutti insieme, su scala planetaria. Un errore sistemico, non un errore individuale. E nei sistemi complessi, gli errori sistemici sono quelli che fanno crollare i ponti.

La vera tensione irrisolta non è se l’IA diventerà ostile. È che stiamo affidando dati sensibili a sistemi che i loro stessi creatori preferiscono sorvegliare come impiegati infedeli. E mentre DeepMind e ServiceNow costruiscono carceri digitali per contenere le loro creature, a noi resta una domanda: qualcuno sta sorvegliando i sorveglianti?

Scritto da Giulia Bianchi

Giornalista investigativa specializzata in privacy, sicurezza digitale e regolamentazione tech. Scettica per natura, crede nel giornalismo che fa domande scomode.

Startup

Editorials Pick's

Amazon

Apple

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

DeepMind non si fida dei suoi agenti IA

Il framework di DeepMind tratta gli agenti IA come minacce interne, non come bug

Perché DeepMind ha costruito un sistema che non si fida della sua stessa creatura

Quella volta che un agente IA ha spiattellato i segreti aziendali senza nemmeno accorgersene

La fiducia distribuita a chi non ne ha alcuna

Il framework di DeepMind tratta gli agenti IA come minacce interne, non come bug

Perché DeepMind ha costruito un sistema che non si fida della sua stessa creatura

Quella volta che un agente IA ha spiattellato i segreti aziendali senza nemmeno accorgersene

La fiducia distribuita a chi non ne ha alcuna

Articoli correlati

I test stanno cambiando l’infrastruttura AI

Da Mappa a Mente: Come Google Sta Trasformando Maps in un Cervello Digitale per la Città

Google ha reso libero il suo modello AI più avanzato