Il browser scarica lo stesso modello AI decine di volte al giorno
Hugging Face quantifica in 177 MB il costo di aprire una scheda AI a causa della cache isolata per dominio.
La segregazione della cache per dominio moltiplica download e rischi di sicurezza
Centosettantasette megabyte. È quanto costa, in download e archiviazione duplicati, il semplice gesto di aprire una nuova scheda del browser che esegue un modello di intelligenza artificiale già scaricato pochi minuti prima su un altro dominio. A quantificarlo è l’esperimento di cache cross-origin di Hugging Face, che ha preso il modello whisper‑tiny.en e ne ha misurato la moltiplicazione forzata solo perché l’origine della richiesta era diversa.
Il browser non fa sconti. Anche se i byte sono identici, la cache resta segregata dominio per dominio. Una scelta di sicurezza, certo. Ma con un prezzo che sta diventando difficile ignorare.
L’agente è già qui e non ti chiede il permesso
Google ha appena acceso i motori di Computer use in Gemini 3.5 Flash, un agente che vede, ragiona e agisce su browser, mobile e desktop. Gli sviluppatori lo invocano già via API e piattaforma enterprise. Non è una demo: è un prodotto in produzione.
E non è solo Google. Il report di OpenAI sugli agenti registra, da agosto 2025, un’esplosione di utenti non sviluppatori: 137 volte in più per gli individuali, 189 volte in più per quelli organizzativi entro giugno 2026. Anche il dato complessivo, 12 volte in più, racconta di un mondo dove l’agente AI sta uscendo dalla sacca dei tecnici per finire nelle mani di chi non scrive una riga di codice.
Peccato che ognuna di queste mani, quando apre un sito, costringa il browser a riscaricare gli stessi modelli. Non una volta. Decine, centinaia di volte al giorno.
La privacy è il pretesto, il disco lo riempi tu
Perché accade? Le cache sono isolate per origine per bloccare attacchi temporali. In Chrome, ogni risorsa viene incatenata a una Network Isolation Key composta dal sito di primo livello e dal sito del frame corrente. Una fortezza crittografica che impedisce a un sito di fiutare cosa hai visitato prima. Funziona. Ma trasforma ogni nuovo dominio in un silos che ignora ciò che è già stato scaricato altrove.
Il triage locale per il repository OpenClaw ha dimostrato che modelli come Gemma e Qwen, eseguiti su un DGX Spark, gestiscono compiti di classificazione con alta concorrenza e centinaia di token al secondo, senza server remoti. La potenza c’è. Eppure, nel momento in cui quegli stessi modelli atterrano in una scheda diversa, il browser li tratta come sconosciuti e ricomincia da capo.
E se il modello fosse compromesso? Se un sito servisse una versione leggermente modificata per estrarre dati dal DOM? La moltiplicazione delle copie non è soltanto uno spreco di banda. È una superficie d’attacco che si allarga ogni volta che un agente AI viene caricato da un’origine differente. Più copie, più rischi che una di esse non sia quella che credi.
Il cloud si alleggerisce, il tuo dispositivo affonda
Dall’altra parte della barricata, sui server, il messaggio è opposto. La soluzione di health analytics con AI agents su Bedrock mostra come il caching intelligente serva proprio a eliminare l’elaborazione ridondante. Riutilizzo, efficienza, costi che scendono. Ma quel risparmio si ferma al perimetro del data center. Sul tuo computer, la logica si ribalta: ogni origine è un nuovo inizio, un nuovo download, una nuova occupazione di memoria.
La tensione tra efficienza lato server e moltiplicazione lato client apre uno squarcio che i regolatori, dal GDPR all’antitrust, non potranno ignorare a lungo. Se gli agenti AI diventano parte dell’infrastruttura quotidiana del web, costringere miliardi di dispositivi a duplicare modelli identici non è più un dettaglio tecnico. È una scelta di architettura che impatta banda, spazio di archiviazione e, in ultima analisi, la capacità di controllo dell’utente su ciò che viene eseguito nel suo browser.
Chi controllerà l’integrità di cinquanta copie sparse di un modello che decide quali notifiche mostrarti? E chi risponderà quando una di quelle copie inizierà a comportarsi in modo diverso dalle altre?