Quanto costa in termini di risorse aprire una nuova scheda del browser con un modello AI già scaricato?

Secondo l'esperimento di cache cross-origin di Hugging Face, aprire una nuova scheda del browser che esegue un modello AI già scaricato su un altro dominio costa circa 77 megabyte in download e archiviazione duplicati.

Perché il browser scarica nuovamente lo stesso modello AI su domini diversi?

Il browser isola la cache per dominio per motivi di sicurezza, per bloccare attacchi temporali. In Chrome, ogni risorsa è legata a una Network Isolation Key che impedisce a un sito di sapere cosa è stato visitato in precedenza, ma ciò costringe a riscaricare risorse identiche su origini diverse.

Quali sono le implicazioni di sicurezza della moltiplicazione delle copie dei modelli AI?

La moltiplicazione delle copie non è solo uno spreco di banda, ma allarga la superficie d'attacco. Ogni copia proveniente da un'origine differente aumenta il rischio che una versione compromessa del modello venga utilizzata per estrarre dati dal DOM.

Come si confronta l'efficienza lato server con quella lato client per i modelli AI?

Sui server, soluzioni come il caching intelligente su Bedrock eliminano l'elaborazione ridondante, riducendo i costi. Sul lato client, invece, ogni origine rappresenta un nuovo download e una nuova occupazione di memoria, creando una tensione tra efficienza server e moltiplicazione client.

Qual è l'impatto dell'aumento degli agenti AI non sviluppatori sul problema della duplicazione?

Il report di OpenAI mostra un'esplosione di utenti non sviluppatori di agenti AI, con un aumento di 137 volte per gli individuali e 189 volte per quelli organizzativi entro giugno 2026. Ogni volta che questi agenti aprono un sito, costringono il browser a riscaricare gli stessi modelli, decine o centinaia di volte al giorno.

Editorials Pick's 3 hours ago

Il browser scarica lo stesso modello AI decine di volte al giorno

Hugging Face quantifica in 177 MB il costo di aprire una scheda AI a causa della cache isolata per dominio.

La segregazione della cache per dominio moltiplica download e rischi di sicurezza

Centosettantasette megabyte. È quanto costa, in download e archiviazione duplicati, il semplice gesto di aprire una nuova scheda del browser che esegue un modello di intelligenza artificiale già scaricato pochi minuti prima su un altro dominio. A quantificarlo è l’esperimento di cache cross-origin di Hugging Face, che ha preso il modello whisper‑tiny.en e ne ha misurato la moltiplicazione forzata solo perché l’origine della richiesta era diversa.

Il browser non fa sconti. Anche se i byte sono identici, la cache resta segregata dominio per dominio. Una scelta di sicurezza, certo. Ma con un prezzo che sta diventando difficile ignorare.

L’agente è già qui e non ti chiede il permesso

Google ha appena acceso i motori di Computer use in Gemini 3.5 Flash, un agente che vede, ragiona e agisce su browser, mobile e desktop. Gli sviluppatori lo invocano già via API e piattaforma enterprise. Non è una demo: è un prodotto in produzione.

E non è solo Google. Il report di OpenAI sugli agenti registra, da agosto 2025, un’esplosione di utenti non sviluppatori: 137 volte in più per gli individuali, 189 volte in più per quelli organizzativi entro giugno 2026. Anche il dato complessivo, 12 volte in più, racconta di un mondo dove l’agente AI sta uscendo dalla sacca dei tecnici per finire nelle mani di chi non scrive una riga di codice.

Peccato che ognuna di queste mani, quando apre un sito, costringa il browser a riscaricare gli stessi modelli. Non una volta. Decine, centinaia di volte al giorno.

La privacy è il pretesto, il disco lo riempi tu

Perché accade? Le cache sono isolate per origine per bloccare attacchi temporali. In Chrome, ogni risorsa viene incatenata a una Network Isolation Key composta dal sito di primo livello e dal sito del frame corrente. Una fortezza crittografica che impedisce a un sito di fiutare cosa hai visitato prima. Funziona. Ma trasforma ogni nuovo dominio in un silos che ignora ciò che è già stato scaricato altrove.

Il triage locale per il repository OpenClaw ha dimostrato che modelli come Gemma e Qwen, eseguiti su un DGX Spark, gestiscono compiti di classificazione con alta concorrenza e centinaia di token al secondo, senza server remoti. La potenza c’è. Eppure, nel momento in cui quegli stessi modelli atterrano in una scheda diversa, il browser li tratta come sconosciuti e ricomincia da capo.

E se il modello fosse compromesso? Se un sito servisse una versione leggermente modificata per estrarre dati dal DOM? La moltiplicazione delle copie non è soltanto uno spreco di banda. È una superficie d’attacco che si allarga ogni volta che un agente AI viene caricato da un’origine differente. Più copie, più rischi che una di esse non sia quella che credi.

Il cloud si alleggerisce, il tuo dispositivo affonda

Dall’altra parte della barricata, sui server, il messaggio è opposto. La soluzione di health analytics con AI agents su Bedrock mostra come il caching intelligente serva proprio a eliminare l’elaborazione ridondante. Riutilizzo, efficienza, costi che scendono. Ma quel risparmio si ferma al perimetro del data center. Sul tuo computer, la logica si ribalta: ogni origine è un nuovo inizio, un nuovo download, una nuova occupazione di memoria.

La tensione tra efficienza lato server e moltiplicazione lato client apre uno squarcio che i regolatori, dal GDPR all’antitrust, non potranno ignorare a lungo. Se gli agenti AI diventano parte dell’infrastruttura quotidiana del web, costringere miliardi di dispositivi a duplicare modelli identici non è più un dettaglio tecnico. È una scelta di architettura che impatta banda, spazio di archiviazione e, in ultima analisi, la capacità di controllo dell’utente su ciò che viene eseguito nel suo browser.

Chi controllerà l’integrità di cinquanta copie sparse di un modello che decide quali notifiche mostrarti? E chi risponderà quando una di quelle copie inizierà a comportarsi in modo diverso dalle altre?

Scritto da Giulia Bianchi

Giornalista investigativa specializzata in privacy, sicurezza digitale e regolamentazione tech. Scettica per natura, crede nel giornalismo che fa domande scomode.

Startup

Editorials Pick's

Amazon

Apple

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

Il browser scarica lo stesso modello AI decine di volte al giorno

La segregazione della cache per dominio moltiplica download e rischi di sicurezza

L’agente è già qui e non ti chiede il permesso

La privacy è il pretesto, il disco lo riempi tu

Il cloud si alleggerisce, il tuo dispositivo affonda

La segregazione della cache per dominio moltiplica download e rischi di sicurezza

L’agente è già qui e non ti chiede il permesso

La privacy è il pretesto, il disco lo riempi tu

Il cloud si alleggerisce, il tuo dispositivo affonda

Articoli correlati

La Guerra del Cloud AI: Amazon Blinda OpenAI, Google Risponde con Anthropic

IA per la Salute: Innovazione Premium o Diritto di Tutti?

OpenAI ha lanciato un piano da cento dollari