Come funziona il modello Privacy Filter?

Il modello ha 1,5 miliardi di parametri totali, ma solo 50 milioni attivi durante l'inferenza, rendendolo veloce ed economico. Può girare su hardware normale senza necessità di GPU costose.

Perché Privacy Filter è considerato accessibile?

Essendo open-weight, i pesi del modello sono liberamente scaricabili e modificabili. Non richiede API, costi per token o invio dati a server di terze parti, e può essere integrato localmente nelle pipeline.

Quali settori beneficiano di Privacy Filter?

Settori come sanitario, legale e finanziario, dove la riservatezza dei dati è fondamentale, traggono vantaggio dalla possibilità di processare dati in locale senza esporli a terze parti.

Come si confronta Privacy Filter con Microsoft Presidio?

Privacy Filter è un modello basato su deep learning, più flessibile e adattabile a contesti e lingue diverse. Presidio è basato su regole e pattern, più prevedibile e facile da auditare. Non si sostituiscono ma offrono opzioni diverse.

Quando è stato rilasciato Privacy Filter?

Privacy Filter è stato rilasciato ad aprile 2026, dopo Codex Security (marzo 2026) e in concomitanza con GPT-5.4-Cyber (14 aprile 2026).

Intelligenza Artificiale 3 months ago

I dati personali nei log sono un incubo

Q: Cos'è OpenAI Privacy Filter?

OpenAI Privacy Filter è uno strumento open-weight rilasciato da OpenAI per rilevare e oscurare automaticamente le informazioni personali identificabili (PII) in qualsiasi testo, come indirizzi email e numeri di telefono.

OpenAI ha rilasciato Privacy Filter, un modello open-weight per rilevare e oscurare automaticamente le informazioni personali nei testi, pensato per sviluppatori.

OpenAI ha rilasciato un modello open-weight per rilevare e oscurare dati personali nei testi

Immagina di essere uno sviluppatore che, dopo una notte di debugging, si dimentica di pulire i log e si ritrova con un file pieno di indirizzi email e numeri di telefono esposti su GitHub. È lo scenario che fa venire i brividi a ogni CTO — e probabilmente anche a chi ha mai scritto una riga di codice. Nei giorni scorsi, secondo OpenAI Privacy Filter, l’azienda ha rilasciato uno strumento open-weight pensato esattamente per evitare che questo incubo diventi realtà: un modello in grado di rilevare e oscurare automaticamente le informazioni personali identificabili (PII) presenti in qualsiasi testo.

Il momento in cui un log diventa una bomba

Chi lavora con i dati lo sa bene: non serve un attacco hacker sofisticato per far trapelare informazioni sensibili. Basta un file di log dimenticato aperto, una pipeline mal configurata, un export CSV condiviso nel canale Slack sbagliato. I dati personali — nomi, email, numeri di telefono, codici fiscali — scivolano ovunque, spesso senza che nessuno se ne accorga. Il problema è antico quanto internet, ma fino a poco tempo fa le soluzioni erano costose, complesse o poco accessibili a chi non aveva un intero team di sicurezza alle spalle. Ed è qui che Privacy Filter cambia le carte in tavola.

Ma come funziona esattamente questo modello?

Un modello leggero per un problema pesante

Privacy Filter non è l’ennesimo modello mastodontico: è pensato per essere veloce ed economico. La scelta tecnica di OpenAI è interessante proprio per questo: il modello ha 1,5 miliardi di parametri totali, ma solo 50 milioni di essi sono attivi durante l’inferenza. È un po’ come avere una biblioteca immensa ma sapere esattamente dove andare a cercare il libro giusto, senza dover sfogliare ogni pagina. Questo significa che si può girare su hardware normale, senza dover affittare GPU da decine di migliaia di euro al mese.

Il fatto che sia open-weight — cioè con i pesi del modello liberamente scaricabili e modificabili — è la parte che interessa davvero a chi sviluppa software. Non c’è un’API da chiamare, non ci sono costi per token, non ci sono dati che volano su server di terze parti. Puoi integrarlo direttamente nella tua pipeline, in locale, senza che nessuno sappia cosa stai processando. Per settori come quello sanitario, legale o finanziario, dove la riservatezza dei dati non è negoziabile, questa è una differenza sostanziale rispetto a qualsiasi servizio cloud.

Il rilascio del Privacy Filter ad aprile 2026 si inserisce in una strategia più ampia che OpenAI sta costruendo intorno alla sicurezza. Prima era arrivato Codex Security, a marzo 2026, poi il Privacy Filter, a dimostrazione che l’azienda non punta solo a costruire modelli sempre più grandi, ma anche strumenti di sicurezza specializzati e, soprattutto, accessibili. In questo stesso periodo, OpenAI aveva già rilasciato GPT-5.4-Cyber il 14 aprile 2026, a ulteriore conferma di un’attenzione crescente al tema della cybersicurezza. Se OpenAI punta su un modello leggero e open, però, cosa significa per chi già usava alternative simili?

E Presidio? La concorrenza che si muove

Prima di Privacy Filter, il punto di riferimento open-source era Microsoft Presidio, lo strumento sviluppato da Microsoft per il rilevamento e la redazione di PII, considerato fino ad ora il leader indiscusso del settore open-source. Presidio è solido, ben documentato e ha una community attiva. Ma l’ingresso di OpenAI in questo spazio pone una domanda legittima: un modello basato su deep learning, addestrato da chi ha costruito GPT, può fare meglio di un sistema basato su regole e riconoscimento di pattern?

La risposta probabile è “dipende”. I modelli neurali tendono a essere più flessibili — capiscono il contesto, si adattano a lingue diverse, riconoscono PII anche quando è scritta in modi inusuali. Gli strumenti basati su regole sono invece più prevedibili e più facili da auditare. Non si tratta di una sostituzione automatica, ma di una nuova opzione sul tavolo, e una opzione molto concreta per chi non aveva risorse per costruire soluzioni personalizzate.

Resta da vedere come si evolverà il confronto nei prossimi mesi, ma una cosa sembra abbastanza chiara: proteggere i dati personali sta diventando qualcosa che non richiede più un team dedicato e un budget enterprise. Strumenti come Privacy Filter sono solo l’inizio di una tendenza in cui la privacy smette di essere un privilegio per pochi e diventa un’infrastruttura di base, accessibile a chiunque scriva codice
— anche a quello sviluppatore esausto che ogni tanto si dimentica di pulire i log.

Scritto da Marco Rossi

Giornalista tech con 10 anni di esperienza nel settore. Appassionato di innovazione e early adopter incallito. Ama raccontare come la tecnologia cambia la vita quotidiana delle persone. | Autore AI KronosWire

Startup

Editorials Pick's

Amazon

Apple

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

I dati personali nei log sono un incubo

OpenAI ha rilasciato un modello open-weight per rilevare e oscurare dati personali nei testi

Il momento in cui un log diventa una bomba

Un modello leggero per un problema pesante

E Presidio? La concorrenza che si muove

OpenAI ha rilasciato un modello open-weight per rilevare e oscurare dati personali nei testi

Il momento in cui un log diventa una bomba

Un modello leggero per un problema pesante

E Presidio? La concorrenza che si muove

Articoli correlati

L’Intelligenza Artificiale nell’Istruzione: dal Panico all’Integrazione nel Minnesota

Google e l’AI: la ricerca si trasforma, ma il click scompare?

Il paradosso di Google: l’AI minaccia la pubblicità, Alphabet si indebita per il futuro