OpenAI ha ammesso un attacco alla supply chain
OpenAI ha subito un attacco npm che ha compromesso certificati di firma, evidenziando i rischi del cloud AI.
L’attacco alla supply chain npm di OpenAI espone i rischi strutturali del cloud
Il 14 maggio 2026, OpenAI ha ammesso che due dispositivi aziendali sono stati colpiti da un attacco alla supply chain npm. La risposta? Ruotare i certificati di firma per tutti i prodotti, dagli iPhone ai PC Windows. Ma la vera notizia non è l’ennesima vulnerabilità: è che il modello cloud di intelligenza artificiale ha una falla strutturale che nessun aggiornamento può tappare. I repository di codice sorgente colpiti includevano certificati di firma per i prodotti OpenAI, e l’azienda ha dovuto ruotare i certificati come precauzione, costringendo gli utenti macOS ad aggiornare le app entro giugno 2026.
E mentre OpenAI corre ai ripari, il mercato si chiede: perché affidare a un server remoto la sicurezza di ciò che elabora i nostri dati più sensibili?
L’attacco che smaschera il cloud
Non è un incidente marginale. Due dispositivi nell’ambiente aziendale di OpenAI sono stati infettati, e le chiavi di firma per Windows, macOS, iOS e Android sono finite in mani sconosciute. La reazione di OpenAI è stata immediata, ma il danno alla fiducia è fatto: ogni volta che un agente AI dipende da un’API remota, la supply chain diventa la superficie d’attacco ideale. E se il modello stesso è ospitato nel cloud, il compromesso non si limita a un token: può esporre l’intera pipeline di sviluppo, come insegna il caso TanStack.
Ecco perché l’alternativa non è solo tecnica, ma strategica. Mentre OpenAI lavora per rimediare, NVIDIA e IBM mostrano una strada diversa: modelli che girano interamente in locale, senza mai esporre i dati a terzi.
Hermes e Granite: la difesa nasce sulla scrivania
NVIDIA ha rilasciato Hermes Agent, un sistema ottimizzato per l’uso locale sempre attivo. Secondo l’annuncio ufficiale, Hermes Unlocks Self-Improving AI Agents che si integrano con app di messaggistica, accedono a file locali e funzionano 24/7. Non serve connettersi a un server remoto: il modello Qwen 3.6 35B opera con circa 20 GB di memoria, superando modelli da 120 miliardi di parametri che richiedono oltre 70 GB. Il segreto è l’hardware: il NVIDIA DGX Spark ha 128 GB di memoria unificata e 1 petaflop di prestazioni AI, sufficienti per eseguire modelli mixture-of-experts da 120 miliardi di parametri tutto il giorno. Zero latenza, zero esposizione.
Parallelamente, IBM ha pubblicato i modelli Granite Embedding Multilingual R2 con licenza Apache 2.0, rilasciati il 14 maggio 2026. Supportano oltre 200 lingue e funzionano come sostituti drop-in in LangChain, LlamaIndex, Haystack e Milvus. Il punto non è solo la trasparenza della licenza open source, ma la possibilità di eseguire questi modelli su hardware locale, tagliando fuori ogni intermediario. Per un’azienda che rispetta il GDPR o che opera in settori regolamentati come finanza e sanità, l’AI locale non è un lusso: è l’unico modo per avere controllo sul dato.
L’ironia è che OpenAI, nata come startup open source, ha scelto la via del cloud chiuso. Oggi paga il prezzo di una superficie d’attacco che i modelli locali semplicemente non hanno. La domanda per i regolatori antitrust e per i DPO europei è: possiamo permetterci di affidare la nostra supply chain cognitiva a un pugno di server centralizzati, quando le prestazioni locali sono già competitive?