Apple ha chiesto aiuto a Google per Siri
Apple integra Gemini di Google in Siri con architettura ibrida on-device e cloud, puntando su privacy verificabile e controllo crittografico.
La partnership con Google per Gemini nasconde i ritardi nello sviluppo del modello interno Ajax
Non è il solito assistente vocale con un backend opaco. Apple Intelligence — e la nuova Siri AI che ne è l’interfaccia principale — gira su un’architettura ibrida dove i dati più sensibili vengono elaborati direttamente sul dispositivo, mentre i task computazionalmente pesanti vengono delegati a server che montano Apple Silicon e operano sotto un regime di attestazione crittografica verificabile pubblicamente. I log vengono cancellati. Il codice è ispezionabile. La scommessa è questa: portare la potenza dei grandi modelli linguistici nel cloud senza rinunciare alla privacy by design. Siri AI sarà disponibile in beta entro la fine del 2026, inizialmente solo per dispositivi impostati in inglese, con espansione linguistica successiva.
Private Cloud Compute: l’architettura dietro Siri AI
Il cuore tecnico di tutto questo è Private Cloud Compute, il sistema cloud proprietario di Apple progettato intorno a un principio semplice ma difficile da realizzare: il cloud non dovrebbe sapere più di quanto è strettamente necessario per rispondere alla query. L’architettura di Apple Intelligence prevede due livelli distinti. Il primo è un modello on-device, che gira direttamente sull’hardware dell’utente e gestisce i task dove la latenza è critica o i dati sono particolarmente sensibili. Il secondo è un modello cloud che opera su server basati prevalentemente su Apple Silicon — la stessa famiglia di chip ARM che Apple usa nei Mac e negli iPad. Entrambi i livelli condividono un’architettura a modello di fondazione generico, adattato tramite fine-tuning per task specifici.
La scelta di usare Apple Silicon sui server non è casuale. Significa che Apple controlla l’intero stack hardware-software anche nel datacenter, con le stesse garanzie di sicurezza dell’enclave sicura che già protegge Face ID e le chiavi crittografiche sui dispositivi consumer. L’attestazione crittografica — il meccanismo per cui un client può verificare con certezza che il server stia girando il codice dichiarato e non una versione manomessa — è pubblica e ispezionabile da ricercatori di sicurezza indipendenti. È un approccio che si avvicina concettualmente al Trusted Execution Environment, ma scalato a livello di datacenter. Il contrasto con il cloud AI tradizionale è netto: con OpenAI, Google o Anthropic, l’utente deve semplicemente fidarsi che il provider non abbia accesso ai dati. Con Private Cloud Compute, la fiducia è tecnica, non contrattuale. Resta però una domanda aperta: se l’architettura è così solida e controllata, perché Apple ha dovuto ricorrere a un modello esterno?
Il prezzo del ritardo: Ajax, Gemini e i compromessi della dipendenza
La risposta sta nella cronologia. Siri esiste dal febbraio 2010 — inizialmente come app autonoma, acquisita da Apple due mesi dopo il lancio. Per oltre un decennio è rimasta un assistente basato su regole e NLU classica, distante anni luce dai moderni transformer. Il salto verso i Large Language Model è arrivato tardi: solo nel luglio 2023 è emerso che Apple stava sviluppando internamente un proprio LLM, con nome in codice Ajax. Il motivo del ritardo è stato, almeno in parte, la sorpresa: il rilascio di ChatGPT a fine 2022 aveva colto di sorpresa i dirigenti Apple, costringendo l’azienda a riorientare rapidamente le priorità di ricerca e sviluppo. Nel 2024, Apple aveva già aggiunto le prime funzionalità LLM a Siri in iOS 18 e macOS Sequoia, inclusa un’integrazione con ChatGPT. Nel 2025, però, un piano più ambizioso di personalizzazione avanzata è stato rimandato a causa di sfide tecniche interne.
A gennaio 2026, è arrivata la notizia che cambia i pesi della storia: Apple e Google hanno siglato una partnership pluriennale per integrare i modelli Gemini di Google nei modelli di fondazione di Apple, insieme all’infrastruttura cloud di Google. Apple ha comunicato agli investitori che stava integrando una versione on-device di Gemini in Siri, a causa dei continui problemi nello sviluppo del modello interno. La dimensione del modello Gemini — 1,2 trilioni di parametri — rende immediatamente chiaro perché Apple non potesse semplicemente rimandare: è un modello di un ordine di grandezza più grande e complesso rispetto a quanto Apple avesse sviluppato in autonomia fino a quel momento. Il risultato è una dipendenza strutturale da un concorrente diretto. Google non è un partner neutro: fa hardware (Pixel), fa sistemi operativi (Android), fa AI (Gemini, Bard, Vertex). Affidare una parte del cervello di Siri a Google significa accettare un compromesso che, sul piano della narrativa della privacy, crea qualche tensione evidente.
Cosa cambia per chi sviluppa
Per chi scrive software, tutto questo si traduce in scelte architetturali concrete. Le nuove API di Apple Intelligence espongono l’accesso ai modelli on-device e cloud attraverso un layer di astrazione che gestisce automaticamente il routing — decidendo in runtime se processare localmente o delegare a Private Cloud Compute. Gli sviluppatori che vogliono integrare AI nelle loro app dovranno ragionare in termini di privacy tier: quali dati possono uscire dal dispositivo, quali no, e con quali garanzie di attestazione. Il codice del server cloud di Apple è ispezionabile — una scelta che avvicina Apple alla cultura dell’open source più di quanto ci si aspetterebbe da Cupertino, almeno sul fronte della verifica. La limitazione geografica è però significativa: Siri AI non sarà disponibile nell’UE per iOS e iPadOS nella fase iniziale, né in Cina mentre Apple affronta i requisiti normativi locali. Per i developer europei, questo significa che qualunque feature costruita su Siri AI dovrà prevedere un fallback. Resta da vedere se Apple riuscirà a ridurre la dipendenza da Gemini sviluppando Ajax fino a renderlo competitivo su benchmark reali. Ma il messaggio architetturale è già chiaro: Apple non sta giocando la partita dei parametri. Sta giocando la partita della fiducia verificabile, e per farlo ha costruito un’infrastruttura che mette il controllo crittografico prima della potenza bruta. Per chi progetta sistemi AI, è un invito a chiedersi se la stessa logica possa — o debba — applicarsi anche fuori dall’orbita Apple.