Nvidia ha cambiato le regole del cloud AI

Nvidia ha cambiato le regole del cloud AI

Nvidia condivide i ricavi con i provider cloud per l'accesso alle GPU, spostando il valore dai modelli all'infrastruttura.

Nvidia cambia strategia e punta tutto sull’infrastruttura come nuovo asset centrale

Avevi appena finito di sistemare la bozza di un’illustrazione per la presentazione di domani. Hai aperto un modello veloce, quasi per gioco, e in pochi secondi l’immagine era pronta, con uno stile che prima richiedeva ore di prompt engineering. Non hai pagato un abbonamento premium, non hai attivato una GPU dedicata. Era tutto dentro il tab del browser.

Questa fluidità, questa leggerezza improvvisa, è il sintomo di qualcosa che sta ribollendo sotto la superficie del cloud.

Il giorno prima Google aveva silenziosamente acceso Nano Banana 2 Lite, il modello di immagini più scattante ed economico della famiglia Nano Banana. Insieme a lui è arrivato Gemini Omni Flash, pensato per generare video e fare editing conversazionale. Tutto già disponibile in Google AI Studio, nelle API di Gemini e nella piattaforma enterprise. Sembrano lanci di prodotto come tanti altri. Ma se guardiamo la data e incrociamo i numeri, capiamo che sono tasselli di una reazione disperata e geniale a un terremoto che è partito da Santa Clara.

Il gesto che ha riscritto le regole del gioco

Agli inizi di luglio 2026, NVIDIA ha fatto una mossa che i manuali di business definirebbero suicida, ma che in realtà è un colpo da maestro. Ha aperto un modello di condivisione dei ricavi di NVIDIA per l’accesso al calcolo accelerato. In parole povere: smette di limitarsi a vendere GPU a peso d’oro ai provider cloud. Adesso condivide i ricavi con loro e offre supporto creditizio. NVIDIA guadagna dalla vendita dell’hardware e da una fetta del fatturato che quei chip generano nei data center altrui.

È un cambio di prospettiva radicale. Prima il valore stava nei modelli, nella corsa a chi addestrava il LLM più grosso. Ora il messaggio è limpido: il vero asset è l’infrastruttura. I mattoni, non la cattedrale. E chi fornisce i mattoni vuole la sua percentuale su ogni funzione che gira sopra.

Le prime avvisaglie sono concrete. Sharon AI sta già mettendo in strada fino a 40.000 GPU NVIDIA Grace Blackwell GB300. Firmus, in Indonesia, sta costruendo un campus per AI factory a Batam che arriverà a 360 megawatt e fino a 170.000 GPU NVIDIA. Numeri che fanno girare la testa. E che spiegano perché le startup AI native come Baseten, Fireworks AI e Together AI oggi hanno un bisogno viscerale di accesso immediato alla capacità cloud: devono fare training, post-training, fine-tuning e inferenza agentica ad altissimo volume, e non possono più aspettare i cicli di procurement tradizionali.

Il mercato si sta spaccando in due: chi possiede l’acciaio e chi prova a costruirci sopra esperienze indimenticabili.

Perché Google e l’open source corrono ai ripari

La risposta di Google non è stata un comunicato stizzito. È stata una raffica di annunci a giugno 2026. Gemini 3.5 Live Translate arriverà per abbattere le barriere linguistiche in tempo reale. Gemini 3.5 Flash con funzionalità “computer use” permetterà di costruire agenti personalizzati che interagiscono con le interfacce come farebbe un umano. Persino Google Finance è uscito dalla beta con un’app Android dedicata, ricerca AI e la generazione automatica di “key moments” finanziari. Non sono più esperimenti: sono prodotti che hanno bisogno di girare su un’infrastruttura che Google controlla ancora, ma su cui NVIDIA sta allungando le mani.

Sul fronte open source, la tensione è palpabile. Hugging Face e Cerebras hanno unito le forze per portare Gemma 4 alla voce AI in tempo reale. Un’operazione che profuma di indipendenza: se riesco a far funzionare modelli vocali sofisticati su hardware non NVIDIA, sfuggo alla morsa. Ma la verità, suggerita da una riflessione più ampia sulla specializzazione, è che il sogno di una singola intelligenza artificiale che sappia fare tutto si sta sgretolando. Secondo uno studio di Goldfeder e colleghi, la generalità universale dei modelli è un concetto teorico, ma in termini pratici è un mito. Servono modelli specializzati. E i modelli specializzati richiedono un’infrastruttura capillare e ottimizzata, proprio quella che NVIDIA sta mettendo a disposizione col suo nuovo modello a ricavi condivisi.

L’interruttore della luce che non ti appartiene

Arriviamo al punto che ci tocca personalmente. Se il valore si sposta dai modelli all’infrastruttura, la domanda scomoda è: chi controllerà l’interruttore? Oggi possiamo usare strumenti come Nano Banana o Gemini Omni Flash con la stessa leggerezza con cui mandiamo un messaggio su WhatsApp. Ma se NVIDIA diventa il fornitore — diretto o indiretto — della potenza di calcolo su cui girano questi servizi, stiamo consegnando le chiavi di casa a un’unica azienda.

L’aspetto positivo è che l’abbondanza di calcolo farà fiorire una stagione creativa senza precedenti. Le startup potranno permettersi di addestrare modelli specializzati senza vendere l’anima a un hyperscaler. L’aspetto critico riguarda la privacy e la dipendenza: quando ogni nostra richiesta passa attraverso un nodo la cui bolletta ha un pezzetto firmato NVIDIA, la trasparenza sui costi e sui dati diventa un diritto, non un optional. Le prossime battaglie non si combatteranno a colpi di benchmark, ma nei termini di servizio.

Quello che dobbiamo iniziare a osservare con occhi diversi è proprio il gesto semplice di chi apre un’app e genera qualcosa. Dietro quello che sembra un miglioramento innocuo, oggi c’è una partita in cui il vero padrone del cloud AI si gioca a carte scoperte. E Jensen Huang, con la mossa della condivisione dei ricavi, ha appena piazzato la sua puntata più alta.

🍪 Impostazioni Cookie