nvidia ha risolto il problema sbagliato dei datacenter

nvidia ha risolto il problema sbagliato dei datacenter

NVIDIA presenta Vera Rubin NVL72 al COMPUTEX 2026: architettura modulare senza cavi, assemblaggio in 5 minuti, raffreddamento liquido a 45°C.

Il sistema integra 36 cpu e 72 gpu in un pannello unico senza cavi ne’ ventole

Il vero collo di bottiglia dell’AI enterprise non sono più i modelli, ma il piano fisico: cablaggi chilometrici, raffreddamento ad aria che collide con densità di potenza impossibili, tempi di assemblaggio che bloccano la scalabilità. NVIDIA ha risolto il problema dove nessuno guardava — nell’hardware.

Il sistema Vera Rubin NVL72, presentato al COMPUTEX 2026, elimina fisicamente i cavi, i tubi e le ventole, e riduce l’assemblaggio di un vassoio di calcolo da due ore a cinque minuti per vassoio. Il risultato non è solo efficienza: diventa possibile costruire cluster AI con la modularità di un rack standard, e questo cambia tutto per chi deve mettere in produzione agenti enterprise.

5 minuti di assemblaggio, zero cavi: l’architettura che elimina i colli di bottiglia fisici

Il segreto sta nel design modulare che integra 36 NVIDIA Vera CPU e 72 NVIDIA Rubin GPU in un unico pannello, unificati dal sesto NVLink Switch NVIDIA con ConnectX-9 SuperNIC e Spectrum-X Ethernet Photonics. Ogni connessione avviene tramite fotonica integrata — niente cavi copper, niente connettori meccanici. Il risultato è una latenza di interconnessione paragonabile a quella di un backplane, ma con la flessibilità di un sistema modulare. I power shelf di bordo offrono 6x più accumulo energetico per lo smoothing intelligente della potenza, eliminando i picchi che di solito costringono a sovradimensionare l’alimentazione. Questo significa che ogni vassoio è un’unità computazionale completa, calda-rimovibile e auto-rinfrescante.

Raffreddamento liquido a 45°C e 35x throughput per watt: l’efficienza diventa architetturale

Tutto il sistema è raffreddato al 100% a liquido e opera stabilmente a 45 gradi Celsius. Non solo: con la libreria Groq 3 LPX nativa per modelli con trilioni di parametri, Vera Rubin NVL72 offre fino a 35x maggiore throughput per watt rispetto alla generazione precedente. Se aggiungiamo il miglioramento 10x delle prestazioni di inferenza per watt e 10x costo inferiore per token, il quadro è chiaro: l’efficienza energetica non è più un vincolo, ma un moltiplicatore di capacità. Il sistema ha già ricevuto un Golden Award e il Sustainable Tech Special Award al GTC Taipei, a testimoniare che l’approccio è riconosciuto anche a livello industriale.

Il vero harness per agenti enterprise: dall’hardware alla governance

Ma perché questa architettura è importante per chi costruisce agenti? Perché l’harness — il layer di esecuzione che chiama il modello, gestisce le chiamate agli strumenti e decide quando fermarsi — non è solo software. Come spiega il glossario AI di Hugging Face, l’harness engineering è la disciplina di progettare questo strato con guardrail, gestione degli errori e criteri di stop. NVIDIA ha progettato Vera Rubin come un harness fisico: il BlueField-4 DPU e il ConnectX-9 SuperNIC forniscono sicurezza a livello di rete e isolamento delle risorse. E non è un caso che OpenAI sia stata riconosciuta leader negli agenti di coding enterprise da Gartner, che ha evidenziato proprio controlli come approval gates, RBAC, sandboxing a livello di sistema operativo e governance auditabile. La Vera Rubin NVL72 incarna questi stessi principi sul piano fisico: ogni modulo è un workspace isolato, ogni flusso di raffreddamento è un policy layer.

Il keynote di Jensen Huang al COMPUTEX il 1° giugno ha mostrato un’anteprima del sistema; l’intero evento GTC Taipei al COMPUTEX si tiene dal 1 al 4 giugno. Per chi costruisce agenti enterprise, il messaggio è inequivocabile: lo stack non si ferma al modello o all’API. La vera leva è il piano fisico, e NVIDIA ha reso la scalabilità un problema di configurazione, non di ingegneria civile.

🍪 Impostazioni Cookie