L’AI ha imparato a tenere il filo di una storia
Google DeepMind e A24 collaborano per integrare l'AI nei processi creativi cinematografici, aprendo nuove possibilità per registi e artisti.
La partnership tra Google DeepMind e A24 unisce ricerca computazionale e narrazione indipendente
Hai presente quando aspetti l’autobus e ti viene in mente la melodia perfetta per il video che hai appena girato? Fino a ieri tornavi a casa, aprivi il computer, cercavi il software giusto e speravi di ricordare quella nota. Oggi tiri fuori il telefono, apri la creazione di video e musica con AI introdotta con gli annunci AI di Google di giugno 2026, e la canzone prende forma prima che arrivi il mezzo.
Non è una comodità: è il primo segnale di una mutazione profonda del gesto creativo.
L’AI non si limita più a eseguire comandi. Comincia a improvvisare con noi. E quando uno studio come Google DeepMind sceglie di legarsi a un simbolo del cinema indipendente contemporaneo, qualcosa cambia davvero. Il 22 giugno 2026 è stata annunciata una partnership di ricerca innovativa con A24, la factory dietro film come *Everything Everywhere All at Once* e *Hereditary*. Non una sponsorizzazione, non un gadget promozionale: una collaborazione di R&S multi-progetto pensata per aiutare gli artisti a inventare nuovi flussi di lavoro e tecniche.
Lo studio tascabile che sta già sul tuo telefono
Prima di pensare ai set hollywoodiani, guardiamo cosa abbiamo in tasca. Lo stesso ecosistema che alimenta quella partnership si sta già allenando su compiti più umili ma enormemente rivelatori. Prendi la generazione di dati sintetici per la visione artificiale, un filone su cui NVIDIA sta lavorando con strumenti come il miglioramento dell’accuratezza per la visione AI. Insieme a Roboflow, stanno portando la creazione di immagini sintetiche di difetti e l’espansione automatica degli scenari video direttamente sulle piattaforme degli sviluppatori. Il risultato pratico? Un modello addestrato con appena otto immagini reali di un difetto in una fibra ottica, arricchite con dati sintetici, ha raggiunto il 95% di precisione media e un recall perfetto sulla classe di difetti più ostica, come racconta il benchmark condotto con Corning.
Perché un dato del genere dovrebbe emozionarci? Perché dimostra che l’AI generativa non serve più solo a creare foto di gatti in stile van Gogh. Sta diventando capace di capire la materia visiva e di aiutare un regista, un tecnico delle luci o uno scenografo a prototipare un’idea senza muovere un cavalletto. Ed è esattamente il tipo di capacità che rende credibile un futuro in cui un film di A24 nasca da una conversazione con un modello.
Partner di scrittura, non correttore di bozze
Finora abbiamo pensato all’AI come a un assistente che risponde: “Ecco la tua bozza”. La nuova generazione di strumenti sposta l’asticella. Nano Banana 2 Lite, appena rilasciato da DeepMind insieme a Gemini Omni Flash, mantiene coerenza nei personaggi, aderenza al prompt e, cosa ancora più rara, un rendering del testo nelle immagini finalmente affidabile, come dettagliato nel post su Nano Banana 2 Lite e Gemini Omni Flash. Nello stesso ambiente, la generazione video di alta qualità con editing conversazionale permette di partire da uno scatto, un testo o un clip e modificare il girato parlando con la macchina come si farebbe con un montatore, secondo le capacità mostrate da Gemini Omni Flash in anteprima.
Qui il salto è sottile ma definitivo: l’AI non processa più solo l’input, mantiene il filo. Ricorda il volto di un personaggio tra un’inquadratura e l’altra, conserva lo stile visivo, non perde il tono della storia. È il genere di co-autorialità che uno sceneggiatore riconosce subito: non ti scrive il copione al posto tuo, ma ti tiene la continuità mentre tu esplori.
Quando il dato sintetico diventa sceneggiatura
C’è un’ossessione, nel cinema, che si chiama “copertura”. Significa avere abbastanza materiale girato – angolazioni, varianti di luce, campi e controcampi – per costruire la scena in montaggio. Storicamente costa tempo e denaro. Oggi esiste un parallelo nell’industria: chi sviluppa modelli di visione artificiale ha lo stesso problema, e lo risolve generando varianti sintetiche dello stesso scenario con tecniche come l’espansione della copertura degli scenari. Guarda caso, è lo stesso principio che permetterà a un filmmaker di chiedere a un modello: “Dammi la stessa scena al tramonto, con la macchina da presa più bassa e un’aria più malinconica”.
L’investimento diretto in A24 da parte di Google non è una semplice operazione finanziaria: è la dichiarazione che il motore creativo e il motore computazionale stanno cominciando a girare sullo stesso albero.
E non è un caso che la notizia sia arrivata insieme a tool come il Pixel Drop, che mettono la generazione musicale e video direttamente nell’app della fotocamera. La direzione è chiara: la pipeline creativa non sarà più una sequenza lineare di strumenti separati. Sarà un flusso continuo in cui scrivere, visualizzare, sonorizzare e montare diventano gesti quasi simultanei, mediati da un partner artificiale che capisce il contesto.
La vera domanda non è se l’AI ruberà il lavoro ai creativi. I numeri dicono che sta già ampliando il set di possibilità per chi sa porre le domande giuste. La sfida, piuttosto, riguarda l’autenticità della voce. Quando un’inquadratura può essere generata con una descrizione testuale, cosa distingue lo stile di un autore dalla capacità media del modello? La risposta, forse, sta proprio nella natura della partnership annunciata: portare la ricerca dentro lo studio, far scontrare il metodo scientifico con l’istinto narrativo, e vedere cosa succede quando uno strumento impara non solo dai dataset ma dalle mani sporche di chi fa cinema.
Teniamo d’occhio i prossimi cortometraggi marchiati A24. Potrebbero non dichiarare apertamente il contributo dell’AI. Ma sarà in quel silenzio, in quella naturalezza, che capiremo se la co-autorialità è diventata invisibile. Proprio come dovrebbe essere ogni buon partner creativo.