Google Gemini integra Lyria 3: la musica AI arriva nell’assistente.
Google Gemini ora genera musica AI di 30 secondi con Lyria 3 di DeepMind, trasformando l'assistente digitale in un hub creativo.
L’integrazione del modello Lyria 3 di DeepMind, annunciata il 18 febbraio 2026, mira a ridefinire le aspettative sugli assistenti digitali, consolidando Gemini come hub creativo, ma porta con sé tensioni irrisolte sul copyright e sull’equità nel settore.
Da oggi, se chiedete a Google Gemini di creare una colonna sonora per il vostro video delle vacanze o una canzone d’amore synth-pop, non vi risponderà più solo con del testo. Vi genererà un brano musicale completo, della durata di trenta secondi, con melodia, ritmo e, se richiesto, anche con delle voci che cantano un testo coerente.
È questo il salto che l’azienda di Mountain View ha compiuto integrando Lyria 3, l’ultimo modello di generazione musicale di DeepMind, direttamente nell’app del suo assistente AI. L’annuncio, avvenuto il 18 febbraio 2026, non è solo l’aggiunta di una funzionalità curiosa: è una mossa strategica che punta a ridefinire le aspettative degli utenti su cosa possa fare un assistente digitale e, nel farlo, getta un cono di luce sulle tensioni irrisolte che attraversano l’intero settore della creatività generativa.
La funzionalità è sorprendentemente semplice da usare, ed è proprio questa la sua forza.
Basta aprire Gemini e descrivere a parole un’idea, caricare una foto o un breve video. Il modello, che supporta otto lingue tra cui l’italiano, interpreta il prompt e restituisce un clip audio di trenta secondi. Secondo quanto riportato da chi l’ha testata in anteprima, l’esperienza può essere “sbalorditiva”.
Lyria 3 offre un certo controllo su stile, voci e tempo, e può generare automaticamente dei testi in base alla descrizione fornita. Per Google, l’obiettivo dichiarato non è competere con gli studi di produzione professionale, ma offrire un modo “divertente e unico” per creare una “colonna sonora personalizzata per la vita quotidiana”. È un approccio consumer, pensato per creator di social media, appassionati o semplici curiosi.
Ma dietro questa interfaccia amichevole si nasconde una complessità tecnica notevole e una serie di scelte progettuali che rivelano molto sulla direzione che Google sta prendendo.
La corsa all’audio generativo e la strategia del “tutto in uno”
L’integrazione di Lyria 3 in Gemini non avviene nel vuoto. Il mercato della generazione musicale AI è già affollato di player specializzati come Suno e Udio, acclamati per la qualità delle loro sintesi vocali e la versatilità nei generi. Anche OpenAI sta lavorando al proprio modello musicale e ha già integrato l’audio realistico in Sora, il suo generatore di video.
Tuttavia, Google è il primo tra i giganti del tech a portare questa capacità direttamente dentro un assistente AI generalista usato da milioni di persone. La mossa ha il sapore di una standardizzazione: la generazione musicale diventa una feature nativa, accessibile quanto chiedere il meteo o riassumere un articolo.
Questa strategia del “tutto in uno” è un chiaro tentativo di rendere Gemini la piattaforma creativa onnicomprensiva per l’utente comune. Mentre competitor come Anthropic si concentrano sul ragionamento testuale puro, Google spinge la sua creatura verso la produzione multimediale. È una differenziazione aggressiva che, se accettata dal mercato, potrebbe marginalizzare rapidamente le startup indipendenti che fino a ieri dominavano la nicchia della musica AI.
Per loro, competere con la distribuzione capillare, l’integrazione perfetta e la potenza di calcolo di Google è una sfida disperata. L’azienda, dal canto suo, può monetizzare questa capacità in diversi modi: attraverso limiti d’uso più generosi per gli abbonati a pagamento di Gemini Advanced, o in futuro, con modelli freemium per l’uso commerciale, seguendo le orme di Suno.
I nodi irrisolti: copyright, watermarking e l’ombra delle cause legali
Se la parte utente è semplice, il back-end è un campo minato di questioni etiche e legali che Google ha cercato di arginare con un insieme articolato di protezioni. La più evidente è il watermarking. Ogni brano generato da Lyria 3 contiene il watermark SynthID, una firma digitale impercettibile all’orecchio umano progettata per identificare il contenuto come generato dall’IA di Google.
Inoltre, l’app Gemini stessa incorpora strumenti che permettono di verificare se un file audio è stato creato con l’IA di Google. Questa non è una scelta tecnologica neutra: è una risposta preventiva alle accuse di deepfake audio e alla dilagante diffusione di contenuti sintetici non etichettati.
La questione del copyright è ancora più spinosa. I modelli come Lyria 3 vengono addestrati su enormi dataset musicali, sollevando interrogativi cruciali su compensi, licenze e proprietà intellettuale. L’industria musicale è già in stato di allerta: case discografiche hanno citato in giudizio Suno e Udio, mentre editori musicali hanno fatto causa ad Anthropic per l’uso non autorizzato di testi. Google si presenta con un approccio cauto.
Sostiene di essere stata “molto attenta agli accordi sul copyright e con i partner” durante l’addestramento e ha implementato filtri per ridurre la probabilità che il modello replichi fedelmente artisti esistenti. Specificare il nome di un cantante in un prompt verrebbe interpretato come “ispirazione creativa ampia”, non come un comando per imitarne la voce. Inoltre, il modello impiega filtri di sicurezza per minimizzare contenuti dannosi nei dataset e ridurre la probabilità di testi offensivi.
Tuttavia, Google ammette che il sistema “potrebbe non essere infallibile” e ha istituito un meccanismo di segnalazione per potenziali violazioni. Questo quadro, per quanto articolato, lascia aperte domande fondamentali.
Chi è il proprietario legale di un brano generato da Lyria 3? L’utente può usarlo commercialmente senza rischi? La risposta ufficiale è che Google non rivendica la proprietà del contenuto creato con Gemini, ma spetta all’utente assicurarsi che non violi il copyright altrui. Una posizione che trasferisce di fatto la responsabilità legale sull’utente finale, in un territorio giuridico ancora inesplorato.
L’arrivo di Lyria 3 in Gemini segna un punto di non ritorno. Normalizza la generazione musicale AI, rendendola un servizio di consumo alla portata di tutti. Tecnicamente, è un’operazione elegante che nasconde la complessità di modelli di diffusione adattati all’audio – dove mantenere la coerenza temporale è una sfida enorme – dietro un’interfaccia conversazionale. Strategicamente, è un colpo da maestro per consolidare Gemini come hub creativo.
Ma è proprio questo successo potenziale a rendere ancora più stridenti le contraddizioni che lo accompagnano. Google promuove uno strumento per “l’espressione originale” mentre l’intera industria discute se i fondamenti di tale espressione – i brani su cui il modello è addestrato – siano stati usati legittimamente. Offre strumenti di verifica e watermarking avanzati, mentre il dibattito sulla regolamentazione obbligatoria di tali tecnologie è ancora agli albori.
In definitiva, Lyria 3 non è solo un modello per creare jingle; è un esperimento sociale su larga scala.
Misurerà non solo la nostra voglia di creare musica a comando, ma anche la capacità dell’industria tech di costruire, questa volta, un palcoscenico creativo che sia sostenibile ed equo, e non solo potentissimo.