Google ha attivato i comandi vocali su YouTube

Google ha attivato i comandi vocali su YouTube

Google testa domande vocali da AI Overview e flag audio su YouTube, avvicinando la ricerca a una conversazione naturale.

Google testa il controllo vocale su YouTube con tre flag sperimentali

Immaginate di avere le mani infarinate, un video di YouTube in sottofondo che spiega come fare la pasta sfoglia, e di dover chiedere: “E se uso la farina integrale?”. Fino a poco fa avreste dovuto fermarvi, digitare, impazzire con la tastiera. Oggi, invece, potete rivolgere la domanda ad alta voce e ricevere una risposta immediata. Google ha cominciato a testare la possibilità di porre domande di follow-up direttamente da un AI Overview, trasformando la ricerca in una vera conversazione.

Non è un esperimento di nicchia. La stessa interfaccia conversazionale è già esperienza conversazionale disponibile su desktop e mobile in tutto il mondo. Ma il vero segnale che stiamo per cambiare modo di cercare arriva da un angolo apparentemente lontano: i flag sperimentali su YouTube.

I segreti audio che Google ha acceso in sordina

Se aprite un video pubblicato per gli sviluppatori Android – questo video sullo sviluppo adattivo – e guardate i parametri interni, scoprirete che Google ha attivato tre flag: attmusi, attmusiw e client_ui_enable_multi_track_audio_on_web_embedded_player. Tradotto: il player sta preparando tracce audio multiple e un sistema di controllo vocale. Non sono funzioni pubbliche, ma test silenziosi per un’interfaccia che permetta di interagire con i video parlando, senza più toccare lo schermo. La combinazione con AI Mode – il motore di ricerca conversazionale di Google – non è casuale: è il tassello mancante per una ricerca completamente vocale.

AI Mode, intanto, ha già superato AI Mode da 1 miliardo di utenti mensili. Il modello predefinito è modello predefinito Gemini 3.5 Flash, e le query crescono a un ritmo impressionante: raddoppio trimestrale delle query AI Mode dal lancio. Non serve essere ingegneri per capire cosa significa: la ricerca parlata non è più un gadget, sta diventando la norma.

Cosa cambia per chi cerca con la voce

Il passaggio alla voce cambia tutto il rapporto con i contenuti. Non dovrete più formulare domande brevi e precise come “tempo Roma domani”. Potrete dire “che tempo farà domani a Roma? E posso portare i bambini al parco?” e ottenere una risposta articolata, con link e approfondimenti. Google ha lanciato la nuova esperienza di ricerca AI unificata su desktop e mobile in tutto il mondo. Il risultato è un motore che non si limita a restituire pagine, ma capisce che state cucinando, che avete le mani occupate, che volete una risposta veloce senza interrompere il video.

Ma c’è un rovescio che va tenuto d’occhio. Un assistente che ascolta sempre, sa dove siete, cosa guardate e a che ora. La privacy diventa il vero prezzo della comodità.

Google ha assicurato che i dati vocali non vengono conservati oltre la singola sessione, ma la storia recente ci insegna che le promesse possono cambiare. Tenere gli occhi aperti su quali informazioni finiscono nei server – e come vengono usate – non è paranoia, è prudenza.

Il prossimo passo: quando il silenzio sarà l’eccezione

Se la tendenza continua, presto parleremo con il telefono come con un collega. I flag su YouTube lasciano presagire una piattaforma in cui ogni video potrà essere interrogato a voce: “quanto zucchero serve in questa ricetta?” e il player vi risponderà sul momento. I 70 milioni di ore di contenuti caricati ogni giorno su YouTube diventeranno un archivio vocale interattivo. La domanda da farsi ora non è se accadrà, ma quanto velocemente saremo disposti ad abituarci a un’interfaccia che non richiede più le dita.

🍪 Impostazioni Cookie