Yandex Maps ha iniziato a leggere i menu con un agente IA
Yandex Maps ha introdotto un agente IA che analizza menu, recensioni e foto per rispondere a ricerche semantiche specifiche, trasformando l'app in un assistente intelligente.
La rete neurale analizza menu, recensioni e foto per rispondere a richieste specifiche su ristoranti e servizi
Immagina di digitare «consigliami un ristorante con il risotto vicino a Paveletskaya» su una mappa. Non ottieni una lista di locali filtrati per categoria, ma una risposta che ha già letto i menu, scorso le recensioni e analizzato le foto di ogni posto nelle vicinanze. Giovedì scorso, secondo l’annuncio ufficiale di Yandex, questa funzionalità è diventata disponibile in Yandex Maps: la rete neurale integrata seleziona ristoranti in base alla presenza di specifiche voci di menu o servizi, e li mostra direttamente sulla mappa. Non è una ricerca per parole chiave migliorata — è qualcosa di strutturalmente diverso.
L’IA che legge menu, foto e recensioni in tempo reale
Il caso d’uso più immediato è quello gastronomico, ma la portata della funzionalità va oltre. Quando si interroga il sistema per trovare un ristorante con un piatto specifico, la rete neurale non si limita a controllare il nome del locale o la sua categoria: analizza descrizioni del luogo, recensioni degli utenti, la sezione dedicata al menu e persino le fotografie caricate nella scheda dell’esercizio. Lo stesso meccanismo funziona per cercare saloni di bellezza che offrano procedure cosmetiche particolari — manicure hardware, taglio della frangia, drenaggio linfatico — oppure cliniche mediche filtrate per servizi come analisi del sangue o ecografie. In sostanza, qualsiasi business con dati strutturati o semi-strutturati nella propria scheda diventa interrogabile a livello semantico.
Il salto concettuale rispetto a una ricerca tradizionale sta nella granularità: prima, cercare «ristorante italiano vicino a me» restituiva locali taggati come italiani. Ora il sistema può rispondere alla domanda implicita «questo posto ha effettivamente il risotto in carta?», andando a verificarlo nei dati reali caricati dal gestore o estratti dalle recensioni degli utenti.
Sotto il cofano: architettura agentica sequenziale
La risposta tecnica a «come fa?» è nell’architettura scelta da Yandex: un approccio agentico. Non un singolo modello che riceve una query e produce un output, ma un agente dedicato che scompone la richiesta in componenti semantiche e le processa in sequenza su fonti dati diverse. Prendendo l’esempio del risotto a Paveletskaya, il sistema estrae tre componenti: tipo di locale, piatto specifico, area geografica. Poi interroga in sequenza descrizioni dei locali, menu, recensioni e foto — costruendo un contesto progressivo invece di eseguire un unico lookup.
L’analogia utile è quella con un RAG pipeline (Retrieval-Augmented Generation) multi-step, dove ogni step di retrieval condiziona il successivo. Non si tratta di recuperare documenti e passarli al modello in blocco: l’agente decide quale fonte consultare, cosa cercare in quella fonte, e integra il risultato prima di passare alla successiva. Questo approccio gestisce bene l’eterogeneità dei dati — testo libero nelle recensioni, struttura semi-formale nei menu, dati visivi nelle foto — perché ogni fonte viene processata con la strategia appropriata invece di essere appiattita in un unico embedding.
Secondo l’approfondimento sull’architettura agentica pubblicato da Abit.ee, l’agente «non si limita a confrontare parole chiave — interroga più fonti di dati una per volta e costruisce un contesto completo». È questa costruzione incrementale del contesto che distingue un agente da un motore di ricerca avanzato: il risultato finale non è la migliore corrispondenza a una query statica, ma la risposta più coerente rispetto a un contesto che si è arricchito durante l’elaborazione. La conseguenza pratica è che Yandex sta trasformando Yandex Maps da app di navigazione in un assistente AI a tutti gli effetti — un percorso che ha implicazioni dirette per chi progetta sistemi simili.
Il panorama competitivo e cosa significa per chi sviluppa
Yandex non è il solo a muoversi in questa direzione, ma l’approccio agentico sequenziale la distingue dai competitor più vicini. Nel 2025, Yelp Assistant ha introdotto la capacità di rispondere a qualsiasi domanda su un’attività commerciale, e la funzione Menu Vision ha aggiunto la possibilità di puntare la fotocamera su un menu fisico per vedere foto e recensioni dei singoli piatti. È un’idea elegante per il mondo offline, ma rimane un arricchimento visivo puntuale — non un sistema che ragiona su più fonti in sequenza. Apple Maps, sempre nel 2025, ha integrato classifiche da fonti autorevoli come la guida classifiche MICHELIN in Apple Maps — stelle, Green Star, Bib Gourmand — una mossa orientata alla curation editoriale più che alla comprensione semantica. Google, dal canto suo, sta esplorando le funzionalità di navigazione Gemini per gestire attività multi-step all’interno di Maps: chiedere un ristorante economico con opzioni vegane lungo il percorso, con informazioni sul parcheggio, o persino aggiungere un evento al calendario direttamente dalla conversazione. Un approccio conversazionale che dimostra come l’architettura agentica regga alla scala produzione.
Il confronto mostra tre strategie diverse: curation editoriale (Apple), arricchimento visivo puntuale (Yelp Menu Vision), ragionamento sequenziale su dati eterogenei (Yandex, con Google che converge in quella direzione). Per chi sviluppa applicazioni location-aware, la lezione tecnica è chiara: lo stack non si esaurisce più con geocoding, routing e un layer di ricerca full-text. Servono agenti capaci di interrogare fonti dati eterogenee in sequenza, gestire contesti parziali e costruire risposte coerenti attraverso più step di retrieval. Con 95 milioni di utenti mensili tra web e mobile, Yandex Maps non sta sperimentando in un laboratorio — sta validando questa architettura in produzione, su scala reale e su dati reali. Per gli sviluppatori, questo significa progettare sistemi che integrano agenti IA capaci di ragionare su dati eterogenei: il futuro delle mappe è nelle mani di chi sa costruire contesto, non solo percorsi.