Il dilemma dell'AI gratuita: il caso Airtel e Perplexity in India

Il dilemma dell’AI gratuita: il caso Airtel e Perplexity in India

La democratizzazione dell’AI generativa si scontra con i costi insostenibili dell’inferenza, mettendo a rischio i modelli freemium e sollevando interrogativi sul futuro dell’accesso a queste tecnologie.

C’è un vecchio detto nel mondo dello sviluppo software che recita: “Se non paghi per il prodotto, il prodotto sei tu”.

Tuttavia, nell’economia dell’intelligenza artificiale generativa del 2025, questa massima sta iniziando a mostrare delle crepe strutturali.

Il costo dell’inferenza — la potenza di calcolo necessaria per generare una risposta da un modello linguistico di grandi dimensioni (LLM) — è talmente elevato che nemmeno i dati degli utenti bastano più a coprire le spese vive.

L’India, in questi giorni, è diventata il laboratorio a cielo aperto dove si sta testando dolorosamente questo limite economico e tecnico.

Siamo partiti a luglio con promesse faraoniche di democratizzazione digitale, ma ci ritroviamo a dicembre con un brusco risveglio fatto di email automatiche e richieste di carte di credito.

La vicenda che coinvolge il gigante delle telecomunicazioni indiano Bharti Airtel e la startup californiana Perplexity AI non è solo una nota a margine commerciale; è un caso di studio su come la scalabilità tecnica si scontri violentemente con la realtà delle frodi online e dei costi operativi.

Quello che doveva essere un vantaggio competitivo “frictionless” (senza attrito) per gli utenti Airtel si è trasformato in un classico collo di bottiglia implementativo, sollevando dubbi sulla sostenibilità delle offerte “freemium” nel settore AI.

L’illusione dell’accesso senza attrito

Torniamo indietro a metà anno. La premessa era tecnicamente audace quanto commercialmente aggressiva: Airtel voleva portare l’AI generativa di fascia alta direttamente sugli smartphone di centinaia di milioni di indiani.

Il dilemma dell'AI gratuita: il caso Airtel e Perplexity in India + L'illusione dell'accesso senza attrito | Search Marketing Italia

Non parliamo di chatbot di base, ma di Perplexity Pro, un motore di risposta che utilizza la tecnica RAG (Retrieval-Augmented Generation) per sintetizzare informazioni in tempo reale, accedendo a modelli costosi come GPT-4 o Claude 3.5.

L’architettura dell’offerta sembrava disegnata per la massima adozione: un flusso OAuth semplificato tramite l’app “Airtel Thanks”, dove l’identità dell’utente veniva verificata tramite il numero di telefono e l’ID del dispositivo.

In quel contesto, Airtel ha annunciato una partnership strategica per offrire l’abbonamento Perplexity Pro a 360 milioni di clienti, una mossa che sulla carta valeva circa 17.000 rupie per utente all’anno.

Dal punto di vista ingegneristico, l’assenza di un gateway di pagamento era la “killer feature”. Eliminare la richiesta della carta di credito (CC) rimuoveva il più grande ostacolo all’onboarding, permettendo un’attivazione immediata del servizio.

Per uno sviluppatore, questa è l’eleganza dell’integrazione: l’utente clicca, il token di autenticazione viene scambiato nel backend, e il servizio è attivo.

Tuttavia, rimuovere la barriera della carta di credito ha un effetto collaterale noto a chiunque gestisca API pubbliche: si apre la porta all’abuso sistematico.

Senza la verifica forte che una transazione bancaria (anche di importo zero) garantisce, il sistema si basa esclusivamente sulla fiducia nell’identificativo dell’operatore telefonico.

E come vedremo, fidarsi ciecamente di un ID utente in un mercato vasto e tecnicamente smaliziato come quello indiano è stato un errore di calcolo sottostimato dagli architetti della soluzione.

Il costo computazionale della gratuità

Arriviamo a dicembre. L’entusiasmo iniziale si è scontrato con i log dei server. Perplexity ha iniziato a notare pattern di traffico anomali.

Non si trattava solo di studenti o professionisti che facevano ricerche; c’erano segnali di “rogue users”, utenti canaglia che probabilmente sfruttavano l’accesso gratuito per automatizzare query o rivendere l’accesso alle API sottostanti.

L’inferenza di un modello AI non è come servire una pagina HTML statica; ogni query consuma una quantità significativa di GPU e di elettricità.

Se un utente legittimo fa 10 ricerche al giorno, il costo è gestibile.

Se uno script ne fa 300 (il limite giornaliero del piano Pro) ogni giorno su migliaia di account simulati, il modello economico collassa.

La risposta è stata drastica e tecnicamente “sporca” rispetto all’eleganza iniziale.

Con una mossa retroattiva che ha fatto storcere il naso a molti esperti di UX, Perplexity ha rivisto la politica dell’offerta richiedendo l’inserimento di un metodo di pagamento valido per mantenere attivo il periodo di prova.

Le email con oggetto “Action Required” hanno iniziato a piovere nelle caselle di posta degli utenti Airtel.

Tecnicamente, stiamo parlando dell’introduzione di un controllo AVS (Address Verification Service) forzato.

Inserendo una carta di debito o credito, l’utente non sta solo preparando il terreno per un futuro rinnovo automatico (che comunque può essere disdetto), ma sta fornendo una prova crittografica di identità bancaria.

È un deterrente formidabile contro i bot farm: generare numeri di telefono virtuali è facile ed economico; generare carte di credito valide e univoche su larga scala è molto più complesso e rischioso.

Ma questa sicurezza ha un prezzo: la frizione.

Quello che era un flusso “one-click” è diventato un processo burocratico che richiede fiducia, e in un panorama digitale dove il phishing è all’ordine del giorno, chiedere i dati della carta per un servizio “gratuito” è il modo più veloce per uccidere il tasso di conversione.

Scalabilità e abuso: il backend scricchiola

Bisogna guardare sotto il cofano di Perplexity per capire perché questa misura, seppur impopolare, fosse inevitabile.

A differenza di un motore di ricerca tradizionale che indicizza e recupera, un “Answer Engine” deve eseguire passaggi computazionalmente pesanti: comprendere la query semantica, interrogare indici multipli in tempo reale, leggere i contenuti, e infine generare una sintesi coerente citando le fonti.

Il piano Pro offerto include l’upload di file illimitati per l’analisi dati e la generazione di immagini tramite modelli come DALL-E o Flux.

Queste non sono feature a costo marginale zero.

Ogni immagine generata, ogni PDF analizzato, è una chiamata API che Perplexity paga ai provider di modelli (o sostiene sui propri cluster). Non sorprende quindi che i dettagli della promozione confermino una durata di 12 mesi per l’accesso gratuito, ma omettano di specificare quanto costerà all’azienda sostenere milioni di utenti che spingono l’infrastruttura al limite senza un ritorno immediato.

La decisione di erigere un “muro di pagamento” (anche se per ora a costo zero) a metà corsa dimostra una mancanza di previsione nell’architettura di sicurezza iniziale.

È raro vedere un’azienda tech dover fare marcia indietro in modo così pubblico su un meccanismo di autenticazione.

Solitamente, si implementano limiti di rate limiting più aggressivi o si fa shadow banning degli account sospetti. Il fatto che si sia ricorsi alla richiesta della carta di credito suggerisce che l’abuso fosse sistemico e non arginabile via software lato server.

Questa vicenda solleva una questione fondamentale per il futuro dell’AI consumer: è possibile offrire strumenti di questa potenza al mercato di massa senza barriere all’ingresso finanziarie?

O l’architettura stessa dei Large Language Models, con i loro costi operativi proibitivi, renderà l’anonimato e la gratuità un ricordo del “vecchio” web?

L’esperimento indiano di Airtel e Perplexity suggerisce che, quando il conto del cloud arriva, qualcuno deve pur firmare la ricevuta.

Facebook X Network Pinterest Instagram
🍪 Impostazioni Cookie