Perplexity ha studiato se stessa
Perplexity pubblica uno studio su arXiv che mostra un taglio dell'87% del tempo, ma solleva dubbi su conflitto d'interessi e licenza restrittiva.
Lo studio è firmato da ricercatori legati a Perplexity, che ha confrontato il nuovo agente con il proprio motore di
L’87% in meno di tempo. Un dato così netto da sembrare uscito da un comunicato stampa piuttosto che da un paper accademico. Eppure l’articolo pubblicato su arXiv con identificativo 2606.07489 — intitolato How AI Agents Reshape Knowledge Work: Autonomy, Efficiency, and Scope e firmato da Jeremy Yang, Kate Zyskowski, Noah Yonack e Jerry Ma — sostiene esattamente questo: Perplexity Computer riduce il tempo medio di completamento delle attività da 269 a 36 minuti rispetto a esseri umani che usano solo Perplexity Search, abbattendo tempo e costi rispettivamente dell’87% e del 94%. Numeri che fanno girare la testa. La domanda è: girarla in quale direzione? Per approfondire la metodologia del paper, è disponibile anche la pagina abstract su arXiv.
Il numero che brucia
Prendiamo i dati per quello che sono. Secondo lo studio, il tasso di insoddisfazione per singola query è del 55% inferiore su Perplexity Computer rispetto a Perplexity Search. Il sistema, lanciato ufficialmente il 25 febbraio 2026, non è un semplice chatbot: crea ed esegue interi flussi di lavoro, capaci di girare per ore o addirittura mesi. Sotto il cofano, Perplexity Computer orchestra una costellazione di sotto-agenti specializzati — Gemini per la ricerca profonda, Nano Banana per le immagini, Veo 3.1 per i video, Grok per i compiti leggeri, ChatGPT 5.2 per i contesti lunghi — il tutto guidato da Opus 4.6 come motore di ragionamento principale.
In altri termini: un sistema che coordina altri sistemi AI per fare ciò che un lavoratore della conoscenza farebbe in quattro ore e mezza, in meno di quaranta minuti. Se fosse vero, cambierebbe tutto. Il problema è proprio quel “se”.
Chi guarda il guardiano?
Ma dietro i numeri c’è un paradosso che vale la pena di esaminare con attenzione. L’articolo è firmato da quattro ricercatori — Yang, Zyskowski, Yonack e Ma — che, stando alle affiliazioni indicate nel documento, sono legati a Perplexity. È Perplexity che studia Perplexity. È il produttore che misura l’efficacia del proprio prodotto, confrontandolo con un altro proprio prodotto (Search). Non è necessariamente disonesto, ma è una struttura di incentivi che qualsiasi lettore critico dovrebbe tenere presente prima di citare quell’87% come un fatto acquisito.
C’è poi la questione della licenza. L’articolo è distribuito sotto Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International: si può leggere, si può citare, ma non si può modificare né usare commercialmente. Una scelta inusuale per la ricerca accademica che si vuole aperta e riproducibile. La licenza ND — No Derivatives — impedisce per definizione che altri ricercatori prendano il lavoro, lo modifichino e lo correggano pubblicamente. In un campo dove la replicabilità è tutto, è una scelta che suona come una porta socchiusa, non spalancata.
Nel frattempo, il mercato si muove su binari paralleli. Già a gennaio 2025, OpenAI aveva rilasciato il suo Operator, un agente capace di navigare il web per eseguire compiti per conto dell’utente. La corsa agli agenti autonomi è aperta da mesi, e ogni azienda ha tutto l’interesse a pubblicare numeri che la posizionino come leader. La domanda “perché proprio ora?” non è retorica: Perplexity ha bisogno di giustificare il proprio valore di fronte a competitor enormemente più grandi, e un paper su arXiv — anche se non peer-reviewed nel senso tradizionale — ha il peso simbolico della ricerca scientifica. È una strategia di comunicazione travestita da epistemologia. E funziona.
Nessuno, per ora, sembra interrogarsi su cosa significhi avere agenti che operano in autonomia per settimane o mesi su dati aziendali sensibili. Le implicazioni in termini di GDPR e di responsabilità dei trattamenti automatizzati sono tutt’altro che risolte: chi è il titolare del trattamento quando è un agente AI a decidere quali dati raccogliere e come elaborarli? E le autorità antitrust dovrebbero forse chiedersi cosa accade quando un’unica piattaforma orchestra l’accesso a più modelli di terze parti — Gemini, Grok, ChatGPT — all’interno di un unico prodotto commerciale.
E il lavoro umano?
La domanda che nessuno pone con abbastanza insistenza è questa: se un agente comprime quattro ore e mezza di lavoro umano in trentasei minuti, cosa succede alle quattro ore rimanenti? Non spariscono: si spostano, si ridistribuiscono, oppure — nella versione meno ottimista — semplicemente non vengono più pagate. L’efficienza è reale, ammesso che i numeri lo siano. Ma l’efficienza per chi? Il paper misura il tempo risparmiato dall’utente finale. Non misura il valore che viene estratto, né a chi viene redistribuito.
Alla fine, l’87% di riduzione del tempo è un numero che dice molto su Perplexity e pochissimo sul futuro del lavoro. E il silenzio intorno a quella domanda è, forse, la cosa più rumorosa di tutto l’articolo.