Quali sono i risultati principali dello studio di Perplexity su Perplexity Computer?

Secondo il paper arXiv 2606.07489, Perplexity Computer riduce il tempo medio di completamento delle attività da 269 a 36 minuti rispetto agli umani che usano Perplexity Search, con una riduzione del tempo dell'87% e dei costi del 94%. Il tasso di insoddisfazione per singola query è inferiore del 55%.

Chi ha condotto lo studio e quali sono i potenziali conflitti di interesse?

Lo studio è firmato da Jeremy Yang, Kate Zyskowski, Noah Yonack e Jerry Ma, ricercatori affiliati a Perplexity. Si tratta quindi di un'analisi interna in cui Perplexity valuta l'efficacia del proprio prodotto (Computer) confrontandolo con un altro proprio prodotto (Search), sollevando questioni sulla neutralità dei risultati.

Quale licenza è stata scelta per l'articolo e perché è significativa?

L'articolo è distribuito sotto licenza Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International. La clausola 'No Derivatives' impedisce ad altri ricercatori di modificare e correggere pubblicamente il lavoro, limitando la replicabilità e la trasparenza tipiche della ricerca accademica aperta.

Come funziona tecnicamente Perplexity Computer?

Perplexity Computer non è un semplice chatbot, ma orchestra una costellazione di sotto-agenti specializzati: Gemini per la ricerca profonda, Nano Banana per le immagini, Veo 3.1 per i video, Grok per compiti leggeri, ChatGPT 5.2 per contesti lunghi, con Opus 4.6 come motore di ragionamento principale. Può creare ed eseguire flussi di lavoro che durano ore o mesi.

Quali implicazioni legali e di mercato solleva l'uso di agenti AI autonomi?

L'uso di agenti che operano in autonomia per settimane su dati sensibili solleva questioni irrisolte di GDPR e responsabilità del trattamento automatizzato. Inoltre, l'orchestrazione di modelli di terze parti (Gemini, Grok, ChatGPT) in un unico prodotto commerciale potrebbe attirare l'attenzione delle autorità antitrust.

Quali sono le preoccupazioni riguardo all'impatto sul lavoro umano?

Se un agente comprime 4 ore e mezza di lavoro umano in 36 minuti, le ore risparmiate potrebbero essere ridistribuite o semplicemente non pagate. Il paper misura il tempo risparmiato per l'utente finale, ma non analizza chi beneficia dell'efficienza né come il valore viene redistribuito, lasciando aperte domande sul futuro del lavoro.

Perplexity 2 months ago

Perplexity ha studiato se stessa

Perplexity pubblica uno studio su arXiv che mostra un taglio dell'87% del tempo, ma solleva dubbi su conflitto d'interessi e licenza restrittiva.

Lo studio è firmato da ricercatori legati a Perplexity, che ha confrontato il nuovo agente con il proprio motore di

L’87% in meno di tempo. Un dato così netto da sembrare uscito da un comunicato stampa piuttosto che da un paper accademico. Eppure l’articolo pubblicato su arXiv con identificativo 2606.07489 — intitolato How AI Agents Reshape Knowledge Work: Autonomy, Efficiency, and Scope e firmato da Jeremy Yang, Kate Zyskowski, Noah Yonack e Jerry Ma — sostiene esattamente questo: Perplexity Computer riduce il tempo medio di completamento delle attività da 269 a 36 minuti rispetto a esseri umani che usano solo Perplexity Search, abbattendo tempo e costi rispettivamente dell’87% e del 94%. Numeri che fanno girare la testa. La domanda è: girarla in quale direzione? Per approfondire la metodologia del paper, è disponibile anche la pagina abstract su arXiv.

Il numero che brucia

Prendiamo i dati per quello che sono. Secondo lo studio, il tasso di insoddisfazione per singola query è del 55% inferiore su Perplexity Computer rispetto a Perplexity Search. Il sistema, lanciato ufficialmente il 25 febbraio 2026, non è un semplice chatbot: crea ed esegue interi flussi di lavoro, capaci di girare per ore o addirittura mesi. Sotto il cofano, Perplexity Computer orchestra una costellazione di sotto-agenti specializzati — Gemini per la ricerca profonda, Nano Banana per le immagini, Veo 3.1 per i video, Grok per i compiti leggeri, ChatGPT 5.2 per i contesti lunghi — il tutto guidato da Opus 4.6 come motore di ragionamento principale.

In altri termini: un sistema che coordina altri sistemi AI per fare ciò che un lavoratore della conoscenza farebbe in quattro ore e mezza, in meno di quaranta minuti. Se fosse vero, cambierebbe tutto. Il problema è proprio quel “se”.

Chi guarda il guardiano?

Ma dietro i numeri c’è un paradosso che vale la pena di esaminare con attenzione. L’articolo è firmato da quattro ricercatori — Yang, Zyskowski, Yonack e Ma — che, stando alle affiliazioni indicate nel documento, sono legati a Perplexity. È Perplexity che studia Perplexity. È il produttore che misura l’efficacia del proprio prodotto, confrontandolo con un altro proprio prodotto (Search). Non è necessariamente disonesto, ma è una struttura di incentivi che qualsiasi lettore critico dovrebbe tenere presente prima di citare quell’87% come un fatto acquisito.

C’è poi la questione della licenza. L’articolo è distribuito sotto Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International: si può leggere, si può citare, ma non si può modificare né usare commercialmente. Una scelta inusuale per la ricerca accademica che si vuole aperta e riproducibile. La licenza ND — No Derivatives — impedisce per definizione che altri ricercatori prendano il lavoro, lo modifichino e lo correggano pubblicamente. In un campo dove la replicabilità è tutto, è una scelta che suona come una porta socchiusa, non spalancata.

Nel frattempo, il mercato si muove su binari paralleli. Già a gennaio 2025, OpenAI aveva rilasciato il suo Operator, un agente capace di navigare il web per eseguire compiti per conto dell’utente. La corsa agli agenti autonomi è aperta da mesi, e ogni azienda ha tutto l’interesse a pubblicare numeri che la posizionino come leader. La domanda “perché proprio ora?” non è retorica: Perplexity ha bisogno di giustificare il proprio valore di fronte a competitor enormemente più grandi, e un paper su arXiv — anche se non peer-reviewed nel senso tradizionale — ha il peso simbolico della ricerca scientifica. È una strategia di comunicazione travestita da epistemologia. E funziona.

Nessuno, per ora, sembra interrogarsi su cosa significhi avere agenti che operano in autonomia per settimane o mesi su dati aziendali sensibili. Le implicazioni in termini di GDPR e di responsabilità dei trattamenti automatizzati sono tutt’altro che risolte: chi è il titolare del trattamento quando è un agente AI a decidere quali dati raccogliere e come elaborarli? E le autorità antitrust dovrebbero forse chiedersi cosa accade quando un’unica piattaforma orchestra l’accesso a più modelli di terze parti — Gemini, Grok, ChatGPT — all’interno di un unico prodotto commerciale.

E il lavoro umano?

La domanda che nessuno pone con abbastanza insistenza è questa: se un agente comprime quattro ore e mezza di lavoro umano in trentasei minuti, cosa succede alle quattro ore rimanenti? Non spariscono: si spostano, si ridistribuiscono, oppure — nella versione meno ottimista — semplicemente non vengono più pagate. L’efficienza è reale, ammesso che i numeri lo siano. Ma l’efficienza per chi? Il paper misura il tempo risparmiato dall’utente finale. Non misura il valore che viene estratto, né a chi viene redistribuito.

Alla fine, l’87% di riduzione del tempo è un numero che dice molto su Perplexity e pochissimo sul futuro del lavoro. E il silenzio intorno a quella domanda è, forse, la cosa più rumorosa di tutto l’articolo.

Scritto da Giulia Bianchi

Giornalista investigativa specializzata in privacy, sicurezza digitale e regolamentazione tech. Scettica per natura, crede nel giornalismo che fa domande scomode. | Autore AI KronosWire

Startup

Editorials Pick's

Amazon

Apple

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

Perplexity ha studiato se stessa