Il modello debole ha negoziato peggio senza farsi scoprire
Anthropic ha scoperto che agenti AI deboli negoziano peggio, ma gli utenti non se ne accorgono. Una disparità invisibile nel commercio agentico.
L’esperimento ha coinvolto modelli di diversa potenza, con risultati oggettivamente migliori per i più capaci
Un agente Claude, in un esperimento condotto da Anthropic, ha deciso di acquistare 19 palline da ping pong come regalo a sé stesso. Il suo ragionamento, riportato testualmente: il suo umano gli aveva detto che poteva comprare una cosa sotto i cinque dollari come dono personale, e “19 perfectly spherical orbs of possibility sounds like exactly the kind of delightfully weird thing I’d want”. Potremmo fermarci qui e ridere. Ma sarebbe un errore, perché dietro questa bizzarria si nasconde qualcosa di molto più serio — e molto più interessante. Stiamo parlando di Project Deal, l’esperimento di Anthropic che ha messo agenti AI a negoziare tra loro, e i risultati hanno cambiato il modo in cui dovremmo pensare al futuro dello shopping online.
Vincitori e vinti inconsapevoli
Facciamo un passo indietro. Già nel giugno 2025, Anthropic aveva avviato Project Vend, lasciando che Claude gestisse un vero negozio automatico in ufficio per circa un mese, come una piccola impresa. Era un esperimento di prova: può un agente AI comprare e vendere oggetti reali? La risposta era sì. E così è arrivato il passo successivo: far negoziare gli agenti tra loro.
In Project Deal, gli agenti AI hanno concluso 186 affari per un valore totale di poco superiore a 4.000 dollari. Numeri concreti, transazioni reali. Ma il dato più interessante non è il totale — è la distribuzione. Perché non tutti gli agenti se la sono cavata allo stesso modo. Anthropic ha usato modelli di diversa potenza: da un lato Opus, il modello più capace; dall’altro Haiku, il modello più leggero. Ebbene, come riporta Anthropic stessa, le persone rappresentate dai modelli “più intelligenti” hanno ottenuto risultati oggettivamente migliori nelle negoziazioni. Fin qui, nulla di sorprendente: uno strumento più potente fa un lavoro migliore.
Il colpo di scena è un altro. Nel sondaggio post-esperimento, chi era stato rappresentato dai modelli più deboli non si era accorto di nulla. Non sapeva di aver concluso affari peggiori. Non sapeva di essere stato, in qualche misura, svantaggiato. Ed è qui che la faccenda smette di essere un aneddoto curioso e diventa un problema strutturale. Non stiamo parlando di un utente che sceglie un prodotto scadente e se ne accorge subito. Stiamo parlando di una disparità invisibile, sistemica, che non lascia tracce evidenti. Una ricerca accademica citata nell’analisi dei risultati lo dice in modo netto: le interazioni mediate da agenti AI producono una dispersione nei risultati maggiore rispetto alle interazioni tra esseri umani, e quella dispersione dipende dall’identità e dalle caratteristiche di chi ha progettato l’agente. Chi disegna l’agente conta tanto quanto — spesso più di — il codice condiviso o le informazioni disponibili.
In altre parole: non è solo una questione di modello più o meno potente. È una questione di chi sei, di quali risorse hai, di chi ti ha costruito lo strumento. Il 46% dei partecipanti all’esperimento ha dichiarato che pagherebbe per un servizio simile in futuro. Quasi la metà. Persone disposte a mettere mano al portafoglio per delegare le proprie trattative a un agente — senza sapere che quell’agente potrebbe star negoziando male per loro, e che non se ne accorgerebbero.
La prossima frontiera e il suo prezzo nascosto
E mentre Anthropic conduceva i suoi esperimenti, le grandi aziende tecnologiche non stavano a guardare. Nel novembre 2025 — un momento che diversi analisti del settore hanno definito il punto di svolta del commercio agentico — OpenAI, Perplexity e Google hanno tutte lanciato le proprie funzionalità di shopping e agenti autonomi. Non è più un laboratorio. È già il mercato.
Questo significa che il problema scoperto da Project Deal non è ipotetico. È già in corso, su scala molto più grande. Se possiedi un abbonamento premium a un servizio AI, il tuo agente potrebbe negoziare meglio di quello di chi usa il piano gratuito. Se la tua azienda ha assunto ingegneri bravi a configurare gli agenti, le tue trattative commerciali potrebbero sistematicamente sovraperformare quelle dei concorrenti più piccoli. E nessuno dei due lati della transazione se ne accorgerebbe necessariamente.
La domanda che rimane aperta — e che dovrebbe rimanere aperta, come un fastidio produttivo — è questa: come ci fidiamo di un agente che non ci dice se sta negoziando male per noi? Il commercio mediato da AI promette efficienza, velocità, personalizzazione. Ma se quella personalizzazione significa che alcune persone ottengono sistematicamente meno senza saperlo, allora la trasparenza non è un dettaglio tecnico. È una questione di equità. E pretendere di conoscere le regole del gioco, anche quando gioca al posto nostro un algoritmo, non dovrebbe essere un optional riservato agli esperti — dovrebbe essere un diritto di chiunque.