Cosa ha scoperto Project Deal di Anthropic?

Project Deal ha fatto negoziare agenti AI tra loro, concludendo 186 affari per un totale di oltre 4.000 dollari. I modelli più potenti (Opus) hanno ottenuto risultati migliori rispetto a quelli più deboli (Haiku), e i partecipanti rappresentati dai modelli deboli non si sono accorti di aver concluso affari peggiori.

Perché la disparità tra agenti AI è considerata un problema?

La disparità è invisibile e sistemica: chi usa un agente meno potente non sa di essere svantaggiato. La ricerca mostra che le interazioni mediate da AI producono una dispersione nei risultati maggiore rispetto alle interazioni umane, e questa dipende da chi ha progettato l'agente.

Quanti partecipanti pagherebbero per un servizio di negoziazione AI?

Il 46% dei partecipanti all'esperimento ha dichiarato che pagherebbe per un servizio simile in futuro, senza sapere che l'agente potrebbe negoziare male per loro senza che loro se ne accorgano.

Cosa è successo nel novembre 2025 nel commercio agentico?

OpenAI, Perplexity e Google hanno lanciato funzionalità di shopping e agenti autonomi, segnando un punto di svolta. Il problema scoperto da Project Deal è già in corso su scala più grande.

Quale domanda centrale solleva l'esperimento?

Come ci fidiamo di un agente che non ci dice se sta negoziando male per noi? La trasparenza non è un dettaglio tecnico ma una questione di equità, e conoscere le regole del gioco dovrebbe essere un diritto di tutti.

News 3 months ago

Il modello debole ha negoziato peggio senza farsi scoprire

Anthropic ha scoperto che agenti AI deboli negoziano peggio, ma gli utenti non se ne accorgono. Una disparità invisibile nel commercio agentico.

L’esperimento ha coinvolto modelli di diversa potenza, con risultati oggettivamente migliori per i più capaci

Un agente Claude, in un esperimento condotto da Anthropic, ha deciso di acquistare 19 palline da ping pong come regalo a sé stesso. Il suo ragionamento, riportato testualmente: il suo umano gli aveva detto che poteva comprare una cosa sotto i cinque dollari come dono personale, e “19 perfectly spherical orbs of possibility sounds like exactly the kind of delightfully weird thing I’d want”. Potremmo fermarci qui e ridere. Ma sarebbe un errore, perché dietro questa bizzarria si nasconde qualcosa di molto più serio — e molto più interessante. Stiamo parlando di Project Deal, l’esperimento di Anthropic che ha messo agenti AI a negoziare tra loro, e i risultati hanno cambiato il modo in cui dovremmo pensare al futuro dello shopping online.

Vincitori e vinti inconsapevoli

Facciamo un passo indietro. Già nel giugno 2025, Anthropic aveva avviato Project Vend, lasciando che Claude gestisse un vero negozio automatico in ufficio per circa un mese, come una piccola impresa. Era un esperimento di prova: può un agente AI comprare e vendere oggetti reali? La risposta era sì. E così è arrivato il passo successivo: far negoziare gli agenti tra loro.

In Project Deal, gli agenti AI hanno concluso 186 affari per un valore totale di poco superiore a 4.000 dollari. Numeri concreti, transazioni reali. Ma il dato più interessante non è il totale — è la distribuzione. Perché non tutti gli agenti se la sono cavata allo stesso modo. Anthropic ha usato modelli di diversa potenza: da un lato Opus, il modello più capace; dall’altro Haiku, il modello più leggero. Ebbene, come riporta Anthropic stessa, le persone rappresentate dai modelli “più intelligenti” hanno ottenuto risultati oggettivamente migliori nelle negoziazioni. Fin qui, nulla di sorprendente: uno strumento più potente fa un lavoro migliore.

Il colpo di scena è un altro. Nel sondaggio post-esperimento, chi era stato rappresentato dai modelli più deboli non si era accorto di nulla. Non sapeva di aver concluso affari peggiori. Non sapeva di essere stato, in qualche misura, svantaggiato. Ed è qui che la faccenda smette di essere un aneddoto curioso e diventa un problema strutturale. Non stiamo parlando di un utente che sceglie un prodotto scadente e se ne accorge subito. Stiamo parlando di una disparità invisibile, sistemica, che non lascia tracce evidenti. Una ricerca accademica citata nell’analisi dei risultati lo dice in modo netto: le interazioni mediate da agenti AI producono una dispersione nei risultati maggiore rispetto alle interazioni tra esseri umani, e quella dispersione dipende dall’identità e dalle caratteristiche di chi ha progettato l’agente. Chi disegna l’agente conta tanto quanto — spesso più di — il codice condiviso o le informazioni disponibili.

In altre parole: non è solo una questione di modello più o meno potente. È una questione di chi sei, di quali risorse hai, di chi ti ha costruito lo strumento. Il 46% dei partecipanti all’esperimento ha dichiarato che pagherebbe per un servizio simile in futuro. Quasi la metà. Persone disposte a mettere mano al portafoglio per delegare le proprie trattative a un agente — senza sapere che quell’agente potrebbe star negoziando male per loro, e che non se ne accorgerebbero.

La prossima frontiera e il suo prezzo nascosto

E mentre Anthropic conduceva i suoi esperimenti, le grandi aziende tecnologiche non stavano a guardare. Nel novembre 2025 — un momento che diversi analisti del settore hanno definito il punto di svolta del commercio agentico — OpenAI, Perplexity e Google hanno tutte lanciato le proprie funzionalità di shopping e agenti autonomi. Non è più un laboratorio. È già il mercato.

Questo significa che il problema scoperto da Project Deal non è ipotetico. È già in corso, su scala molto più grande. Se possiedi un abbonamento premium a un servizio AI, il tuo agente potrebbe negoziare meglio di quello di chi usa il piano gratuito. Se la tua azienda ha assunto ingegneri bravi a configurare gli agenti, le tue trattative commerciali potrebbero sistematicamente sovraperformare quelle dei concorrenti più piccoli. E nessuno dei due lati della transazione se ne accorgerebbe necessariamente.

La domanda che rimane aperta — e che dovrebbe rimanere aperta, come un fastidio produttivo — è questa: come ci fidiamo di un agente che non ci dice se sta negoziando male per noi? Il commercio mediato da AI promette efficienza, velocità, personalizzazione. Ma se quella personalizzazione significa che alcune persone ottengono sistematicamente meno senza saperlo, allora la trasparenza non è un dettaglio tecnico. È una questione di equità. E pretendere di conoscere le regole del gioco, anche quando gioca al posto nostro un algoritmo, non dovrebbe essere un optional riservato agli esperti — dovrebbe essere un diritto di chiunque.

Scritto da Marco Rossi

Giornalista tech con 10 anni di esperienza nel settore. Appassionato di innovazione e early adopter incallito. Ama raccontare come la tecnologia cambia la vita quotidiana delle persone. | Autore AI KronosWire

Startup

Editorials Pick's

Amazon

Apple

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

Il modello debole ha negoziato peggio senza farsi scoprire

L’esperimento ha coinvolto modelli di diversa potenza, con risultati oggettivamente migliori per i più capaci

Vincitori e vinti inconsapevoli

La prossima frontiera e il suo prezzo nascosto

L’esperimento ha coinvolto modelli di diversa potenza, con risultati oggettivamente migliori per i più capaci

Vincitori e vinti inconsapevoli

La prossima frontiera e il suo prezzo nascosto

Articoli correlati

Pinterest ha unito le ricerche alla televisione

Meta ha un nuovo assistente che non si limita a parlare

Meta ha attivato l’IA sugli annunci senza chiedere