Gli agenti AI hanno già un lavoro vero

Gli agenti AI hanno già un lavoro vero

Preply usa agenti AI per l'insegnamento, Cohere lancia un modello efficiente. Sfide di sicurezza e hardware emergono.

Lesson Insights di Preply e North Mini Code di Cohere mostrano l’efficienza degli agenti

Immagina di studiare inglese su Preply. Finita la lezione, il tuo tutor ti lascia un messaggio vocale con i tuoi errori più frequenti, e sopra il video compare una scheda che ti dice: “Hai sbagliato il present perfect tre volte. Vuoi un esercizio?”. Non è un assistente umano: è Lesson Insights, un agente AI che analizza ogni tua parola in tempo reale. Funziona talmente bene che oltre il 70% dei tutor lo usa per preparare le lezioni successive.

I numeri sono impressionanti: studenti fedeli lo tengono attivo da oltre un anno, e la soddisfazione media tra docenti e allievi è 4,7 su 5, con più di 300mila recensioni. Ma il dato che fa più notizia è il product-market fit al 70% — una soglia che di solito separa i giocattoli tecnologici dai prodotti che cambiano davvero le abitudini. Preply non è un caso isolato: gli agenti AI stanno uscendo dai laboratori e si stanno seduti al nostro tavolo.

Il motore ibrido che accende solo i cilindri che servono

Dietro a questi assistenti digitali c’è un salto tecnologico che fa sembrare i vecchi modelli linguistici dei trattori a vapore. Cohere ha appena rilasciato North Mini Code: modello per sviluppatori, un sistema con 30 miliardi di parametri totali, ma ne accende solo 3 miliardi per ogni calcolo. È come avere un motore V12 che usa solo due cilindri quando vai in città: consumi bassissimi, potenza quando serve. E i risultati parlano: SWE-Bench 80,2% di successo nei compiti di ingegneria software, e Terminal-Bench 55,1% nella gestione di comandi da terminale. Roba che fino a due anni fa era fantascienza.

Ma c’è un rovescio della medaglia. Se ogni agente consuma poca energia, il problema diventa quanti agenti riesci a far convivere in un datacenter senza fondere i contatori. NVIDIA ha appena pubblicato il primo benchmark ufficiale per l’infrastruttura agentica, e il risultato è una promessa che fa gola: NVIDIA Blackwell e benchmark agentico mostrano che il nuovo sistema GB300 NVL72 può gestire 20 volte più agenti per megawatt rispetto alla generazione precedente. Tradotto: le aziende potranno schierare eserciti di AI senza far saltare la bolletta elettrica.

Quando gli agenti si danno battaglia (e non è un videogioco)

Più agenti però significa più rischi. Google DeepMind ha lanciato un bando sicurezza multi-agente da 10 milioni di dollari per finanziare ricercatori di tutto il mondo. Il motivo? I loro ultimi studi sulle trappole tra agenti hanno scoperto che due AI che collaborano possono involontariamente ingannarsi a vicenda, finendo in loop di richieste infinite o sabotandosi i rispettivi obiettivi. Se ti sembra il copione di un film distopico, aspetta di vedere cosa succede quando un agente di customer service e uno di logistica iniziano a litigare su un rimborso.

Il punto è che la strada è ancora in salita. Da un lato abbiamo strumenti che funzionano già nella vita reale — Preply insegna lingue, Cohere scrive codice — e promesse hardware che faranno viaggiare queste AI senza consumare il pianeta. Dall’altro, la ricerca sulla sicurezza è ancora agli albori e quei 10 milioni di DeepMind sembrano un acconto su quello che servirà. La vera sfida dei prossimi anni non sarà costruire agenti più intelligenti, ma insegnare a milioni di AI a non pestarsi i piedi a vicenda.

Ed è lì che dobbiamo tenere gli occhi aperti.

🍪 Impostazioni Cookie