OpenAI ha nascosto i suoi agenti dentro Excel e Chrome
OpenAI pubblica video di Codex che controlla Excel, Chrome e CRM. L'agente agisce come un umano, senza interfaccia separata.
L’agente Codex controlla Excel, Chrome e CRM senza interfaccia separata
Il 15 maggio 2026 OpenAI pubblica un video che mostra un agente AI che apre Excel, interroga una tabella finanziaria, modifica formule e scrive il report senza che l’utente tocchi il foglio. Non è un assistente vocale sovrapposto: è l’agente Codex che agisce dentro gli strumenti quotidiani, usando la loro interfaccia nativa. L’8 maggio Codex aveva già imparato a controllare Chrome direttamente su macOS e Windows. Il 14 maggio era arrivato in anteprima sull’app mobile di ChatGPT. L’AI smette di essere una finestra separata e diventa un’infiltrazione silenziosa nei tool che già usiamo — Excel, browser, CRM.
L’agente invisibile: da come controlla Chrome a come abita il CRM
Codex non richiede una nuova interfaccia. Funziona come un agente che manipola direttamente il software, esattamente come farebbe un umano: clicca, scrive, legge notifiche. Nel video Computer use in Codex (12 maggio) si vede l’agente navigare pagine web, compilare moduli e estrarre dati — tutto dentro Chrome. La differenza tecnica è che l’interazione non passa per API pubbliche, ma per un controllo a basso livello dello schermo e degli eventi di sistema. Per i team di vendita, lo stesso agente si innesta nel CRM: OpenAI ha pubblicato una guida per team di vendita su Codex che elenca quattro casi d’uso concreti. Il primo è la prioritizzazione del pipeline da account sottoutilizzati. Per farlo Codex ha bisogno di una lista di account, record CRM, note, trascrizioni di chiamate, thread email, segnali di utilizzo e aggiornamenti GTM. Il secondo caso d’uso è la preparazione e follow-up delle riunioni. Il terzo: revisione delle previsioni e monitoraggio dei rischi di commit. Il quarto: aggiornamento del piano account strategico. In ogni caso i venditori mantengono il giudizio e la strategia relazionale; Codex accelera solo la bozza di lavoro.
L’agente non si vede, ma è già lì.
Sotto il cofano: embedding multilingua e sostituzione drop-in
Per funzionare dentro strumenti eterogenei come Excel, Chrome o un CRM, Codex ha bisogno di capire il contesto semantico senza interrompere il flusso. È qui che entrano in gioco i modelli di embedding. IBM ha rilasciato il modello Granite Embedding Multilingual R2 con licenza Apache 2.0, finestra di contesto da 32K token e compatibilità con sentence-transformers e transformers. Ma la scelta architetturale che lo rende interessante per chi costruisce agenti è un’altra: questi modelli funzionano come sostituti drop-in nei framework di agenti come LangChain, LlamaIndex, Haystack e Milvus. Questo significa che un agente come Codex — o qualsiasi altro basato su stack aperto — può scambiare il modulo di embedding senza riscrivere pipeline. L’infrastruttura diventa modulare, invisibile all’utente finale, ma decisiva per la qualità della risposta.
Cosa cambia per chi sviluppa agenti
Il video Codex for Everyday Work: AI Agents Beyond Coding (14 maggio) suggerisce che l’agente non è più confinato all’IDE. L’integrazione con Chrome e CRM fa sì che lo stesso agente possa manipolare dati strutturati (Excel) e semistrutturati (email, trascrizioni) usando la stessa architettura di embedding. Per chi sviluppa, il trade-off è tra flessibilità e controllo: affidare a un agente il controllo diretto di applicazioni di produttività significa accettare che l’AI operi dentro i vincoli di sicurezza di ogni tool. La scelta di IBM di rilasciare embedding aperti con contesto lungo (32K) permette di lavorare su intere documentazioni CRM senza chunking aggressivo. L’implicazione tecnica è netta: lo stack per agenti non ha più bisogno di UI dedicate. Basta che l’embedding sia compatibile con i framework esistenti e che l’agente sappia cliccare come un umano. Il resto è infrastruttura.
Nota: tutti i video citati sono tratti dal feed del canale YouTube di OpenAI.