Perché Meta è tornata a pagare per le notizie?

Meta ha ripreso a pagare per le notizie a causa di un difetto strutturale nei Large Language Models (LLM) su cui si basano Meta AI e Llama: l'allucinazione sui fatti recenti. Per colmare questa lacuna, Meta ha stretto accordi per accedere ai dati degli editori in tempo reale, consentendo ai suoi algoritmi di leggere le notizie e fornire informazioni aggiornate.

Cosa significa l'accordo tra Meta e gli editori per questi ultimi?

Per gli editori, questi accordi rappresentano una boccata d'ossigeno finanziaria, ma anche una scommessa. Vendono la materia prima a chi potrebbe rendere obsoleta la visita diretta ai loro siti web. L'accordo è visto come un riconoscimento del diritto d'autore e del valore dei contenuti d'archivio e in tempo reale.

Perplexity 2 months ago

Meta torna a pagare per le notizie: la svolta per l’intelligenza artificiale

Q: Cos'è la tecnica RAG (Retrieval-Augmented Generation) e come viene utilizzata da Meta?

RAG è una tecnica utilizzata per aggirare il problema del 'knowledge cutoff' nei modelli di IA. Quando un utente pone una domanda, il sistema cerca informazioni su fonti esterne affidabili, recupera il testo e lo utilizza come contesto per generare la risposta. Meta utilizza RAG per fornire informazioni tempestive e rilevanti, integrando diverse fonti di notizie.

Q: Qual è l'importanza di avere fonti di notizie diverse, come Fox News, CNN e USA Today, per l'addestramento dell'IA di Meta?

Avere fonti di notizie diverse è un tentativo di bilanciare i vettori di addestramento e correggere il bias algoritmico. Gli LLM tendono a riflettere i bias dei dati su cui sono stati costruiti. Acquisendo flussi di notizie da spettri politici opposti, Meta cerca di costruire un meccanismo di 'grounding' statisticamente neutro.

Meta torna a investire nell’informazione giornalistica per migliorare la precisione dei suoi modelli di intelligenza artificiale e competere con i rivali nel settore.

Sembra quasi un errore di versione nel repository della strategia aziendale di Mark Zuckerberg, eppure il commit è stato confermato: Meta è tornata a pagare per le notizie.

Dopo aver passato il biennio 2022-2024 a smantellare sistematicamente ogni legame con l’informazione giornalistica – rimuovendo la tab News e depotenziando la visibilità dei link esterni – l’azienda di Menlo Park ha appena ufficializzato una serie di accordi pluriennali con alcuni dei più grandi editori mondiali, tra cui USA Today, Fox News, CNN e Le Monde.

A una prima lettura superficiale potrebbe sembrare un ravvedimento etico o politico, ma chi scrive codice sa che le decisioni di questa portata rispondono quasi sempre a esigenze architetturali, non morali.

La realtà è che i Large Language Models (LLM) su cui si basano Meta AI e Llama hanno un difetto strutturale intrinseco: l’allucinazione sui fatti recenti.

Senza un flusso di dati costante e verificato, un’intelligenza artificiale è solo un archivio statico, un’enciclopedia congelata al momento del suo ultimo addestramento.

Per colmare questo gap tecnico, Meta ha firmato accordi commerciali pluriennali per l’accesso ai dati con editori strategici, permettendo ai suoi algoritmi di leggere notizie in tempo reale.

Questa inversione a U non è solo una mossa difensiva, ma il riconoscimento che l’ingegneria del software, da sola, non può generare la verità.

Il collo di bottiglia dell’inferenza

Per comprendere la ratio di questa operazione, bisogna guardare sotto il cofano di come funziona oggi l’IA generativa. I modelli puri soffrono di “knowledge cutoff”: non sanno cosa sia successo cinque minuti fa.

Per aggirare il problema senza dover riaddestrare il modello ogni ora – un processo computazionalmente insostenibile e costosissimo – si utilizza una tecnica chiamata RAG (Retrieval-Augmented Generation).

In sintesi, quando un utente chiede “Cosa è successo oggi al Congresso?”, il sistema non interroga la sua “memoria” (i pesi della rete neurale), ma effettua una ricerca su fonti esterne affidabili, recupera il testo e lo usa come contesto per generare la risposta.

Fino a ieri, Meta cercava di farlo in modo organico o limitato; oggi ha capito che per competere con la precisione di Perplexity o la vastità dell’indice di Google, deve possedere la fonte del dato.

L’azienda è stata piuttosto trasparente su questo limite tecnico nella sua comunicazione ufficiale:

Gli eventi in tempo reale possono essere difficili da seguire per gli attuali sistemi di IA, ma integrando più tipi diversi di fonti di notizie, il nostro obiettivo è migliorare la capacità di Meta AI di fornire contenuti e informazioni tempestivi e rilevanti.

— Meta, Dichiarazione ufficiale

Non si tratta quindi di salvare il giornalismo, ma di salvare il prodotto.

Un chatbot che non sa dirti chi ha vinto la partita di ieri sera o come è andata l’ultima votazione parlamentare è tecnicamente obsoleto nel mercato attuale del 2025.

La correzione del bias algoritmico

C’è un secondo livello di lettura, più sottile, che riguarda la natura dei dati ingeriti. L’elenco dei partner non è casuale.

Mettere nello stesso dataset Fox News (conservatore), CNN (progressista) e USA Today (generalista) è un tentativo ingegneristico di bilanciare i vettori di addestramento.

Uno dei problemi maggiori degli LLM è che tendono a riflettere i bias dei dati su cui sono stati costruiti. Acquisendo ufficialmente flussi di notizie da spettri politici opposti, Meta cerca di costruire un meccanismo di “grounding” (ancoraggio alla realtà) che sia statisticamente neutro, o quantomeno difendibile in tribunale.

È ironico pensare che solo pochi anni fa il colosso di Menlo Park aveva smesso di retribuire gli editori per i contenuti sulle sue piattaforme, sostenendo che le notizie fossero un valore trascurabile per l’esperienza utente su Facebook e Instagram.

Oggi, quel valore trascurabile è diventato il carburante essenziale per evitare che l’IA risponda con inesattezze imbarazzanti.

La tecnologia RAG funziona bene solo se la fonte del “retrieval” è di alta qualità; spazzatura in entrata significa spazzatura in uscita (Garbage In, Garbage Out), e Meta non può permettersi che la sua IA di punta generi “spazzatura” in un anno in cui la concorrenza di OpenAI e Google è spietata.

Una tregua armata

Dal punto di vista degli editori, questi accordi rappresentano una boccata d’ossigeno finanziaria in un panorama altrimenti desolante, ma anche una scommessa rischiosa.

Stanno essenzialmente vendendo la materia prima a chi potrebbe, nel lungo termine, rendere obsoleta la visita diretta ai loro siti web. Tuttavia, nel breve termine, la narrazione è quella di una vittoria per il riconoscimento del diritto d’autore.

Mike Reed, CEO di USA TODAY Co., ha accolto con favore la partnership che definisce una testimonianza del valore dei contenuti d’archivio e in tempo reale del network, sottolineando un aspetto cruciale: l’accesso agli archivi.

Le partnership che aiutano le persone ad accedere a una gamma di informazioni sono un modello utile da implementare mentre gli editori abbracciano una tecnologia trasformativa. Il nostro accordo con Meta riflette una collaborazione responsabile tra il giornalismo affidabile e l’ecosistema dell’informazione.

— Mike Reed, CEO di USA TODAY Co.

Il riferimento agli archivi è tecnicamente rilevante. Non servono solo le news di oggi (per la RAG), servono decenni di articoli storici per affinare la comprensione del linguaggio e del contesto storico da parte del modello.

Meta sta comprando non solo il presente, ma anche il passato.

Resta da chiedersi se questa architettura ibrida, dove le Big Tech sovvenzionano la produzione di notizie per poi ingerirle e rielaborarle sinteticamente, sia un modello sostenibile o solo una patch temporanea.

Stiamo assistendo all’evoluzione dell’IA verso una forma di parassitismo simbiotico, o è l’inizio di una standardizzazione in cui il giornalismo diventa ufficialmente un microservizio backend per i frontend dell’intelligenza artificiale?

Scritto da Luca Verdi

Developer e tech writer. Spiega la tecnologia dal punto di vista tecnico senza perdere di vista l'accessibilità. Ex software engineer, ora si dedica al giornalismo tech.

L’India è il nuovo campo di battaglia dell’IA, e i giganti tech americani stanno scaricando miliardi per conquistarla

Mentre tutti inseguono i giganti, NVIDIA scommette sui modelli piccoli: Nemotron 3 Nano arriva su Amazon Bedrock

Amazon dichiara guerra ai 12 minuti di noia: così Fire TV e il nuovo Ember Artline vogliono cambiare le nostre serate

Il paradosso Amazon: vetrina chiusa, pubblicità a pagamento

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

Meta torna a pagare per le notizie: la svolta per l’intelligenza artificiale