Qual è la favola che le Big Tech hanno raccontato per un decennio?

La favola era quella della "conoscenza libera", usata per giustificare l'aspirazione di ogni singolo byte di dati disponibile sul web per addestrare le loro intelligenze artificiali.

Chi si sta lamentando ora dell'uso dei contenuti per l'addestramento delle AI?

Inizialmente si lamentavano artisti visivi e autori indipendenti, ma ora anche i colossi dell'editoria scolastica e commerciale, come Hachette Book Group e Cengage Group, hanno intrapreso azioni legali.

Qual è l'accusa principale contro Google in questa battaglia legale?

L'accusa è che Google avrebbe copiato illegalmente migliaia di libri per addestrare i suoi modelli AI, come Gemini, rendendo di fatto inutile l'acquisto degli originali.

Cos'è il "Fair Use" e come viene utilizzato dalle Big Tech?

Il "Fair Use" è un concetto del diritto statunitense che permette l'uso limitato di materiale protetto senza permesso per scopi trasformativi. Le Big Tech lo usano per giustificare l'addestramento delle AI, sostenendo che leggono i libri per imparare i concetti, non per copiarli.

Qual è il significato dell'accordo tra Anthropic e un gruppo di autori?

L'accordo da 1,5 miliardi di dollari tra Anthropic e un gruppo di autori per risolvere una causa simile riguardante l'addestramento non autorizzato del suo chatbot Claude suggerisce che le aziende riconoscono il rischio legale legato all'uso non autorizzato di materiale protetto da copyright.

Qual è la posta in gioco oltre al diritto d'autore?

La posta in gioco è il controllo dell'infrastruttura informativa mondiale, con il rischio che Google, sfruttando il suo monopolio nella ricerca, disintermedi completamente le fonti originali e crei un modello parassitario che distrugge l'ecosistema da cui trae nutrimento.

Come il GDPR influenza la questione della privacy e dell'addestramento delle AI?

Il GDPR in Europa ha provato a mettere dei paletti su trasparenza e consenso, ma la fame di dati delle reti neurali americane sembra sempre trovare una scappatoia, addestrando i modelli su server oltreoceano per poi servire il prodotto "pulito" in Europa. Resta il dubbio sulla legalità del prodotto se la fonte è stata acquisita in modo illecito.

Chi pagherà il conto alla fine?

Le aziende tecnologiche cercheranno di pagare il conto con i soldi degli investitori, ma il vero prezzo lo pagheranno gli utenti, con un web sempre più chiuso, recintato da paywall e una privacy sempre più compromessa.

Google 2 months ago

Big tech contro editori: la guerra per i contenuti dell’ai è appena iniziata

L’era della “conoscenza libera” è finita: i colossi dell’editoria sfidano Google, mettendo in discussione il “Fair Use” e il futuro del web.

C’era una volta la favola della “conoscenza libera”, quella che le Big Tech ci hanno raccontato per un decennio mentre aspiravano ogni singolo byte di dati disponibile sul web per addestrare le loro intelligenze artificiali. Ci hanno detto che era per il progresso, per l’umanità, per creare strumenti capaci di curare malattie e scrivere sonetti.

Ma quando la polvere magica del marketing si posa, resta una realtà molto più prosaica: qualcuno ha preso i contenuti di tutti senza pagare un centesimo, e ora chi quei contenuti li ha prodotti presenta il conto.

E il conto è salato.

Se fino a ieri a lamentarsi erano “solo” artisti visivi e autori indipendenti — spesso liquidati con arroganza come luddisti incapaci di comprendere il futuro — oggi lo scenario cambia drasticamente. I colossi dell’editoria scolastica e commerciale, Hachette Book Group e Cengage Group, hanno deciso di entrare a gamba tesa nella battaglia legale contro Google.

Non si tratta più di difendere l’arte astratta, ma di proteggere manuali scolastici, saggi e best-seller su cui Google ha, secondo l’accusa, costruito le fondamenta del suo impero AI, Gemini in testa.

La mossa dei due giganti editoriali, depositata ieri presso un tribunale federale della California, segna un punto di non ritorno. L’accusa è brutale nella sua semplicità: Google avrebbe copiato illegalmente migliaia di libri per insegnare ai suoi modelli come parlare, ragionare e, ironicamente, rispondere alle domande degli utenti proprio con le informazioni contenute in quei libri, rendendo di fatto inutile l’acquisto dell’originale.

È il classico schema del serpente che si mangia la coda, solo che il serpente è un algoritmo da miliardi di dollari e la coda sono i diritti d’autore.

Il bluff del “fair Use” sta per crollare?

Per anni, Google e i suoi simili (OpenAI, Anthropic, Meta) si sono nascosti dietro lo scudo legale del “Fair Use”, un concetto del diritto statunitense che permette l’uso limitato di materiale protetto senza permesso per scopi trasformativi. La tesi della Silicon Valley è sempre stata: “L’AI legge i libri come farebbe uno studente, per imparare i concetti, non per copiarli”.

Una narrazione affascinante, se non fosse che uno studente non memorizza l’intero catalogo di una casa editrice per poi rivenderne riassunti perfetti su scala globale, annientando il mercato dell’editore stesso.

La sicurezza con cui le Big Tech hanno operato in questa zona grigia normativa sta iniziando a vacillare. Non è un caso che questa accelerazione legale arrivi pochi giorni dopo un evento che ha scosso il settore: Anthropic ha recentemente chiuso un accordo da 1,5 miliardi di dollari con un gruppo di autori per risolvere una causa simile riguardante l’addestramento non autorizzato del suo chatbot Claude.

Quell’accordo è la pistola fumante.

Se le aziende fossero davvero certe che il loro operato rientrasse nel “Fair Use”, non staccherebbero assegni a nove zeri per chiudere le cause prima del verdetto. Pagare significa ammettere, implicitamente, che il rischio di una condanna è troppo alto.

E se Anthropic paga, perché Google dovrebbe passarla liscia?

Nella loro proposta di intervento legale, Hachette e Cengage non usano mezzi termini per descrivere l’operato di Mountain View:

coinvolta in una delle più prolifiche violazioni di materiale protetto da copyright della storia

— Hachette Book Group e Cengage Group, Atto di citazione proposto

Non stiamo parlando di qualche citazione fuori posto, ma di un saccheggio sistematico. E qui sorge la domanda che ogni utente attento alla privacy dovrebbe porsi: se non si fanno scrupoli a rubare proprietà intellettuale protetta e registrata, quale rispetto pensate abbiano per i vostri dati personali, le vostre email o le vostre foto caricate sui loro cloud, usati anch’essi per “addestrare” la bestia?

Non è solo copyright, è monopolio

Tuttavia, ridurre tutto a una questione di diritto d’autore sarebbe ingenuo. Qui la posta in gioco è il controllo dell’infrastruttura informativa mondiale. Il problema non è solo che Google ha usato i libri per addestrare l’AI; il problema è cosa Google fa con quell’AI.

Integrando le risposte generate dall’intelligenza artificiale direttamente nei risultati di ricerca (le famose “AI Overviews”), Google disintermedia completamente la fonte.

Perché dovrei cliccare sul sito di un editore o comprare un manuale se Google mi estrae la risposta esatta e me la serve nel box di ricerca?

È un modello parassitario che distrugge l’ecosistema da cui trae nutrimento. In questo contesto, Jason Kint sostiene che Google stia sfruttando il suo monopolio nella ricerca per sostituire i contenuti originali, creando un cortocircuito dove il distributore (Google) diventa il creatore, eliminando la concorrenza alla radice.

Kint, CEO di Digital Content Next, è una delle voci più critiche su questo fronte e mette in luce come la strategia di Google non sia un incidente di percorso, ma un piano ben preciso:

Il problema centrale è che Google sta sfruttando il suo monopolio accertato nella ricerca per addestrare e sostituire i contenuti di notizie e intrattenimento con i propri servizi e interessi.

— Jason Kint, CEO di Digital Content Next

E ancora, rincarando la dose sugli effetti economici devastanti per l’industria creativa:

Il comportamento anticoncorrenziale di Google sta spazzando via il mercato per i piccoli e grandi creatori di contenuti negli Stati Uniti e all’estero.

— Jason Kint, CEO di Digital Content Next

È interessante notare come il GDPR in Europa abbia provato a mettere dei paletti su trasparenza e consenso, ma la fame di dati delle reti neurali americane sembra sempre trovare una scappatoia, magari addestrando i modelli su server oltreoceano per poi servire il prodotto “pulito” in Europa.

Ma se la fonte è avvelenata (o rubata), il frutto può essere considerato legale?

Chi paga il conto alla fine?

L’ingresso degli editori in questa causa cambia gli equilibri di potere. Gli artisti visivi, per quanto coraggiosi, spesso non hanno le risorse per sostenere anni di contenzioso contro gli studi legali di Google. Hachette e Cengage sì.

Hanno i soldi, i dati e soprattutto la “prova del danno” economico diretto, che è molto più facile da quantificare rispetto al danno morale di un artista.

L’Association of American Publishers (AAP), la potente lobby dell’editoria statunitense, si è schierata immediatamente al fianco dei ricorrenti. Maria Pallante, CEO dell’associazione, ha sottolineato come la presenza degli editori sia fondamentale non solo per i loro bilanci, ma per stabilire un principio giuridico. In una dichiarazione recente, l’associazione degli editori americani ritiene che questo intervento rafforzerà il caso legale fornendo prove concrete che altri attori non potrebbero produrre.

Crediamo che la nostra partecipazione rafforzerà il caso, specialmente perché gli editori sono in una posizione unica per affrontare molte delle questioni legali, fattuali e probatorie davanti alla Corte.

— Maria Pallante, CEO dell’Association of American Publishers

Ma attenzione a non trasformare gli editori in eroi senza macchia. Anche loro hanno i loro scheletri nell’armadio. La vera domanda è: se vinceranno o, più probabilmente, se Google offrirà loro un accordo miliardario per chiudere la faccenda, chi ne beneficerà davvero? Gli autori dei libri, i ricercatori che hanno scritto quei manuali, o solo gli azionisti delle case editrici?

La storia ci insegna che quando due elefanti (Big Tech e Big Publishing) si accordano, l’erba (gli autori e la privacy degli utenti) ne esce comunque schiacciata.

Siamo di fronte al peccato originale dell’Intelligenza Artificiale generativa: è stata costruita sulla premessa che “tutto ciò che è online è gratis”. Ora che il conto è arrivato, le aziende tecnologiche cercheranno di pagarlo con i soldi degli investitori, ma il vero prezzo lo pagheremo noi utenti, con un web sempre più chiuso, recintato da paywall per proteggere i contenuti dall’AI, e con una privacy sempre più compromessa da modelli che devono “sapere tutto” per funzionare.

La tecnologia corre veloce, la legge arranca, e nel mezzo ci sono i nostri dati e la nostra cultura, trattati come carburante grezzo per una macchina che nessuno sembra sapere davvero come spegnere.

Google continuerà a dire che sta “organizzando l’informazione del mondo”, ma forse dovremmo chiederci se per organizzarla sia davvero necessario appropriarsene.

Scritto da Giulia Bianchi

Giornalista investigativa specializzata in privacy, sicurezza digitale e regolamentazione tech. Scettica per natura, crede nel giornalismo che fa domande scomode.

L’India è il nuovo campo di battaglia dell’IA, e i giganti tech americani stanno scaricando miliardi per conquistarla

Mentre tutti inseguono i giganti, NVIDIA scommette sui modelli piccoli: Nemotron 3 Nano arriva su Amazon Bedrock

Amazon dichiara guerra ai 12 minuti di noia: così Fire TV e il nuovo Ember Artline vogliono cambiare le nostre serate

Il paradosso Amazon: vetrina chiusa, pubblicità a pagamento

Categories

Pages

Newsletter

Non perdere nemmeno un articolo.

Big tech contro editori: la guerra per i contenuti dell’ai è appena iniziata

L’era della “conoscenza libera” è finita: i colossi dell’editoria sfidano Google, mettendo in discussione il “Fair Use” e il futuro del web.

Il bluff del “fair Use” sta per crollare?

Non è solo copyright, è monopolio

Chi paga il conto alla fine?

L’era della “conoscenza libera” è finita: i colossi dell’editoria sfidano Google, mettendo in discussione il “Fair Use” e il futuro del web.

Il bluff del “fair Use” sta per crollare?

Non è solo copyright, è monopolio

Chi paga il conto alla fine?

Articoli correlati

Google: Gemini 3 Pro guida le ai overview per le query complesse

Google Ads svela l’AI che trasforma le immagini delle landing page in annunci PMax.

Google spende miliardi in AI: Broadcom ride, ma la dipendenza nasconde rischi