Google, il pioniere che raschia il web, ora usa il copyright per fermare chi lo imita
Google accusa SerpApi di scraping dannoso usando il DMCA. La difesa cita precedenti legali a favore dell'accesso ai dati pubblici. In gioco c'è il futuro del web aperto.
La causa si basa sul DMCA, ma i precedenti legali sembrano proteggere l’accesso ai dati pubblici del web.
Immagina: il più grande “raschiatore” di dati al mondo, che ha costruito il suo impero copiando contenuti pubblici senza mai chiedere permesso, ora fa causa a un’azienda più piccola per aver fatto esattamente la stessa cosa. È il paradosso al centro della battaglia legale tra Google e SerpApi, una causa che secondo l’annuncio ufficiale di SerpApi potrebbe ridefinire l’accesso alle informazioni online. L’arma scelta dal colosso di Mountain View è il Digital Millennium Copyright Act (DMCA), una legge nata per proteggere il copyright, brandita ora per tentare di bloccare l’accesso automatizzato a dati pubblicamente visibili.
Il paradosso del gigante che si fa guardiano
L’ironia è spessa. SerpApi, nel difendersi, ricorda che “Google è il più grande scraper in the world”. Il suo intero business, infatti, è nato da un web crawler che setacciava ogni pagina pubblicamente accessibile su internet, ne copiava i contenuti, li indicizzava e li serviva agli utenti. Lo faceva senza distinguere tra materiale protetto da copyright e non, e soprattutto “without asking permission”. Oggi, quello stesso pioniere dello scraping presenta una causa per fermare SerpApi, accusandolo di aggirare le misure di sicurezza che proteggono i contenuti protetti da copyright nei risultati di ricerca. In una nota sul suo blog, Google spiega di aver intentato la causa per chiedere a un tribunale di fermare i bot di SerpApi e il loro scraping dannoso, che violerebbe le scelte dei siti web sui loro contenuti. Ma la difesa di SerpApi è netta: il DMCA è uno statuto di protezione del copyright, non di protezione dei siti web. La loro attività, affermano, non viola la legge perché “accediamo a pagine web pubblicamente visibili, le stesse accessibili a qualsiasi browser. Non rompiamo la cifratura. Non disabilitiamo sistemi di autenticazione”. Leggono ciò che è già in piena vista.
Il campo di battaglia legale: pubblico vs. privato
Mentre Google alza la posta, la giurisprudenza recente sembra dire altro. Il caso fondamentale è hiQ Labs, Inc. v. LinkedIn Corp., che ha stabilito che lo scraping di dati pubblicamente accessibili può essere protetto. La Corte d’Appello del Nono Circuito, in quella sentenza, avvertì espressamente contro la creazione di “monopoli informativi che danneggerebbero l’interesse pubblico”, un principio che SerpApi cita a sostegno. Un precedente ancora più fresco arriva da un’altra battaglia nel settore: Bright Data, un competitor di SerpApi, ha vinto una causa simile contro Meta. Come riporta un comunicato di Bright Data, la corte ha stabilito che i termini di Facebook e Instagram “non vietano lo scraping dei dati pubblici quando si è disconnessi”, di conseguenza non possono proibire la vendita di tali dati pubblici. Questo crea un solido argine contro il tentativo di aziende dominanti di chiudere l’accesso ai dati pubblici usando i propri termini di servizio. La domanda allora è scomoda: se la legge sembra dalla parte di chi accede a dati pubblici, perché Google insiste con un’accusa basata sul DMCA? La risposta potrebbe non riguardare il copyright, ma il controllo.
La posta in gioco: monopolio o web aperto?
Il vero obiettivo, secondo SerpApi, è molto più ampio di una singola violazione. In gioco c’è la possibilità per le grandi piattaforme di usare il DMCA per impedire l’accesso automatizzato a informazioni pubblicamente visibili, un’eventualità che potrebbe “rimodellare il funzionamento di motori di ricerca, piattaforme di intelligence competitiva, sistemi di intelligenza artificiale e strumenti di ricerca”. Una vittoria di Google creerebbe un pericoloso precedente, permettendo di fatto di sigillare l’accesso ai dati pubblici del web sotto una coltre legale, soffocando l’innovazione e consolidando monopoli informativi. Non è un’ipotesi astratta: SerpApi è già nel mirino di altre grandi piattaforme. Reddit ha accusato l’AI search engine Perplexity di cospirare con tre aziende, tra cui proprio SerpApi, per raschiare illegalmente i contenuti di Reddit dai risultati di Google. L’ecosistema di alternative esiste e dipende dall’accesso ai dati: da Apify a Bright Data, da Oxylabs a DataForSEO, sono nove le principali alternative a SerpApi che offrono servizi simili per sviluppatori. Se Google vincesse, metterebbe a rischio non solo SerpApi, ma l’intero settore che si basa su dati pubblici per costruire servizi concorrenziali, dagli aggregatori di notizie agli strumenti di ricerca per l’AI.
Google, il pioniere che ha reso il web navigabile indicizzando tutto ciò che era pubblico, rischia così di diventare il suo carceriere. Questa causa non decide solo il destino di un’azienda di scraping in Texas, ma riscrive le regole fondamentali di chi può guardare, e quindi utilizzare, l’informazione che tutti noi contribuiamo a rendere pubblica. Il paradosso è completo: la stessa pratica che ha creato il gigante, ora viene criminalizzata dal gigante stesso. La domanda che resta sospesa è se il web, nato aperto, possa sopravvivere a un futuro in cui i suoi dati pubblici sono custoditi da guardiani privati armati di leggi sul copyright.