Google ha cambiato le regole per i contenuti AI

Google ha cambiato le regole per i contenuti AI

Google chiarisce che l'uso di AI per manipolare il ranking è spam, mentre l'automazione per contenuti utili è accettata.

La policy del 2023 ribadisce che l’automazione è lecita solo se non manipola il ranking

C’è una riga di codice che separa un contenuto AI utile da uno spam per Google, e non è scritta in nessun linguaggio di programmazione. È scritta nell’intento. Già nel febbraio 2023, la policy di Google sull’AI nei contenuti chiariva un principio tanto semplice quanto difficile da operativizzare: usare l’automazione — inclusa l’intelligenza artificiale — per generare contenuti con lo scopo principale di manipolare il ranking nei risultati di ricerca è una violazione delle norme antispam. Punto. Il che lascia aperta una domanda precisa: chi decide qual è lo “scopo principale”?

La linea sottile tra AI utile e spam

La posizione ufficiale di Google non è ambigua sulla direzione, ma lo è sulla misurazione. Da un lato, i sistemi di ranking puntano a premiare contenuti originali e di alta qualità che dimostrano quelle che Google chiama le qualità E-E-A-T: expertise, experience, authoritativeness, trustworthiness. Dall’altro, l’automazione non è di per sé il problema: Google stessa riconosce che è stata usata a lungo per produrre contenuti utili come punteggi sportivi, previsioni meteo e trascrizioni — tutti casi in cui la macchina fa un lavoro che sarebbe meccanico e ripetitivo anche per un umano. Il discrimine non è “generato da AI sì/no”, ma “generato per manipolare sì/no”. Nella pratica, questo significa che due articoli tecnicamente identici — stessa struttura, stesso tono, persino stesso modello generativo — possono avere destini opposti nei risultati di ricerca, a seconda di ciò che c’era nella testa di chi ha impostato il prompt.

Dalla Panda all’helpful content: una storia di segnali di qualità

Per capire la mossa di febbraio 2023, bisogna guardare al passato. Già nel febbraio 2011, Google introdusse un aggiornamento algoritmico che impattava l’11,8% delle query — quello che sarebbe diventato noto come Panda. L’obiettivo era lo stesso di oggi: abbassare il ranking di contenuti a bassa qualità, spesso generati in massa, e premiare siti con contenuti originali e autorevoli. La firma tecnica era diversa — modelli di machine learning addestrati su valutazioni umane — ma la logica era identica. Poi, nell’agosto 2022, Google ha lanciato l'”helpful content update”, un aggiornamento che ha introdotto un segnale a livello di sito contro i contenuti automatizzati: non solo la singola pagina viene valutata, ma l’intero dominio può essere penalizzato se una parte significativa dei suoi contenuti risulta prodotta principalmente per i motori di ricerca anziché per le persone. Un segnale site-wide, non page-wide — una distinzione tecnica che molti developer sottovalutano.

Ora la posta in gioco è più alta, perché anche il fronte competitivo si è spostato. Il 7 febbraio 2023, un giorno prima della pubblicazione della policy di Google, Microsoft aveva annunciato il nuovo Bing AI-powered, basato su un modello linguistico di OpenAI descritto come più potente di ChatGPT e ottimizzato specificamente per la ricerca. E secondo la copertura di The Verge, proprio in quei giorni Bard — il modello di Google — commetteva un errore fattuale nella sua prima demo pubblica. Due aziende che corrono a integrare AI nella ricerca, una con un passo falso visibile, l’altra che aggiorna le regole del gioco mentre il gioco cambia. Non è un caso che la policy arrivi esattamente in quel momento.

Cosa cambia per chi costruisce

La vera partita si gioca nei layer di rilevamento e nelle soglie di SpamBrain, il sistema antispam di Google che continua a operare indipendentemente da come lo spam viene prodotto. SpamBrain non legge l’intestazione del file, non controlla se hai usato GPT-4 o un template scritto a mano: analizza pattern, segnali comportamentali, coerenza semantica, e — soprattutto — la distribuzione statistica dei contenuti a livello di dominio. Per un developer che genera contenuti programmaticamente, questo significa che non basta che il singolo output sia buono. Se il processo di generazione produce duemila pagine con struttura identica e variazione lessicale minima, SpamBrain lo vede come quello che è: una farm di contenuti con architettura a template.

Le implicazioni pratiche sono almeno tre. Prima: il contesto di generazione conta quanto l’output. Usare un modello linguistico per scrivere descrizioni di prodotto uniche, con informazioni verificate e specifiche tecniche reali, è un caso d’uso legittimo — e Google lo dice esplicitamente. Usarlo per produrre migliaia di variazioni dello stesso articolo di affiliazione cambiando solo il nome del prodotto è spam, anche se ogni singola variazione supera un controllo superficiale di leggibilità. Seconda: il segnale site-wide dell’helpful content update significa che una sezione “spammosa” di un sito può trascinare giù anche le pagine qualitativamente solide. Per chi gestisce progetti con più sezioni eterogenee — documentazione tecnica, blog, pagine di prodotto — questo richiede una governance editoriale che va oltre il semplice controllo qualità sul singolo pezzo. Terza: la firma del processo può tradirti. Non nel senso che Google riconosce il watermark di un modello specifico, ma nel senso che certi pattern stilistici, certi tipi di errori semantici, certe strutture ricorrenti sono statisticamente associabili a specifici workflow di generazione. Non è detection by signature, è detection by behavior.

Per un developer, la lezione è che l’AI è uno strumento, non una scorciatoia: Google guarda il risultato, non la ricetta, ma se la ricetta è costruita solo per ingannare il ranking, il sistema lo scoprirà. La qualità conta più della firma, ma la firma — intesa come traccia del processo — può raccontare molto su chi ha fatto cosa e perché. E in un contesto in cui la competizione tra motori di ricerca si gioca anche sulla capacità di separare il segnale dal rumore, Google non ha nessun incentivo a fare finta di non vedere.

🍪 Impostazioni Cookie