Technical SEO

Come gestire i contenuti duplicati

C’è molta confusione che circonda il modo in Google gestisce i contenuti duplicati.

Oggi sul blog di ByTek Marketing vorremmo chiarire questa tematica. Spesso, infatti, chi si occupa di SEO teme i contenuti duplicati più di quanto non tema i backlink spam. Già qualche anno fa Google cercò di eliminare i miti relativi ai contenuti duplicati.

Quanto segue è un estratto scritto da Susan Moska pubblicato sul blog di Google Webmaster nel 2008:

“Let’s put this to bed once and for all, folks: There’s no such thing as a “duplicate content penalty.” At least, not in the way most people mean when they say that.__You can help your fellow webmasters by not perpetuating the myth of duplicate content penalties!”

Ma cosa sono esattamente i contenuti duplicati?

Secondo Google:

“Duplicate content generally refers to substantive blocks of content within or across domains that either completely match other content or are appreciably similar. Mostly, this is not deceptive in origin.”

Le persone scambiano i contenuti duplicati per una penalità a causa di come Google stesso li gestisce.

Ma la verità è che i contenuti duplicati vengono semplicemente filtrati nei risultati di ricerca.

**Che fetta del web è costituita da contenuti duplicato? ** Secondo Matt Cutts, dal 25% al 30% dei contenuti presenti sul web sono duplicati.

Inoltre, un recente studio condotto da Raven Tools basato su dati raccolti grazie al loro strumento di website audit ha ottenuto un risultato simile: il 29% dei contenutisonoduplicati.

Cosa pensa Google in merito ai contenuti duplicati?

Molti articoli sono stati pubblicati da Google stesso su questo tema. In questo post ci limitiamo a farvi un riassunto dei punti miglior, ma vi consigliamo di approfondire ulteriormente (si vedano i link alle fonti riportate qui sotto).

  • I contenuti duplicati NON sono una causa di penalità per il vostro sito web;
  • Google sa che gli utenti cercano la diversità nei risultati di ricerca e non vogliono vedere lo stesso articolo più e più volte, pertanto sceglie di consolidare e di mostra solo una versione;
  • Google ha in realtà progettato algoritmi per evitare che i contenuti duplicati influenzino i webmaster. Questi algoritmi raggruppano le varie version di una pagina in un cluster, poi visualizzano l’URL “migliore” nel cluster, consolidando diversi segnali (come ad esempio i link) delle pagine che appartengono allo stesso cluster in quella che viene mostrata. Google è persino arrivato ad affermare questo : “If you don’t want to worry about sorting through duplication on your site, you can let us worry about it instead”;
  • Non vi è motivo di intervenire sui contenuti duplicati a meno che il loro intento sia quello di manipolare i risultati di ricerca;
  • La cosa peggiore che può accadere da questo filtraggio è che una versione meno ottimale della pagina venga visualizzata nei risultati di ricerca di Google;
  • Google cerca di determinare la fonte originale del contenuto e di mostrare quella;
  • Se qualcuno duplica i vostri contenuti senza autorizzazione, è possibile richiedere di farli rimuovere depositando una richiesta sotto il Digital Millennium Copyright Act;
  • Non bloccare l’accesso a contenuti duplicati. Se Google non può effettuare la scansione di tutte le versioni, non può consolidarne i vari segnali.

Fonti:

Cause di contenuti duplicati

I contenuti duplicati possono avere varie cause:

  • HTTP e HTTPS
  • www e non www
  • Parametri nelle URLs
  • ID di sessione
  • Pagine Index
  • Versioni alternative delle pagine (ex: mobile, pagine AMP o di stampa)
  • Ambienti di DEV/hosting
  • Paginazione
  • Scrapers
  • Diverse versioni per lingua/paese

Possibili soluzioni ai contenuti duplicati

La soluzione dipende dalla specifica situazione:

  • Non fare nulla e sperare che Google capisca da solo. Anche se non ci sentiamo di suggerire questa modalità, abbiamo visto come Google raggruppi le pagine e tenda a consolidare i segnali, gestendo i problemi di contenuti duplicati per voi;
  • Canonical tag. Questi tag vengono utilizzati per consolidare i segnali e scegliere la vostra versione preferita di una pagina.
  • 301 redirect. Utilizzare i redirect 301 evita drasticamente il presentarsi di contenuti duplicati, facendo in modo che le versioni alternative di una pagina non vengano visualizzate;
  • Dire a Google come gestire i parametri delle URL. Impostare i parametri URL informa Google in merito a cosa tali parametri effettivamente fanno, evitando che sia Google stesso a capirlo;
  • Rel=”alternate”. Questo tag viene utilizzato per consolidare versioni alternative di una pagina, come la versione mobile oppure pagine relative a diversi paesi/lingue. In questo secondo scenario, il tag hreflang è utilizzato per mostrare la pagina lingua/paese corretta all’interno dei risultati di ricerca. Alcuni mesi fa, John Mueller di Google, rispondendo ad una domanda durante uno dei Webmaster Hangout disse che impostare il tag hreflang non supporta direttamente i ranking ma fa si che la versione corretta venga mostrata. Ciò è probabile in quanto Google ha già identificato le versioni alternative di una pagina e consolidato i segnali per le diverse pagine;
  • Rel = “prev” e rel = “next”. Utilizzati per la paginazione;
  • Seguire le line guida per la syndication.

TL:DR

Sebbene ci siano alcune situazioni che potrebbero effettivamente causare problemi, come lo scraping/ spam, ma per la maggior parte, i problemi sono causati dai siti stessi. Fate uso delle tattiche di cui sopra applicate alle vostre situazioni specifiche per indicare come si desidera che Google gestisca i vostri contenuti. Vi suggeriamo di consultare la [sezione di aiuto di Google sui contenuti duplicati](https://translate.google.com/translate? hl=it&prev=_t&sl=en&tl=it&u=https://support.google.com/webmasters/answer/66359%3Fhl%3Den).

I miti relativi alle sanzioni contenuti duplicati devono morire: c’è bisogno di informazioni corrette, o questi miti potrebbe essere ancora in circolazione per altri 10 anni. Esistono varie modalità per consolidare i segnali di su più pagine e anche se non vengono utilizzati da voi direttamente, Google cercherà di farlo per voi.

Condividi questa pagina


Come gestire i contenuti duplicati

bytek | 03 October 2016

News

Potrebbe interessarti anche

Siamo parte del gruppo

Datrix SPA
Insieme a

Innova insieme a noi

Condividi con noi i tuoi obiettivi e scopri come possiamo crescere insieme

© 2020 ByTek SRL - P. IVA: 13056731006 - REA: MI - 2562796 - Privacy Policy - Cookie Policy