duplicate content

Comment éviter le duplicate content sur un site web ?

Parmi les principaux ennemis des porteurs de projet web, le duplicate content arrive en bonne position. Il faut dire qu’il peut être à l’origine d’une perte de position dans le classement des moteurs de recherche mais aussi d’une réduction de la vitesse d’indexation. Fort heureusement, il existe des méthodes pour éviter le duplicate content sur un site Internet.

Le duplicate content, c’est quoi ?

Egalement connu sous le nom de « contenu en double », le duplicate content qualifie « des blocs de contenu importants, appartenant à un même domaine ou non, qui sont identiques ou sensiblement similaires ».

Ainsi, dans la pratique, est considéré comme du duplicate content, un bloc de texte présentant plus de 40% de similitudes avec du contenu déjà existant. Il est toutefois bon de noter qu’il s’agit bien d’un « bloc de texte » et non de petites phrases recopiées sur divers sites web et mises bout à bout.

Autrement dit, il y a duplicate content lorsqu’une citation ou des extraits d’interview sont repris par des sites autres que la source originelle, lorsque plusieurs URLs pointent vers une seule et même page ou lorsqu’un même site est disponible en différentes versions.

A noter que dans ces situations précises, le duplicate content ne peut être assimilé à du plagiat, ce dernier étant souvent dû à une réelle volonté de duper l’algorithme de Google.

Comment remédier aux problèmes de contenu dupliqué ?

Parce que vous souhaitez probablement éviter que le référencement de votre site puisse être pénalisé par le duplicate content, voici quelques petites recommandations à suivre :

  • Bannir le copier-coller. Pour éviter le duplicate content, le plus simple est effectivement de produire du contenu unique. A ce sujet, Google conseille d’ailleurs d’écrire en priorité pour les visiteurs, quitte à modifier ensuite quelque peu les textes afin de les optimiser en vue du référencement de vos pages web.
  • Utiliser des redirections 301. Lorsque des pages différentes d’un même site proposent des contenus identiques, il peut être bon de mettre en place des redirections 301 de la page dupliquée à la page principale. Le robot Google chargé de crawler les pages saura ainsi laquelle indexer.
  • Recourir à des URLs canoniques. Si plusieurs pages différentes présentent du contenu identique, l’utilisation d’URLs canoniques peut être une bonne alternative. Le crawler Google saura alors quelle est la page à indexer en priorité et les autres pages ne seront pas considérées comme du duplicate content.

Pour être complet sur la question, sachez en revanche que cacher certaines pages aux robots Google via le fichier robots.txt afin de dissimuler du contenu en double est une pratique peu appréciée par le moteur de recherche.


Share this Article




Related Posts




Post a Comment

Hint: Please enter between 80 - 300 characters.