Contenu en double sur les sites Ecommerce
Le contenu en double c'est probablement la thématique la plus fréquente dans le cadre de la maintenance des sites E-commerce. En effet dans sa nature un site E-commerce est susceptible d'avoir du contenu en double car:
- Au niveau de la navigation un produit peut bien apparaître dans plusieurs catégories ou rubriques
- Lorsque le catalogue est large il est courant d'avoir une pagination pour faciliter la navigation de l'internaute
- Au niveau des fiches produits les variations "taille" ou "couleur" entraînent souvent du contenu en double
- Pour les besoins de conversions ils arrivent souvent que la marque utilise des paramètres de session utilisateur
- etc
En observant les tendances de recherches sur google trends, on s'aperçoit que les tendances de recherche sur ce sujet sont assez stables ce qui confirme bien que le contenu en double fait simplement partie de la vie d'un site
Définition du contenu en double pour Google
Google a une définition assez claire du contenu en double. Le scope de la définition du contenu en double concerne des blocs de contenus similaires à l'intérieur d'un domaine et des blocs de contenus similaires à travers plusieurs sous/domaines ou sites différents. Je vous propose de lire la définition complète ici Support Google
Le contenu en double va t-il nuire au référencement?
D'expérience il nous arrive très souvent d'augmenter notre trafic depuis Google malgré les problèmes de contenu en double. Initialement c'est-à-dire avant Google Panda et Pingouin, le seul impact négatif que nous observions sur le SEO de nos sites marchands ou transactionnels étaient la perte de notre potentiel à positionner le site sur d'autres mots clés. En d'autres termes prenons ces deux urls
www.monsite.com/dresses.php?item=marine
www.monsite.com/dresses.php?item=marine&color=black
Ces deux urls ont à 90% le même contenu seule la couleur fait la différence. L'impact pour le SEO et pour le business est le fait qu'on aurait pu se positionner sur une autre sémantique et augmenter notre trafic longue traine. Cependant depuis quelques années et notamment à la suite d'une présentation de Matthew Brown il s'avère que le contenu en double aurait un impact négatif sur votre site et pourrait entraîner des pénalités du type Google Panda
De mon expérience il y'a beaucoup de sites qui ont actuellement de bonnes positions et qui ont du contenu en double. De ce fait je dirais que même si le contenu en double a un effet négatif sur la qualité de votre site je pense que c'est une cause lointaine lors des pertes de positions. Google le prouve vu qu'il ne mentionne pas de pénalité dans leur documentation
Quel est l'impact du duplicate content sur mon site?
Le contenu en double aura tendance à influencer principalement le crawl. En effet si Google passe plus de temps à explorer des pages qui ont le même contenu plutôt que d'explorer les nouvelles pages de votre site il y'aura un impact sur le trafic global.
De plus le contenu en double va affecter le pagerank qui sera ainsi diluer entre plusieurs urls plutôt que de se concentrer sur une seule.
3 tactiques pour adresser efficacement le contenu en double
1) Google webmaster tools
Identifier les pages qui ont du contenu en double (title ou meta description) et les corriger par du contenu unique. Vous pourrez par exemple vous servir du segments sur la longue traîne que je vous proposais la semaine dernière.
Toujours dans le google webmaster tools google vous donne la possibilité de gérer les paramètres des urls de manière à permettre aux robots de bien comprendre chaque page. Attention il faut le faire avec un webmaster de préférence
2) Canonical tag
Vous pouvez aussi utiliser le "canonical tag" proposé par Google. Attention Google suggère de l'utiliser uniquement dans les cas où vous ne pouvez pas faire de redirections 301. A noter aussi que le canonical tag transmet bien le pagerank ou "link juice" d'une page à l'autre et que les autres moteurs de recherche dont BING l’interprète bien.
3) Supprimer le contenu inutile
L'une des situations les plus courantes c'est de conserver sur votre site des pages vides ou des pages dont le produit n'est plus en stock. L'idéal ici est de faire une redirection vers la page de catégorie lorsque le produit n'existe plus. Vous pouvez aussi utiliser une balise HTML permettant d'indiquer à Google la période à laquelle le contenu va expérirer
<META NAME="GOOGLEBOT" CONTENT="unavailable_after: 25-Aug-2007 15:00:00 EST">
Bonus : Outils duplicate content
En suivant le lien ci-dessous vous pourrez trouver des outils pour analyser le duplicate content en plus de ceux que vous connaissez déjà
http://slodive.com/web-development/10-top-tools-checking-duplicate-content/





