Suite à mon dernier article sur les astuces de référencement naturel pour préparer Google Panda, l'une des requêtes les plus fortes de mes statistiques est "algorithme Google Panda". A la base je ne voulais pas me risquer à proposer des données sur le fonctionnement de l'algorithme Google Panda mais l'intérêt des recherches google m'a amené à faire quelques recherches sur le sujet.
Lorsqu'on lit les informations proposées par Google au sujet du fonctionnement de Google Panda, on s'aperçoit qu'avec Google Panda, google a développé un modèle de classement des pages qui est basé certes sur leur pertinence (mots clés) et sur leur notoriété (liens entrants) mais aussi sur la crédibilité du site, le niveau d'expertise de l'auteur du contenu, l'originalité de l'article, la profondeur des thèmes abordés,etc...
Eléments de l'algorithme Google panda
L'algorithme Google panda serait donc basé sur un modèle de classement des pages de plus de 5 millions de paramètres différents, basé sur des prédictions du comportement de l'internaute face aux résultats de recherche. Ainsi pour avoir une vision macro de l'algorithme Panda il faut considérer les 3 éléments suivants:
- La recherche de l'internaute qui correspond à la requête utilisé par l'internaute, les mots clés dans la requête,...
- Les informations sur l'internaute: adresse IP, cookies, langue utilisée, zone géographique,...
- Les informations sur les documents proposés sur les pages de résultats: l'url, mots clés dans le document, title, ancre des liens qui pointent vers le document, ...
Il faut noter que Panda est basé sur un modèle de prédiction du comportement de l'internaute face à un type de résultats. Ceci revient donc à dire que ces différents paramètres de l'algorithme sont très souvent combinés. Par exemple Google va croiser le comportement de l'internaute aux requêtes qu'il a effectué à un moment précis de la journée ou encore le modèle va analyser les dernières requêtes effectuées par un internaute, identifier le type de résultats sur lequel il clique mais aussi ceux sur lesquels il ne clique pas; le nombre de fois où il y'a une correspondance entre la requête et les mots clés dans le document...
En plus de ces informations sur l'internaute, sa requête et la page de destination, des spécialistes comme Bill Slawski ont également indiqué que l'algorithme Google Panda serait enrichi d'autres systèmes de classement des documents à grande échelle d'une part mais aussi de nombreuses évolutions de l'infrastructure google pour améliorer la qualité des publicités adwords, lutter contre les spams, améliorer le classement des résultats...; ce qui a pour avantage de faciliter les mises à jour rapide et la propagation de Google panda à très grande échelle.
Conclusion
A mon avis on ne saurait parler de l'algorithme Panda car selon toute vraisemblance il s'agirait d'une optimisation de l'infrastructure google qui facilite la combinaison de plusieurs algorithmes pour classer les résultats à basés sur des millions de paramètres. Ainsi Comme l'ont indiqué Matt Cutts et Amit Singhal Google panda est d'abord un modèle qui ne s'applique pas à toutes les requêtes mais seulement à un échantillon d'entre elles (6 à 9% d'entre elles).
Le modèle va donc classer les pages sur la base de l'analyse de leurs caractéristiques et va se servir du comportement de l'internaute pour évaluer la pertinence de l'ensemble du système. C'est donc comme si Google choisit 10 requêtes, identifie dans ses bases de données les pages qui contiennent des informations sur ces requêtes, les analyses sur la base des critères de qualité définis dans le modèle, les classe et propose à l'internaute les nouveaux résultats classés selon ces règles de qualité: si l'internaute passe plus de temps sur la page ou le site réduisant au passage son taux de rebond, le recommande en faisant un lien le site,...alors l'algorithme aura été efficace.
Tout ceci revient donc à penser à raison, qu'aujourd'hui certains sites ne soient pas touchés par Panda soit parce que leur contenu est de "qualité" soit parce que leur contenu n'est pas encore traité par Google Panda. Par ailleurs avec Panda Google veut améliorer la qualité des résultats pour l'internaute. Par conséquent à défaut de connaitre tous les paramètres de l'algorithme Google il fait bien analyser toutes les informations qui traduisent le comportement de vos internautes sur le site:
- Taux de rebond
- Taux de sortie de vos pages
- Temps passé sur vos pages
- Taux de clics sur vos résultats de recherche
- Correspondance entre les requêtes des internautes et le contenu de vos pages,...
