Google

Mise à jour de l'algorithme Google : Février 2012

fév 28 2012 Published by Franck NLEMBA under Actualités google

Dans sa série de communiqués visant à "réveler" quelques projets sur lesquels ses ingénieurs travaillent, Google a présenté hier près de 40 changements qui ce sont réalisés en février ou qui sont en cours de réalisation actuellement. Les plus importants concernent notamment:

La mise à jour de la requête "site:"

Cette requête est très utile pour les audits SEO ou encore pour avoir une idée des pages les plus importantes d'un site: analyse concurrentielle. Google a indiqué, qu'ils ont apporté beaucoup plus de diversité aux résultats sur cette requête.

Des changements sur les images

Le mois dernier google avait également révélé des changements sur les images. On dirait que l'optimisation de l'affichage des images est un véritable challenge pour Google cette année. Je ne sais pas exactement qu'elles sont les dernières statistiques sur le consultations de Google Image mais tout indique que les images attirent pleins de clics en recherche universelle. Le problème c'est que Google continue à proposer en recherche universelle la source la mieux optimisée pour l'image et non ou très rarement la source de l'image en question. On observe ceci en E-commerce ou il est très rare de voir une image en provenance d'une fiche produit par exemple. Ainsi Google a notamment:

  • Augmenter le nombre de requêtes sur lesquels on pourra voir apparaitre les images en recherche universelle
  • Augmenter la prise en compte des dernières images
  • Améliorer la détection des contenus adultes au niveau des images
  • Travailler sur les images associées

Mise à jour de Panda

Dès mes premiers articles sur le sujet j'indiquais déjà à quel point Google Panda allait radicalement changé notre conception du référencement naturel. Sur cette mise à jour de l'algo panda, Amit Singhal n'a pas été très locace et il a dit exactement ceci:

Shopping rich snippets

Google a également déployé à l'international l'affichage des informations additionnels (prix, disponibilité, votes,etc) généralement disponibles au niveau des fiches produits. De nombreuses recherches montrent que les internautes réagissent bien lorsque les résultats de recherches Google sont enrichies d'images ou d'étoiles (votes). Je pense que ceci va pousser les webmasters des sites Ecommerce a adopté un peu plus schema.org et les autres formats d'encodage.

Résultats - recherche locale

L'explosion des recherches sur mobile a poussé depuis bien longtemps, google à optimisé à très grande vitesse les recherches locales. Seulement le classement des résultats de recherches sur les requêtes à forte connotation locale, n'est pas toujours très optimale à mon avis.

Personnellement, je pense que ceci est un retour en arrière de Google (se baser sur les éléments de l'algo "principal" pour classer les résultats en de la recherche locale) car l'information à l'intérieur des sites Ecommerce n'est déjà pas très bien optimisé. Tant que les marchands ne prendront pas la peine de créer une page par magasin, de mettre du contenu unique sur chaque magasin, d'attirer des commentaires sur leur site mais aussi sur leur page Google adresses,...Google aura toujours du mal sur le ranking des informations locales.

Evaluation des liens

Les liens entrants c'est la base même du pagerank et du système de classement des résultats de Google. Hier on a appris que Google a modifié la manière dont ils évaluent la valeur d'un lien. Pour moi c'est juste une petite modification dans l'évaluation du "link juice" car Google a nécessairement besoin de l'ancre des liens pour identifier la relation entre deux contenus (ceci est valable pour les liens internes et externes). Par ailleurs le système est fait de manière à ce que les liens en provenance des sites forts aient beaucoup plus de poids que ceux en provenance des sites de moins forte notoriété. Celà a mon avis n'a pas changé.

Lire aussi

Pourquoi les enseignes doivent investir sur Google maps

Google maps et les résultats commerciaux

L'algorithme Google Panda

Comment google se sert des internautes pour améliorer son algorithme

Mesurer la qualité d'un lien entrant

One response so far

Mise à jour de Google Panda: Panda 2.5

oct 01 2011 Published by Franck NLEMBA under Crawl

Depuis hier, le search engine Land a relayé une information selon laquelle une nouvelle mise à jour de l'algorithme Panda a été lancée par Google. Faute d'un manque de communication officielle, pour l'instant les spéculations vont bon train. Pour information rappelons que l'algorithme Google panda vise à améliorer la qualité des résultats de recherche en retrogradant la position de certains sites internet au profit d'autres jugés plus pertinents.

Le processus intial intègre donc la notation des sites web par un panel d'utilisateurs et le déploiement algorithmique mais progressif du comportement de ce panel sur un échantillon de requêtes afin de classer les résultats ou de les re-classer. Il s'agirait donc de la mise à jour google panda 2.5. Si vous avez déjà été victime de Google panda ou si vous souhaitez l'éviter je vous propose de lire les articles ci-dessous. Bon courage

Ressources Utiles sur la mise à jour de Google Panda


Essaie de description de l'algorithme Google Panda

Conseils pour mieux préparer l'arrivée de Google panda en France

Comment éviter google panda

Comment google va se servir des données des internautes pour modifier son algorithme

Déploiement officiel de Google panda en France

algorithme panda

No responses yet

Comment lutter contre Google panda?

août 26 2011 Published by Franck NLEMBA under Actualités google

Le titre de ce billet n'est pas directement en rapport avec ce qui va suivre mais si vous vous souvenez de mon article sur les conseils google panda, suivi des réponses que j'ai donné à certains commentaires au sujet du fonctionnement de Google panda, alors vous allez comprendre le sens de ma question "comment lutter contre google panda"

La réponse est simple: suivre très attentivement les évolutions de la recherche Google. En effet le 23 Août dernier, Google a publié un billet pour lancer le recrutement de "Search Quality Associate". Pour moi c'est une excellent nouvelle, car il s'agit des personnes "humains" qui vont passer sur les sites, lire le code source et détecter toutes les mauvaises techniques déployées par les experts en référencement naturel et autres webmasters pour manipuler l'algorithme Google. Le recrutement se fait à pour les bureaux Google à Dublin autant dire que ces gens vont travailler sur les sites européens.

Évidemment j'y vois une volonté de Google d'optimiser l'algorithme Google panda. Comme tout le monde le sait, avant google panda il y'a eu la même opération: des humains notent la qualité des pages puis google utilise le procédé dit de "machine learning" pour que les algorithmes puissent faire la même chose. En recrutant plus de "surveillants" Google va disposer de plus de personnel pour noter les pages d'une page et se servira de cet "input" pour améliorer les mécanismes de détection du Spam de panda.

Si vous êtes intéressés par les postes proposés lisez les pré-requis et postulez

NB: tout ceci n'engage que moi et si je prend le risque de dire que ces recrutements serviront à améliorer Google panda c'est parce qu'on sait que Google a souvent amélioré son algorithme de cette façon.

A lire aussi

Algorithme Panda

Mises à jour Google Panda

One response so far

Google et l'utilisation des données liées au comportement de l'internaute

août 23 2011 Published by Franck NLEMBA under Crawl

Lors de mon dernier article sur l'algorithme google panda, un commentaire a attiré mon attention sur le fait que ce n'était pas sûr que google intègre les données relatives à l'engagement des internautes pour classer les résultats.

Bien que celà semble être une évidence pour moi au regard  du fait que la recherche personnalisée existe depuis longtemps maintenant et que chaque jour j'en fais l'expérience car je suis toujours loggé à mon compte google lorsque j'effectue mes recherches, je me suis dit qu'il fallait que je trouve d'autres éléments pour être crédible.

Et quoi de mieux que cet article de Bill Slawski sur l'utilisation des informations liées au comportement des internautes sur les pages Web pour améliorer le classement des résultats de recherche. Bill précise en introduction que le brevet sur lequel il s'est appuyé pour rediger son article est sorti à la même période que google Panda et justement les informations qui y sont décrites vont dans le même sens que les éléments évalués par Google pour mesurer la qualité d'un site.

J'ai pris le temps de lire cet article et les 84 commentaires qui l'accompagnent et je suis ravi de vous communiquer les informations suivantes:

Intégration des données liées à l'engagement des internautes

Ce que j'appelle Engagement de l'internaute résume l'ensemble des critères de mesure de l'intérêt des internautes pour un site et son contenu. Ainsi Google va ajouter à son algorithme traditionnel certaines informations de ce type:

  • Nombre total de visites sur une page
  • Nombre total de visiteurs sur une page
  • Nombre total des visites sur une page pendant une période donnée
  • Nombre de visiteurs d'une page sur une plage de temps donnée
  • Evolution des visites sur une page sur une période de temps (%)
  • Evolution des visiteurs sur une page sur une période de temps donnée (%)
  • Tous les autres critères qui permettent d'évaluer l'engagement des internautes

Bien entendu ces critères vont être utilisés soit en complément soit en remplacement de l'algorithme existant selon le type de recherche

Google intégre le comportement de l'internaute dans son algo

Comment Google va identifier l'internaute?

Afin d'attribuer à un internaute un comportement donné google va se baser sur:

  • l'adresse IP de ce dernier
  • L'hébergeur
  • les cookies, etc.

En plus de ces éléments Bill a rajouté un complément d'informations dans les commentaires en précisant que google dispose de nombreux leviers pour collecter des informations sur l'internaute. Ces informations sont collectées sur:

  • La barre de recherches Google
  • les recherches effectuées par les internautes connectés à un compte Google
  • les pages sur lesquels l'internaute utilise le bouton+1
  • les fichiers logs Google
  • les alertes Google et autres abonnements (google reader)
  • les informations Google+
  • etc...

Conclusion

Avec Panda, il semble bien que google insiste sur la qualité des résultats. L'intégration des données liées au comportement de l'internaute en complément ou en remplacement de l'algorithme existant me semble approprié, car au final même si un site arrive à manipuler l'algorithme google par une augmentation des occurrences de mots clés sur les pages et par les liens entrants, au final c'est l'attitude de l'internaute sur la page qui reste le meilleur arbitre: soit la page est de bonne qualité et il va partager le contenu à ces amis ce qui contribuera à améliorer le profil de liens entrants du site concerné, soit il va revenir directement sur google et selon le cas ceci peut être traduit comme une insatisfaction entraînant donc une sanction (perte des positions)

No responses yet

Algorithme Google Panda

août 14 2011 Published by Franck NLEMBA under Crawl

Suite à mon dernier article sur les astuces de référencement naturel pour préparer Google Panda, l'une des requêtes les plus fortes de mes statistiques est "algorithme Google Panda". A la base je ne voulais pas me risquer à proposer des données sur le fonctionnement de l'algorithme Google Panda mais l'intérêt des recherches google m'a amené à faire quelques recherches sur le sujet.

Lorsqu'on lit les informations proposées par Google au sujet du fonctionnement de Google Panda, on s'aperçoit qu'avec Google Panda, google a développé un modèle de classement des pages qui est basé certes sur leur pertinence (mots clés) et sur leur notoriété (liens entrants) mais aussi sur la crédibilité du site, le niveau d'expertise de l'auteur du contenu, l'originalité de l'article, la profondeur des thèmes abordés,etc...

Eléments de l'algorithme Google panda

L'algorithme Google panda serait donc basé sur un modèle de classement des pages de plus de 5 millions de paramètres différents, basé sur des prédictions du comportement de l'internaute face aux résultats de recherche. Ainsi pour avoir une vision macro de l'algorithme Panda il faut considérer les 3 éléments suivants:

  • La recherche de l'internaute qui correspond à la requête utilisé par l'internaute, les mots clés dans la requête,...
  • Les informations sur l'internaute: adresse IP, cookies, langue utilisée, zone géographique,...
  • Les informations sur les documents proposés sur les pages de résultats: l'url, mots clés dans le document, title, ancre des liens qui pointent vers le document, ...

Il faut noter que Panda est basé sur un modèle de prédiction du comportement de l'internaute face à un type de résultats. Ceci revient donc à dire que ces différents paramètres de l'algorithme sont très souvent combinés. Par exemple Google va croiser le comportement de l'internaute aux requêtes qu'il a effectué à un moment précis de la journée ou encore le modèle va analyser les dernières requêtes effectuées par un internaute, identifier le type de résultats sur lequel il clique mais aussi ceux sur lesquels il ne clique pas; le nombre de fois où il y'a une correspondance entre la requête et les mots clés dans le document...

En plus de ces informations sur l'internaute, sa requête et la page de destination, des spécialistes comme Bill Slawski ont également indiqué que l'algorithme Google Panda serait enrichi d'autres systèmes de classement des documents à grande échelle d'une part mais aussi de nombreuses évolutions de l'infrastructure google pour améliorer la qualité des publicités adwords, lutter contre les spams, améliorer le classement des résultats...; ce qui a pour avantage de faciliter les mises à jour rapide et la propagation de Google panda à très grande échelle.

Conclusion

A mon avis on ne saurait parler de l'algorithme Panda car selon toute vraisemblance il s'agirait d'une optimisation de l'infrastructure google qui facilite la combinaison de plusieurs algorithmes pour classer les résultats à basés sur des millions de paramètres. Ainsi Comme l'ont indiqué Matt Cutts et Amit Singhal Google panda est d'abord un modèle qui ne s'applique pas à toutes les requêtes mais seulement à un échantillon d'entre elles (6 à 9% d'entre elles).

Le modèle va donc classer les pages sur la base de l'analyse de leurs caractéristiques et va se servir du comportement de l'internaute pour évaluer la pertinence de l'ensemble du système. C'est donc comme si Google choisit 10 requêtes, identifie dans ses bases de données les pages qui contiennent des informations sur ces requêtes, les analyses sur la base des critères de qualité définis dans le modèle, les classe et propose à l'internaute les nouveaux résultats classés selon ces règles de qualité: si l'internaute passe plus de temps sur la page ou le site réduisant au passage son taux de rebond, le recommande en faisant un lien le site,...alors l'algorithme aura été efficace.

Tout ceci revient donc à penser à raison, qu'aujourd'hui certains sites ne soient pas touchés par Panda soit parce que leur contenu est de "qualité" soit parce que leur contenu n'est pas encore traité par Google Panda. Par ailleurs avec Panda Google veut améliorer la qualité des résultats pour l'internaute. Par conséquent à défaut de connaitre tous les paramètres de l'algorithme Google il fait bien analyser toutes les informations qui traduisent le comportement de vos internautes sur le site:

  • Taux de rebond
  • Taux de sortie de vos pages
  • Temps passé sur vos pages
  • Taux de clics sur vos résultats de recherche
  • Correspondance entre les requêtes des internautes et le contenu de vos pages,...

5 responses so far

Google Panda en france

août 14 2011 Published by Franck NLEMBA under Actualités google

L'arrivée de Google Panda en France ce n'est pas une surprise; et si j'ai posté seulement un article sur Google Panda en France aujourd'hui c'est parce que je considère que Google Panda n'est plus et ne sera plus jamais une exclusivité; tous les experts en référencement vont devoir considérer Google Panda comme un phénomène normal un peu comme la mise à jour du Pagerank.

Qu'à cela ne tienne je tiens à préciser qu'officiellement Google Panda est en Europe. Ceux qui n'ont pas eu le temps de lire le communiqué de Google il se trouve ici

Pour information çà fait plusieurs mois que l'intérêt des internautes pour Google Panda en France est avéré (voir l'image ci-dessous)

google panda en france

Sur les 90 derniers jours les choses étaient un peu plus calme en France, Mais tout semble s'être accéléré le jeudi 11 Août 2011 et le lendemain 12 Août le communiqué officiel de Amit Singhal confirmait ces tendances.

confirmation de la présence de google panda en france

A Lire

Conseils pour bien préparer l'arrivée de Google Panda en France

No responses yet

Evaluer la qualité du code source pour Google

août 09 2011 Published by Franck NLEMBA under Crawl

Le 18 Juillet dernier, Google a remis à l'ordre du jour un vieux débat sur la qualité du code source. En effet, depuis Google Instant et son impact sur les taux de clics, associé à l'impact de Google Panda sur les positions de certains sites, il ne se passe plus un mois sans que les équipes Google ne proposent aux webmasters des conseils pour améliorer la qualité de leur site.

En ce qui concerne la qualité du code source et notamment de la validation du HTML et CSS, Google a évoqué des raisons qui motivent ces conseils aux webmasters:

  • Google tient compte de la qualité du code source en donnant un score à ses pages
  • Les techniques de codages des sites web évoluent ce qui peut entrainer quelques erreurs
  • De nombreux standards de validation existent d'où la nécessité de préciser quelques points

Comment valider la qualité du code source de son site?

Google recommande d'utiliser le validateur de W3C pour évaluer et valider le code HTML & les CSS. A noter que Google a indiqué que le fait d'avoir un excellent score de qualité n'est pas une garantie dans l'amélioration du crawl ou de l'indexation de votre site. Toutefois à mon avis il est nécessaire d'en tenir compte car la plupart des sanctions concerne désormais la qualité des sites.

A Lire

Comment bien gérer les sitemaps pour faciliter le travail des moteurs de recherche

Optimiser le temps de chargement des pages

Tous les articles sur le crawl de Google

One response so far

Older posts »