Archive for the 'Crawl' category

Evaluer la qualité du code source pour Google

août 09 2011 Published by Franck NLEMBA under Crawl

Le 18 Juillet dernier, Google a remis à l’ordre du jour un vieux débat sur la qualité du code source. En effet, depuis Google Instant et son impact sur les taux de clics, associé à l’impact de Google Panda sur les positions de certains sites, il ne se passe plus un mois sans que les équipes Google ne proposent aux webmasters des conseils pour améliorer la qualité de leur site.

En ce qui concerne la qualité du code source et notamment de la validation du HTML et CSS, Google a évoqué des raisons qui motivent ces conseils aux webmasters:

  • Google tient compte de la qualité du code source en donnant un score à ses pages
  • Les techniques de codages des sites web évoluent ce qui peut entrainer quelques erreurs
  • De nombreux standards de validation existent d’où la nécessité de préciser quelques points

Comment valider la qualité du code source de son site?

Google recommande d’utiliser le validateur de W3C pour évaluer et valider le code HTML & les CSS. A noter que Google a indiqué que le fait d’avoir un excellent score de qualité n’est pas une garantie dans l’amélioration du crawl ou de l’indexation de votre site. Toutefois à mon avis il est nécessaire d’en tenir compte car la plupart des sanctions concerne désormais la qualité des sites.

A Lire

Comment bien gérer les sitemaps pour faciliter le travail des moteurs de recherche

Optimiser le temps de chargement des pages

Tous les articles sur le crawl de Google

One response so far

La gestion des sitemaps et l’indexation des pages

jan 24 2011 Published by Franck NLEMBA under Crawl,Google image

Matt Cutts a donné le ton sur cette année 2011 et j’ai juste envie de dire qu’il était temps car les résultats sur Google du point de vue leur qualité sont très Optimisables.

De nombreux sites en France occupent de très bonnes positions sur Google France par exemple, et la qualité du contenu proposé est très médiocre. « Ce sont toujours les mêmes qui occupent les premières positions » sur la mode et le prêt à porter, les requêtes liés à l’enfant, le high tech…les petits sites ont de moins en moins de chance de se positionner sur la première page faute de moyen et parfois avec une qualité de contenu meilleure…on pourrait dire pleins de choses sur la qualité des résultats Google mais je vous laisse lire l’article de Matt Cutts

Revenons sur le sujet : l’Optimisation des sitemaps. Première précision les sitemaps dont je parle ici sont bien les XML sitemaps donc le rôle est d’aider Google à découvrir l’ensemble des contenus de vos pages. Les détails sur leur création se trouvent dans le sitemap protocol et leur monitoring se fait à partir du Google webmasters Tool.

types de sitemap dans le google webmasters tool

Le sitemap n’influence pas les positions

Si vous êtes expert du référencement naturel évidemment la question de l’utilité des sitemaps ne se pose pas (par exemple pour un site de moins de 50 pages un sitemap XML à mon avis ne sert pas à grand chose dans la mesure où le contenu est statique) à moins que vous ne les utilisiez pas pour une raison pour une autre.

L’une des erreurs que les clients font souvent c’est de considérer que le sitemap sert à améliorer les positions. La réponse est évidement non car ce qu’il faut comprendre c’est qu’avant d’être positionné sur Google votre site doit être accessible en d’autres termes les robots Google doivent pouvoir explorer l’ensemble des pages du site.

Evidemment si le site a entre 10 et 50 pages de contenu utile à l’internaute il y’a des chances que Google l’explore totalement. Vous pouvez par exemple vous en assurer avec la commande [site:www.monsite.com].

Le fait d’avoir un sitemap ou pas n’a donc aucune influence sur vos positions. Par contre si toutes les pages du site sont indexées ceci peut aider les pages du site à vous apporter plus de visites sur différents types de requêtes.

A quoi sert le taux d’indexation des sitemaps

Ce critère est très important pour deux raisons:

  • Ils vous donnent la proportion de pages de votre site qui sont dans l’index principal de Google
  • Ils vous donne une idée de la qualité de vos pages car si Google les indexe totalement ceci revient à dire que votre contenu remplit certains critères de qualité

On considère en général qu’un bon taux d’indexation se situe à 40%. Si vous avez un taux d’indexation inférieur à 40% il faut essayer d’identifier les pages qui font moins de visites chaque mois et celles qui reçoivent moins de liens la réponse est peut être là!

Comment organiser mes sitemaps?

Rob de Distilled a récemment publié un excellent article sur la gestion des xml sitemaps. La majorité des techniques qui y sont expliquées peuvent être appliquées à un moment ou à un autre selon le type de site. Ce qu’il faut retenir c’est que le fait d’éclater vos urls dans différents fichiers selon leurs types facilitera l’analyse.

sitemaps

Pour Finir Google continue d’améliorer la manière dont il découvre les contenus sur Internet, il est donc important lorsque l’on a des vidéos sur un site de penser à faire un sitemap pour héberger les urls de ces vidéos ou encore un sitemap pour les images du site

No responses yet

Mise à jour du google webmaster Tool

oct 14 2010 Published by Franck NLEMBA under Crawl

Google a intégré de nouvelles fonctionnalités dans la plate forme pour webmaster (google webmaster tool) accentuant ainsi ses progrès dans l’enrichissement des outils gratuits mis à la disposition des propriétaires de site.

En effet tous les experts en référencement naturel savent qu’il est très important d’avoir beaucoup de liens entrants pour être bien référencer. Google donne donc la possibilité en plus du nombre de liens entrants, d’avoir des informations très précises sur les pages du site et les liens qu’elles reçoivent d’autres sites.

On aura donc désormais dans le google webmaster tool une information très riche sur le profil de liens notamment:

  • le nombre de sites référents (sites qui font au moins un lien) au site ou à une page précise
  • les pages du site qui reçoivent le plus de liens entrants
  • les principales ancres généralement utilisées pour faire des liens vers votre site

Au delà de cette annonce j’aimerais faire remarquer que Google sauve un peu les experts. En effet Yahoo ou mieux Bing avait décidé de ne plus proposer les informations sur les liens avec la commande « linkdomain », abandonnant plus ou moins les experts vers des outils de tracking des liens payants du type OSE, ou linscape,…

Or comme tout le monde le sait aucun moteur de recherche n’a la profondeur de crawl de Google encore moins un « index » important comme le sien, ce qui rend Google légitime en matière d’informations sur les liens. Si à cela j’ajoute que la commande « link: + Nom du site » sur Google ne donnait pas plus d’informations sur les liens, je suis donc en droit de penser que le détail des liens dans le google webmaster tool est fiable et doit conduire aux stratégies d’acquisition de liens entrants. Découvrez donc toutes les nouvelles informations sur les liens dans votre compte google webmaster tool

No responses yet

Fréquence d’indexation Google

oct 07 2010 Published by Franck NLEMBA under Crawl

Matt cutts répond à une question sur la fréquence d’indexation des contenus sur Google. J’ai personnellement trouvé cette question très pertinente dans la mesure où beaucoup d’experts ont tendance à utiliser la commande [site:monsite.com]; or cette dernière ne donne pas toujours les mêmes résultats d’où la nécessité de s’interroger sur son utilité d’une part mais aussi sur l’amélioration des résultats (nombre de pages indexées).

La question est donc de savoir si les experts en référencement naturel pourront avoir le nombre de pages indexées en temps réel? Cliquez pour voir la réponse de Matt cutts:

indexation des résultats en temps réel

Sinon de manière globale la meilleure façon d’avoir une idée de la fréquence d’indexation de votre site est d’analyser les résultats récents accessibles sur la page de résultat Google

dernières pages indexées

A lire: article très intéressant sur la nécessité de mettre à jour le contenu sur Google : google’s love freshness

No responses yet

Rendre le site accessible à Google

août 11 2010 Published by Franck NLEMBA under Crawl

Lors de nos ateliers en Agence j’ai souvent l’habitude d’indiquer à nos clients que la première chose qui intéresse les équipes de référencement naturel c’est pas les positions encore moins le trafic (visites); c’est l’accessibilité du site et la facilité d’exploration des robots Google.

Ceci peut sembler paradoxale dans la mesure le but est d’expliquer au client que les optimisations en référencement naturel aussi techniques soient elles visent simplement à attirer le maximum de clients et prospects et qu’à ce titre le nombre de visites est un critère important…

Revenons donc aux bases. Google explore les sites web et en extrait une copie qu’il enregistre dans ces bases de données: c’est le crawl et l’indexation. L’accessibilité du site web est donc très importante pour Google mais aussi pour les clients qui sont souvent exposés à de nombreux messages publicitaires et viennent chercher sur internet les sites correspondants et si ces derniers ne sont pas visibles c’est une perte…

Voici donc quelques règles à respecter avant de penser à regarder les positions et l’évolution des visites:

  1. S’assurer que l’architecture du site est simple et que Google a bien accès à toutes les pages à travers des liens
  2. S’assurer que chaque page du site est accessible à travers au moins un lien
  3. Créer un plan de site pour les visiteurs (le plan de site html ne doit pas avoir plus de 100 liens)
  4. Le contenu du site doit être pertinent c’est-à-dire utile à l’internaute, les pages doivent être structurées
  5. S’assurer que chaque page aborde au moins un mot clé important afin de s’assurer qu’elle sera active (recevra de la visite)
  6. Privilégier le texte à l’image malgré les optimisations de Google sur les images
  7. S’assurer que le title tag et les balises alternatives sont suffisamment descriptives

Lien utile: lire le blog d’Andy Hagans à ce sujet

One response so far