Google

Référencement sur Google actualités: Partie II

avr 12 2010 Published by Franck NLEMBA under Crawl

La semaine dernière j'ai commencé à aborder les basics de l'indexation sur Google actualités. la première partie de mon travail consistaità expliquer les mécanismes d'indexation et de crawl de Google actualités. Aujourd'hui je vais m'arrêter un petit peu sur la catégorisation.

Les bases de la catégorisation sur Google actualités

Le robot google actualités classent les articles selon 02 méthodes: l'identification des thèmes et l'identification des champs sémantiques.

La notion de thème renvoie ici à la catégorisation dans Google actualités. Dès qu'un site a du contenu éditorial et qu'il est déclaré éligible sur Google actualités stratégiquement il serait intéressant pour faciliter l'inclusion des articles de catégoriser le contenu de votre site à la manière dont Google Actualités classe les siens. Ainsi un webzine généraliste par exemple devrait envisager de classer le contenu de la manière suivante: politique, sport, Economie, santé,...

categories-google-actualites

categories-google-actualites

Les champs sémantiques sont à l'intérieur des thèmes et permettent au robot d'affiner la catégorisation. Par exemple si vous avez un blog sur la mode en France le robot cherchera les éléments suivants: thèmes, (mode) mots clés relatifs au thème (vêtements, Mannequin, défilé, Paris, Yves Saint Laurent, ...) date de publication, niveau d'illustration (images, vidéos,...).

Cabine téléphonique Orange

Cabine téléphonique Orange

Recommandations pour faciliter l'indexation:

  • Classez vos articles dans le bon répertoire (catégorie, ou sous-catégorie sur votre site) à l'intérieur de votre site
  • Utilisez des termes génériques par exemple la notion de lieu (pays, ville, région...) , les marques, les enseignes, bref une référence assez populaire pour aider le robot à bien classer votre article

La prochaine fois je vais aborder le classement des articles dans la catégorie (qui est premier et pourquoi?)

No responses yet

Conseils pour être bien référencé sur Google Actualités

avr 08 2010 Published by Franck NLEMBA under Crawl

Cett année on commence progressivement à prendre la mesure de Google News et globalement de la recherche universelle. Le conflit entre Google et le monde des médias notamment celui de la presse écrite a contribué à amener les référenceurs à s'intéresser au fonctionnement de Google News, ceux de google en premier: Voir la documentation Google au sujet du fonctionnement de Google News

Accueil google actualités

Accueil google actualités

Sur cette série d'articles sur Google News je vais balayer les éléments suivants:

  1. Crawl et indexation sur Google News
  2. Catégorisation des articles sur Google News
  3. Critères de classement des articles sur Google News
  4. Autres recommandations pratqiues

Crawl et Indexation sur Google News

Le robot Google News à l'image des autres Robots Google explore les sites d'informations de 02 manières différentes mais complémentaires:

  • La première méthode de l'exploration du contenu est celle que je qualifie de "naturelle" c'est-à-dire au fur et à mesure que le contenu est publié sur les sites et que les urls sont découvertes
  • La deuxième méthode d'exploration du contenu c'est à travers le Google News sitemap.

A la différence du Google_bot Web, le robot d'indexation du contenu Google actualités passent plus régulièrement que sur un site web classique. Pour la petite histoire il s'agit d'une optimisation récente apporté par Google car avant lorsqu'un webmaster mettait à jour du contenu il fallait qu'il envoie à Google une nouvelle url; mais suite à la nouvelle optimisation du robot, Google peut repasser toutes les heures sur les sites qui ont une fréquence de publication très élevé (CNN, New York times,...) mais en moyenne toutes les 12 heures.

Bloquer du contenu à l'indexation

Si le webmaster ne souhaite pas que le contenu du site soit récupérer par Google, il peut utiliser les méthodes classiques notamment l'utilisation du robots.txt ou du meta tag: <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

Voir toutes les instructions pour empêcher Google d'extraire votre contenu

En conclusion de ce premier article pour être intégré dans Google News il faut que le robot Google puisse avoir accès au contenu de votre site. Ce dernier doit donc avoir du contenu éditoriale, une fréquence de publication au quotidienne et un sitemap pour communiquer à Google les bonnes urls.

No responses yet