Personnellement je suis heureux même si çà reste une annonce que les équipes Google s'attaquent à cette problématique de sous -domaines. En principe avoir un sous/domaine pour l'un de ces sites c'est pas dramatique, c'est même une bonne pratique dans la mesure où çà permet de développer du contenu spécifique.
Cependant c'est assez difficile d'expliquer à un client qu'un de ces concurrents est mieux positionné parcequ'il reçoit beucoup de liens entrants et que la plupart de ces liens entrants proviennent d'un autre site qui en fait fait partie des sites de son réseau.
J'ai personnellement observé celà lorsque je bossais pour les sites qui proposent des services d'assurances et je peux exprimer ma frustration de voir que google considérait un lien en provenance d'un sous-domaine vers le site principal comme un lien entrant purement et simplement.
Ainsi voici ce que je tire de l'annonce faite par Google au sujet de la réorganisation des informations sur les liens internes et externes dans le Google webmaster tools:
- Le webmasters tool va vous afficher la totalité de vos liens (ce qui est déjà le cas à certains égards)
- Ainsi comme d'habitude on a deux groupes: les liens internes & les liens externes
- Avant un site provenant de http://example.com vers www.example.com était considéré comme un lien externe; maintenant Google le considérera comme un lien interne
- Ceci va s'appliquer à tous les sous-domaines qui sont rattachés à un site principal

Google a par ailleurs précisé que selon le cas le nombre total de liens pouvait évoluer à la hausse ou à la baisse suite à ces changements. Par contre au moment où je fais cet article je n'ai pas encore observé de changement sur les liens dans les comptes Google webmasters tools de mes clients, je crois que çà va se faire progressivement. Par ailleurs je précise à ceux qui me posent des questions sur l'impact de ce changement sur Google panda et sur les positions de manière globale; qu'à mon avis cet impact sera très minime car Google a annoncé qu'ils allaient modifier la manière de nous communiquer une information qu'ils ont déjà à savoir le nombre de liens internes et externes qui pointent vers un domaine.
Le 16 Août dernier Google a apporté une modification à la présentation des liens d'accès directs. Désormais lorsque l'internaute fait une recherche très précise sur une marque, une enseigne ou tout simplement un nom de domaine il aura la possibilité d'accéder directement aux pages internes du site. Google a en effet modifié la présentation des liens d'accès direct en y ajoutant plus de contexte (url de la page et mini description) d'une part mais aussi le moteur de recherche a doublé le nombre de liens maximum proposés à l'internaute (maximum 12 liens) . Google a par ailleurs annoncé que le nombre de requêtes qui proposeront des liens d'accès direct a aussi augmenté.
Les bénéfices pour l'utilisateur sont importants:
- Possibilité d'accéder directement au contenu voulu
- Possibilité de voir des pages du site qu'on a pas l'habitude d'explorer (découverte de nouvelles pages)
- Possibilité d'avoir une vision générale de la structure du site
- ...
Google a également annoncé des changements dans l'algorithmes de génération de ces liens qui comme les autres mises à jour, proposera plus ou moins de liens d'accès en fonction de l'intention de l'internaute.
Pour mois ces changements vont dans le même sens que les précédents à savoir améliorer la qualité des résultats proposés à l'internaute. En effet tout expert qui s'est interessé de près ou de loin à la détection du comportement de l'internaute s'est très souvent heurté à la catégorisation des requêtes génériques. Prenons l'exemple d'un internaute qui va chercher une chaussure . Il est très difficile pour Google de déterminer avec précision l'intention de ce dernier (recherche t-il une adresse de magasin? souhaite t-il acheter une chaussure? recherche t-il des informations sur l'histoire de la chaussure?...).
Or si le même internaute fait une recherche sur la halle aux chaussures son intention devient tout de suite plus claire bien que la requête reste assez générique. C'est donc pour permettre à cette internaute qui n'a pas encore dit si il voulait avoir des informations sur les sandales de la halle aux chaussures, des chaussures femmes de la halle aux chaussures ou même des informations sur le recrutement chez la halle aux chaussures que les liens d'accès directs trouvent leur pertinence.

Que doivent faire les experts en référencement naturel?
Pour les référenceurs tout ceci a bien sûr impact car il sera question ici de valider la pertinence de la structure du site d'une part et de monitorer les visites vers le spages profondes. En outre, ce sera interessant de faire attention aux éléments suivants:
- Créer une alerte sur Google Analytics pour identifier éventuellement des impacts sur le trafic global du site
- Mesurer l'évolution des consultations sur la page d'acceuil et les autres pages proposés en accès directs
- Vérifier si il y'a une relation entre les sections les plus consultées du site et les liens d'accès directs
- Monitorer les liens d'accès directs dans le Google webmasters tools (possibilité de rétrograder une page pour qu'elle ne propose pas des sitelinks)
- Monitorer le nombre de résultats de recherche qui entraine la génération des liens d'accès directs
Mise à Jour de Janvier 2012
Google a indiqué qu'ils ont fait des modifications sur ces liens d'accès directs. Voir ici
Cette semaine j'ai rencontré certains webmasters qui s'interrogeaient sur comment rediger des contenus optimisé pour le référencement naturel? La quesion à mon avis ne devrait pas se poser car le véritable souci du redacteur web est de présenter un contenu:
- Accessible: optez pour une navigation simple et des liens internes qui fonctionnent
- Pertinent: proposez un contenu en rapport avec les requêtes des internautes
- Incitatif et suggestif: l'internaute doit se sentir guidé et accompagné sur le site
Donc avant d'aborder la question de la redaction de contenu optimisé pour le référencement naturel il faut d'abord connaitre son offre: A quel type de besoin répond mon produit? A quel type de recherche d'informations mon billet est susceptible d'apporter une réponse. Cette réflexion constitue à mon sens la première étape de la reflexion pertinente.
Ensuite il faut identifier ce que recherche les internautes dans la thématique couverte. Par exemple dans le secteur de l'optique, le webmaster pourra se demander si les internautes:
- Utilisent des mots clés génériques: lunette, lentilles, verre
- Des mots clés génériques fonctionnels: "lunette de soleil"...
- Des mots clés génériques + marque : lunette Rayban...
La troisième phase consiste à optimiser les pages. A mon avis inutile de se prendre la tête sur le nombre d'occurence sur la page, la position des mots clés,...
Diverses expériences nous ont montré que sur certaines requêtes génériques sur www.google.fr on pouvait voir en premières positions des pages qui avaient beaucoup de méta KW (or Google dit ne pas s'interesser à ce champ), des pages sans balises H1 ni H2...des pages avec un footer trop important,...
Ceci prouve bien que les facteurs d'optimisations de la page ne compte pas beaucoup sur le ranking, sur une échelle de 100 il valent 20%, les autres éléments (Age du domaine, Liens entrants, Ancres, contenu frais, accessibilité...) pour 80%.

Pour me résumer l'optimisation sémantique des pages vise à assurer une présence des mots clés les plus importants sur les éléments suivants:
- META
- URL
- Liens internes
- ALT
- Body
Très recemment lors du petit dejeuner de l'agence Baobaz à Paris nous avons eu beaucoup de questions interessantes parmis lesquelles celles qui concernaient les liens d'accès directs proposés par Google aujourd'hui. L'une des questions posées étaient justement comment fait-on pour avoir les liens profonds?

La réponse à cette question est bien diffcile dans la mesure où selon les Google ces liens sont générés de manière algorithmique donc pas contrôlable si ce n'est de pouvoir modifier les liens d'accès directs dans le google webmaster tool.
Ce que l'on observe en général c'est que les liens d'accès directs sont toujours en rapport avec des requêtes ou des expressions génériques & populaires : vetement bébé 0-2 ans pour DPAM, "Femme" pour la catégorie chaussure femme de la halle aux chaussures mutuelle santé pour assurland par exemple....
Par ailleurs les pages de destination sont des pages qui ont un bon niveau de pagerank par rapport à la page d'accueil: PR= 4 pour assurland, PR=3 pour HOC ,..Autant dire que dans la manière dont le webmaster structure le site il peut sans le vouloir influencer les liens d'accès directs dans la mesure où les pages de catégories par exemple sont en général très haut placées dans la navigation du site et si elles sont bien nommées il y'a des chances que Google les récupère pour les proposer aux internautes.
Voici quelques raisons qui à mon avis peuvent expliquer la génération des liens profonds:
- L'historique: il est plus facile pour les robots Google de générer des liens d'accès directs pertinents si ils connaisent bien le comportement (les liens en général cliqués) par les internautes qui visitent un site
- La sémantique général du site: si les catégories sont bien nommées notamment si elles utilisent des mots clés génériques il y'a des chances que vos liens d'accès directs soient rapidement générés par Google
- La présence de plusieurs pages dans le site ayant un bon niveau de PageRank
- La syntaxe des ancres des liens internes: parfois Google récupère des ancres qu'il trouve dans les pages riches en contenu à l'intérieur du site
- La fréquence d'acquisition des liens entrants: plus un site attire de nouveau lien sur des syntaxes différentes plus il a aura la possibilité d'obtenir des liens directs...
Toutefois ceci n'est pas une règle générale dans la mesure où Google continue à améliorer les résultats de sa page de résultats avec l'intégration du fil d'ariane (ce qui confirme mon hypothèse sur le bon nommage des catégorie) permet à l'internaute d'accéder directement à une catégorie haute (que l'on peut estimer pertinente du point de vue du webmaster).
Le plus important pour le référencement naturel est de s'assurer que toutes les pages du site sont bien indexées. Les méthodes d'indexation et de crawl ont beaucoup évoluées (voir article sur le real time search.) On se souvient qu'avant pour être présent Google avait besoin que le webmaster du site déclare son site sur une plate forme dédiée http://www.google.com/addurl/.
Quelques années plus tard on s'est aperçut que le fait de déclarer l'url ne suffisait pas car les robots préfèrent découvrir les pages à travers les liens entrants qui pointent vers ces dernières et par conséquent il était préférable pour s'assurer que votre site sera rapidement pris en compte d'obtenir un lien entrant depuis un site qui est déjà crawlé par le google_bot...ou de publier un XML sitemap,...
Dans un communiqué Officiel du google webmaster central blog, Google déclare qu'utiliser les flux RSS permet aux robots d'être informé assez rapidement des nouveaux contenus et surtout des contenus frais.
J'analyse cette information sous plusieurs angles. Je pense d'abord que le contenu "frais" et "actualisé" prend de plus en plus une place considérable dans l'algorithme Google. Nous en avons déjà parlé sur ce blog. En effet avant il suffisait d'avoir pleins de liens entrants vers une page pour qu'elle soit sur les premiers résultats. Aujourd'hui la complexité de l'algorithme fait que sur certaines requêtes la "fraîcheur du contenu" dépasse le nombre et la qualité des liens.
C'est aussi la preuve que l'indexation des flux RSS et Atom est arrivé à maturité chez Google; car on se souvient du communiqué Officiel de Google sur l'indexation des flux RSS des blogs où les équipes Google précisaient que l'algorithme allait désormais indexait le contenu de la page dont le robot découvrait l'Url.
Bien que l'article Google ne soit pas très complet car on ne sait pas si google va se contenter de crawler l'url de la page pour aller indexer son contenu plus tard ou si le crawl et l'indexation de la page se front au moment du crawl du flux?!
Qu'à cela ne tienne je vous conseillerai si vous souhaitez publier des flux rss sur votre site et surtout si vous souhaitez faciliter l'indexation de vos pages il faut faire des flux RSS complets et non partiels. Cela aiderait sûrement à avoir plus de visibilité sur les moteurs de recherche