III. Moteurs de recherche : compréhension et approche▲
III-A. Principe général : fonctionnement des moteurs recherche▲
Pour bien comprendre en quoi et comment il est possible d'optimiser un site internet pour améliorer son référencement, il convient tout d'abord de comprendre comment fonctionne, globalement, un moteur de recherche. L'affichage d'une page de résultats (sur Google, Yahoo !) n'est que la partie émergée d'un mécanisme complexe, commun à l'ensemble des principaux moteurs de recherche.
Ce mécanisme repose sur deux étapes (4) :
- La constitution et mise à jour des données
- L'analyse des requêtes et la restitution des résultats
Voici une explication rapide de ce processus :
III-A-1. Constitution et Mise à jour des données▲
III-A-1-a. Le crawling▲
le moteur explore le web et stocke les informations.
III-A-1-b. Le moteur d'indexation :▲
le moteur traite les données recueillies et les ajoute à un index géant.
III-A-2. Analyse des requêtes et restitution des résultats▲
III-A-2-a. Analyse du mot-clef :▲
un interpréteur analyse l'expression tapée par l'utilisateur.
III-A-2-b. Recherche dans l'index :▲
le moteur recherche les résultats associés dans l'index.
III-A-2-c. Organisation des résultats :▲
le moteur détermine l'ordre d'apparition des résultats selon un ensemble de règles de tri.
Ces processus sont communs aux principaux moteurs de recherche du web (notons qu'on ne parle pas des annuaires ici). Par contre, les différents algorithmes utilisés (indexation, règles de tri...) sont généralement tenus secrets et dépendent du moteur utilisé.
III-B. " Dark Hat " versus " White Hat "▲
Le référenceur dispose d'un ensemble de techniques très variées pour son optimisation. Mais si certaines sont acceptées et encouragées par les moteurs de recherche (techniques " White Hat "), d'autres sont largement déconseillées voires interdites (techniques " Dark Hat "), car elles entraînent des pages au contenu " non naturel " pour l'utilisateur. L'utilisation de ces techniques frauduleuses, si elle est détectée, peut entraîner des pertes importantes pour le site concerné, allant d'un affaiblissement du positionnement au bannissement total du site dans l'index du moteur de recherche. Nous ne parlerons pour l'instant que des techniques approuvées par les moteurs de recherches : la White SEO. Google publie régulièrement sur son Blog la liste des techniques qu'il considère comme frauduleuses, et Il existe plusieurs documents de référence, comme LA CHARTE DE QUALITE ET DE DEONTOLOGIE SUR LE REFERENCEMENT DE SITES WEB (5) , du réseau Abondance, acteur majeur du référencement français.
III-C. le Page Rank▲
Pendant longtemps, on a considéré (et c'était vrai à l'époque) que le critère principal du positionnement d'une page était son Page Rank, c'est-à-dire une note sur dix, attribuée par Google, prenant compte de nombreux critères mais dont le principal était le nombre de liens pointant vers ladite page (" Back Links"). Aujourd'hui, le Page Rank tend à avoir de moins en moins d'effet. Google reconnaît même que les données qu'il fournit aux webmestres sur le Page Rank de leur page ne sont qu'approximatives. En effet, c'est la qualité du contenu de la page qui prime : pertinence et originalité. Et même si le nombre de Back Link continue d'influer sur le positionnement de la page sur un mot donné, là encore la qualité est de mise : plus le site qui pointe vers la page est " digne de confiance "(6) ", plus la page est valorisée. Même si Google se défend de donner trop d'importance au Trust Rank (7) , il semble bien qu'aujourd'hui le Page Rank tend à laisser la place à la qualité, au détriment de la quantité.