Le référencement / SEO pour les débutants


précédentsommairesuivant

III. Moteurs de recherche : compréhension et approche

III-A. Principe général : fonctionnement des moteurs recherche

Pour bien comprendre en quoi et comment il est possible d'optimiser un site internet pour améliorer son référencement, il convient tout d'abord de comprendre comment fonctionne, globalement, un moteur de recherche. L'affichage d'une page de résultats (sur Google, Yahoo !) n'est que la partie émergée d'un mécanisme complexe, commun à l'ensemble des principaux moteurs de recherche.

Ce mécanisme repose sur deux étapes (4) :

  1. La constitution et mise à jour des données
  2. L'analyse des requêtes et la restitution des résultats
Les différentes étapes du fonctionnement des moteurs de recherche
Les différentes étapes du fonctionnement des moteurs de recherche

Voici une explication rapide de ce processus :

III-A-1. Constitution et Mise à jour des données

III-A-1-a. Le crawling

le moteur explore le web et stocke les informations.

III-A-1-b. Le moteur d'indexation :

le moteur traite les données recueillies et les ajoute à un index géant.

III-A-2. Analyse des requêtes et restitution des résultats

III-A-2-a. Analyse du mot-clef :

un interpréteur analyse l'expression tapée par l'utilisateur.

III-A-2-b. Recherche dans l'index :

le moteur recherche les résultats associés dans l'index.

III-A-2-c. Organisation des résultats :

le moteur détermine l'ordre d'apparition des résultats selon un ensemble de règles de tri.

Ces processus sont communs aux principaux moteurs de recherche du web (notons qu'on ne parle pas des annuaires ici). Par contre, les différents algorithmes utilisés (indexation, règles de tri...) sont généralement tenus secrets et dépendent du moteur utilisé.

III-B. " Dark Hat " versus " White Hat "

Le référenceur dispose d'un ensemble de techniques très variées pour son optimisation. Mais si certaines sont acceptées et encouragées par les moteurs de recherche (techniques " White Hat "), d'autres sont largement déconseillées voires interdites (techniques " Dark Hat "), car elles entraînent des pages au contenu " non naturel " pour l'utilisateur. L'utilisation de ces techniques frauduleuses, si elle est détectée, peut entraîner des pertes importantes pour le site concerné, allant d'un affaiblissement du positionnement au bannissement total du site dans l'index du moteur de recherche. Nous ne parlerons pour l'instant que des techniques approuvées par les moteurs de recherches : la White SEO. Google publie régulièrement sur son Blog la liste des techniques qu'il considère comme frauduleuses, et Il existe plusieurs documents de référence, comme LA CHARTE DE QUALITE ET DE DEONTOLOGIE SUR LE REFERENCEMENT DE SITES WEB (5) , du réseau Abondance, acteur majeur du référencement français.

III-C. le Page Rank

Pendant longtemps, on a considéré (et c'était vrai à l'époque) que le critère principal du positionnement d'une page était son Page Rank, c'est-à-dire une note sur dix, attribuée par Google, prenant compte de nombreux critères mais dont le principal était le nombre de liens pointant vers ladite page (" Back Links"). Aujourd'hui, le Page Rank tend à avoir de moins en moins d'effet. Google reconnaît même que les données qu'il fournit aux webmestres sur le Page Rank de leur page ne sont qu'approximatives. En effet, c'est la qualité du contenu de la page qui prime : pertinence et originalité. Et même si le nombre de Back Link continue d'influer sur le positionnement de la page sur un mot donné, là encore la qualité est de mise : plus le site qui pointe vers la page est " digne de confiance "(6) ", plus la page est valorisée. Même si Google se défend de donner trop d'importance au Trust Rank (7) , il semble bien qu'aujourd'hui le Page Rank tend à laisser la place à la qualité, au détriment de la quantité.


précédentsommairesuivant
REUSSIR SON REFERENCEMENT WEB, chap. 2 - Olivier Andrieu (Eyrolles - 2007)
LA CHARTE DE QUALITE ET DE DEONTOLOGIE SUR LE REFERENCEMENT DE SITES WEB, Réseau Abondance
Indice généralement nommé " Trust Rank " par Yahoo!, ou " Indice de Confiance ". Un site qui propose des contenus de très bonne qualité se verra attribuer un très bon indice de confiance, à l'inverse d'un site qui, par exemple, contiendra des contenus plagiés. Google attribue de base une confiance maximale au site dont l'extension est .gov ou .edu, .gouv… (sites officiels ou de l'enseignement).
Cf. MYTHES ET REALITES DU MOTEUR DE RECHERCHE GOOGLE, par Google : Le Trust Rank est à la base un concept de Yahoo!

Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants : Viadeo Twitter Facebook Share on Google+   

  

Les sources présentées sur cette page sont libres de droits et vous pouvez les utiliser à votre convenance. Par contre, la page de présentation constitue une œuvre intellectuelle protégée par les droits d'auteur. Copyright © 2008 Jean-François Lépine. Aucune reproduction, même partielle, ne peut être faite de ce site et de l'ensemble de son contenu : textes, documents, images, etc. sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.