Si vous lisez ceci c'est que vous ne pouvez profiter de l'interface de ce site de manière optimale. Aeris utilise les feuilles de style de manière à être visible par tous les navigateurs qui respectent les standards. Vous pouvez néanmoins avoir accès aux contenus :


1. Les moteurs de recherche (recherche précise)

Les moteurs sont des ROBOTS qui indexent des millions de PAGES Web. La recherche s'effectue sur les mots contenus dans le titre, la description et/ou la page elle-même. Ce sont les outils à utiliser quand on cherche une information précise qui peut être située sur une page particulière d'un site.

< Recherche - Classement des résultats - Présentation des résultats >

Les moteurs de recherche sont les outils à utiliser quand on cherche une information précise. Leur couverture est beaucoup plus importante que celle des annuaires, mais reste très parcellaire (environ 20% du Web pour les meilleurs d'entre eux). Il est indispensable de bien connaître la façon de les utiliser, leurs avantages et leurs limites.

Les moteurs de recherche indexent régulièrement des millions de PAGES Web dans une base de données. Pour cela, la plupart des moteurs de recherche utilisent des robots (programmes automatiques aussi appelés spiders ou crawlers) qui inventorient les pages Web et ajoutent les nouvelles adresses à leur base de données. Ces informations sont complétées par les auteurs de pages Web qui informent, de leur propre initiative, les moteurs de recherche de l'existence de leurs pages.

En plus des moteurs généralistes, il existe maintenant de nombreux moteurs de recherche spécialisés dans une discipline donnée, ou pour un type de document particulier (images, vidéos,...)

Chaque robot fonctionne à sa manière. Voilà pourquoi les résultats peuvent être différents pour une même requête selon que l'on utilise tel ou tel moteur. Les 3 principaux systèmes d'indexation utilisés par les robots sont les suivants (certains en utilisent plusieurs):

  • par mots clés. Lors de la conception d'une page Web, l'auteur peut indiquer une liste de mots clés (non affichée à l'écran : balise META keywords) qui sera recherchée par le moteur.
  • par titre. De même, la balise TITLE indique aux moteurs de recherche le titre du document.
  • dans le texte. Le robot indexe touts les mots (ou les mots des premières lignes) des pages Web.

Exemples :

< Recherche - Classement des résultats - Présentation des résultats - top>

Recherche

Les moteurs de recherche proposent un formulaire de recherche simple disponible sur la page d'accueil.

Exemple : AlltheWeb <http://www.alltheWeb.com>, formulaire de recherche simple

Formulaire de recherche simple de Alltheweb

Un formulaire de recherche avancée, beaucoup plus puissant est généralement proposé (par un lien).

Exemple : Google recherche avancée <http://www.google.com/advanced_search?hl=fr>

Le moteur cherchera l'occurrence du(des) mot(s) recherché(s) dans sa base de données contenant plusieurs millions de pages.

Attention, la recherche s'effectue dans la base de données du moteur et pas sur la totalité de l'Internet ! De plus il existe une part non-négligeable du Web totalement inaccessible aux moteurs : le Web invisible

< Classement des résultats - Présentation des résultats - top >

Classement des résultats

Les résultats seront classés selon un algorithme de pertinence propre au moteur (présence du mot dans le titre, dans le texte, dans les balises métas, dans l'url, indice de popularité...).

Exemple :

  • Google <http://www.google.com/intl/fr/why_use.html>

Attention cependant, de nombreux moteurs proposent sur leurs pages de résultats des liens sponsorisés. Dans le milieu du e-commerce et du e-marketing, c'est ce qu'on appelle le positionnement payant : des sociétés achètent aux enchères certains mots clés afin de se retrouver dans les premiers résultats d'une requête comprenant ce mot.

Ces liens ne sont pas nécessairement (les plus) pertinents pour la recherche en tant que telle et n'ont en général pour but que de ramener des clients potentiels à la société. "Le lien sponsorisé est au web ce que la publi-information est à la presse écrite, ou l'infomercial à la télévision, à savoir un simple message publicitaire payé par un annonceur pour faire passer une information." (Philippe Crouzillacq, 01net).

Avec le développement des techniques de positionnement payant, c'est la notion de pertinence des outils de recherche qui est menacée. En effet, ces liens peuvent représenter de 20 à plus de 80% de la première page de résultats. Or la distinction entre les liens sponsorisés et les liens classiques n'est pas toujours évidente (cadre légèrement bleuté, indication "lien commercial"). Une enquête récente a d'ailleurs montré que plus de 70% des américains cliquaient sur des liens sponsorisés sans le savoir (étude de Pew Internet, janvier 2005 ) !

Exemple : recherche sur la calvitie

  • Google (10 liens sponsorisés relativement identifiables - 02/2005)
  • Voilà (seulement 2 liens non sponsorisés - dont un provenant du Guide Voilà - sur la première page de résultat, à peine reconnaissables - 02/2005)

< Recherche - Présentation des résultats - top >

Présentation des résultats

La façon de présenter les résultats est, elle aussi, propre à chaque moteur (titre de la page, petite description, adresse, mais aussi date de mise à jour, auteur, sites similaires, pertinence en %, ...).

Enfin, la plupart des moteurs effectuent un clustering (c'est-à-dire qu'ils ne proposent qu'un seul lien pour un site même si plusieurs pages de ce site correspondent à la requête). On peut en général accéder aux autres pages du site à l'aide d'un lien du type "Autres pages de ce site".

Exemple : Northernlight présentation des résultats :

Résultats sur Northernlight

< Recherche - Classement des résultats >

Voir aussi les spécificités de certains moteurs.


  Un exercice est associé à cette page (exercice 6)
 

CreativeCommons

Valid XHTML 1.0

Valid CSS!

Level Triple-A conformance icon, W3C-WAI Web Content Accessibility Guidelines 1.0

Best view with any browser

Outils Cours Exercices Imprimer support