Si vous lisez ceci c'est que vous ne pouvez profiter de l'interface de ce site de manière optimale. Aeris utilise les feuilles de style de manière à être visible par tous les navigateurs qui respectent les standards. Vous pouvez néanmoins avoir accès aux contenus :


7. Spécificités de certains moteurs

Les spécialistes de la recherche d'information sur le Web utilisent régulièrement certains moteurs. Quelles sont les spécificités de ces moteurs qui en font les outils préférés des professionnels ? Quels sont les nouveaux moteurs à surveiller, les nouvelles tendances des outils de recherche ?

< Fonctionalités intéressantes -  Google - Yahoo!Search - Des moteurs à surveiller >

Fonctionalités intéressantes

Page archivée en mémoire, version cache

Cette fonctionalité a été lancée pour la première fois par Google. La version cache d'une page est la page telle qu'elle était lors du dernier passage du moteur, archivée par ce dernier. Très pratique pour retrouver des pages disparues mais aussi pour des pages qui changent très souvent et dont le contenu est archivé ailleurs au fur et à mesure (cas des blogs par exemple), utile aussi dans le cas de pages accessibles sur abonnement mais publiées d'abord gratuitement.

Cette version cache permet aussi de mettre en évidence les mots recherchés dans la page en les surlignant, ce qui s'avère particulièrement utile avec de longs documents.

Google cope cachée

Moteurs concernés : Google, Yahoo! Search, Gigablast

Format de fichiers

Cette fonctionalité très intéressante a été inaugurée par Google mais est disponible maintenant sur quelques moteurs. Elle permet de ne chercher que des fichiers pdf (Adobe) ou doc (MSWord) par exemple, ce qui est particulièrement intéressant quand on sait que de nombreux dossiers de fond, rapports, articles ... sont sous ces formats.

Moteurs concernés : Google, Yahoo! Search, Gigablast

Regroupement thématiques à la volée (clustered résults, custom search folders)

Lancée pour la première fois par le regretté Northern Light, cette fonctionalité permet d'affiner sa recherche. En effet, une fois la recherche lancée, les résultats similaires (d'après le moteur) sont regroupés automatiquement dans des dossiers thématiques. Par exemple, une recherche sur "bioindicateurs" dans Vivismo proposera les dossiers suivants :

Moteurs concernés : Wisenut, Teoma, Ez2find (métamoteur), Vivismo (métamoteur), KillerInfo (métamoteur)

Représentation graphique / Cartographie /sémantique

WebBrain http://www.Webbrain.com/

Webbrain

Contrainte : ne fonctionne pas sur mac.

Cet outil s'appuie sur les ressources de Dmoz (l'Open directory project) et les lies à l'aide de liens sémantiques.

Webbrain

KartOO http://www.kartoo.com

KartOO

KartOO est un métamoteur graphique.

"Les internautes novices peuvent trouver l'information recherchée grâce à KartOO car nous leurs permettons d'avoir une vision globale des thématiques connexes à la requête tapée, de préciser leur pensée en rajoutant ou en enlevant ces thématiques générées dynamiquement à la requête originelle d'un simple clic sur des boutons + et - associés, de visualiser les sites Web les plus pertinents et les liens sémantiques reliant les sites les uns aux autres par l'intermédiaire d'une interface cartographique visuelle et intuitive. [...] KartOO interroge à l'heure actuelle quatorze moteurs, dont MSN, Voila, AllTheWeb. La liste est accessible sur KartOO dans l'option de recherche avancée et va s'allonger. Chaque fois qu'un site est affiché, la source est précisée. "

Laurent BALEYDIER de KARTOO
<http://www.enfin.com/entretiens/l-baleydier.php>

KartOO

Mais également

Spécificités de Google <www.google.com>

Google

"Recherche rapide et facile. [...] google a fait un compromis entre son extrême simplicité d'utilisation et la complexité de son système de classement de résultats"

Recherche simple et avancée

A lire :

  • Abondance <http://outils.abondance.com/google.html>

Algorithme de pertinence : Rank page

L'algorithme de pertinence de Google se base essentiellement sur l'indice de popularité. Ce système est utilisé à la fois pour les résultats du moteur et pour le classement des sites dans son répertoire (qui est en fait celui de l'Open Directory).

"Le principe de PageRank est simple : tout lien pointant de la page A à la page B est considéré comme un vote de la page A en faveur de la page B. Toutefois, Google ne limite pas son évaluation au nombre de « votes » (liens) reçus par la page ; il procède également à une analyse de la page qui contient le lien. Les liens présents dans des pages jugées importantes par Google ont plus de « poids », et contribuent ainsi à « élire » d'autres pages. "
[Source Google <http://www.google.com/intl/fr/why_use.html>]

Avantage
Les pages trouvées sont en quelque sorte évaluées par des pairs (peer review) puisqu'un site référencé par de nombreux sites du même domaine sera bien classé. A l'usage on constate qu'effectivement les résultats de Google sont très pertinents.
Inconvénients :
Les pages récentes et méconnues sont négligées, de même que les pages traitant d'un sujet peu populaire

J'ai de la chance

Le bouton "j'ai de la chance" du formulaire de recherche de Google permet d'afficher directement la page que Google considère comme la plus pertinente pour une recherche donnée.

A lire :

  • Web Rank Info <http://www.Webrankinfo.com/analyses/articles/chance.php>

Formats de fichiers

Google était jusqu'il y a peu le seul moteur à indexer d'autres formats en dehors des pages Web :

  • Adobe Portable Document Format pdf
  • Adobe Postscript eps, ps
  • CorelWorldPerfect wp
  • DBase dbf
  • Lotus 123 wk, wk1, wk2, wk3, wk4, wk5, wki, wku
  • Lotus Amipro sam
  • Lotus WordPro lwp
  • Mac Write mw
  • Microsoft Excel xls
  • Microsoft Word doc
  • Microsoft PowerPoint ppt
  • Microsoft Access mdb
  • Rich Text Format (RTF) rtf
  • WordPad wri
  • Works Spreadsheet wps
  • Works Database wdb
  • WorksText wks
  • WordStar ws

Il suffit de taper filetype:ppt pour trouver des documents powerpoint ou utiliser le fomulaire de recherche avancée <http://www.google.com/advanced_search?hl=fr>.

Pages archivées en mémoires

Dans ces résultats, Google propose un lien vers la version de la page telle qu'elle était lors de son indexation ce qui est extrêmement utile pour les pages disparues (erreurs 404).

Google cope cachée

A lire :

  • Google <http://www.google.com/intl/fr/features.html#cached>
  • Abondance <http://www.abondance.com/trucs-et-astuces/recherche22.html>
  • Web Rank Info <http://www.Webrankinfo.com/google/cache.php>

Recherche incluant les synonymes

Depuis août 2003, Google propose une recherche incluant les synonymes par l'intermédiaire du tilde (~). Par exemple, une recherche sur biology ~course cherchera des pages comprenant le mot biology associé à des termes comme course(s), classe(s), tutorial, lecture(s), training, ... La recherche incluant les synonymes n'est pas encore très efficace en français.

Pour savoir quels synonymes sont utilisés il suffit de faire une recherche incluant les synonymes en excluant le mot dont on recherche les synonymes, puis de regarder les pages de résultats :

Exemple :

  • ~help -help : guide, manual, faq, support, tutorial, helping, helper, tips, problems, troubleshooting
  • ~search -search : finder, listings, searcher, database

Sites exclusivement consacrés à Google

< Yahoo!Search - Des moteurs à surveiller - Représentation graphique et liens sémantiques >

Spécificité de Yahoo! Search <search.yahoo.com>

Ayant racheté AltaVista, AllTheWeb et Inktomi, Yahoo! a combiné les technologies de ces différents moteurs pour créer Yahoo! Search lancé en février 2004.

"Il nous semble évident que Yahoo! a "réussi son coup" en proposant dès le départ, un outil très proche de Google, certes, mais surtout légèrement plus pertinent, ce qui n'était déjà pas une mince affaire. YST a certainement profité de la baisse de qualité des résultats de Google, constatée par beaucoup depuis quelques mois, pour dépasser, de peu certes, le leader actuel en termes de pertinence. Lorsque quelques bugs de jeunesse auront été corrigés, Yahoo! pourrait avoir à sa disposition une première pierre qui lui permettra de bâtir un véritable mur technologique dans les mois qui viennent. [Source : Abondance]"

Recherche simple et avancée

A lire :

  • Abondance <http://outils.abondance.com/yahoo-moteur.html>

< Google - Des moteurs à surveiller - Représentation graphique et liens sémantiques >

Des moteurs à surveiller

Teoma http://teoma.com/

"Teoma [...] prend, comme Google, l'indice de popularité [...] comme critère prédominant, mais de façon légèrement différente. Il utilise tout d'abord cet indice de popularité, donc la façon dont les pages sont liées entre elles, pour identifier des "communautés" sur le Web. Puis, à l'intérieur de ces communautés, il tente d'établir les pages qui sont les plus pertinentes par rapport à la requête demandée. Il s'agit donc du concept de Google, mais adapté à des "univers" précis et spécialisés sur certains domaines uniquement. Teoma, comme Northern Light, propose de reclasser les liens proposés dans des dossiers thématiques[...]. Enfin, il propose des catégories d'annuaires ou des pages riches en liens (nommés "Expert Links" à droite) sur le thème demandé. L'index de Teoma ne comprend cependant que 100 millions de pages, ce qui est un peu faible aujourd'hui pour espérer jouer les "gros bras" dans ce domaine... Mais il [...] devrait "grossir" dans les mois qui viennent. "
[Source : Abondance <http://www.abondance.com/trucs-et-astuces/outils25.html>]

WiseNut http://wisenut.com/

"Ce nouveau moteur [...] utilise plusieurs techniques pour juger de la pertinence d'un document : l'analyse du texte de la page, du texte des liens qui pointent vers cette page ainsi que des termes qui entourent ces liens, mais également du contenu des pages pointant vers le document analysé. [...] Pas si éloigné que cela de l'algorithme de Google, cependant... [...]. Enfin, dans ses pages de résultats, il tente une catégorisation des liens proposés assez proches des "Custom Search Folders" de l'excellent Northern Light [...]."
[Source : Abondance <http://www.abondance.com/trucs-et-astuces/outils25.html>]

Lancé officiellement en septembre 2001, il semble jouer dans la cours des grands et annonce 1,495,332,308 de pages indexées sur sa page d'accueil (11/2001) ce qui le place d'emblé parmi le 3 plus gros moteurs.

Gigablast http://www.gigablast.com/

"Lancé en mars 2002, ce "petit" moteur propose des fonctionalités intéressantes. A l'instar de Google, Gigablast prope une fonction cache (mémorisation de la page sur les serveurs des moteurs). Dans les résultats, chaque page est également assortie de sa date d'indexation par le moteur et de sa date de dernière modification par le webmaster. Depuis l'été 2003, Gigablast indexe plusieurs formats de documents : PDF (Adobe), PostScript (.ps), PowerPoint (.ppt), Excel (.xls), Word (.doc) et également les documents ASCII (.text). Pour l'instant, la faiblesse de Gigablast est la petite taille de son index qui augmente toutefois régulièrement : 200 millions de pages en août 2003, 250 en janvier 2004. A suivre..."
[Source : Intelligence center <http://c.asselin.free.fr/french/moteurs2.htm> ]

 

CreativeCommons

Valid XHTML 1.0

Valid CSS!

Level Triple-A conformance icon, W3C-WAI Web Content Accessibility Guidelines 1.0

Best view with any browser

Outils Cours Exercices Imprimer support