Si vous lisez ceci c'est que vous ne pouvez profiter de l'interface de ce site de manière optimale. Aeris utilise les feuilles de style de manière à être visible par tous les navigateurs qui respectent les standards. Vous pouvez néanmoins avoir accès aux contenus :


3. Requête complexe et opérateurs booléens

Une fois les mots clés, leur importance relative et leurs synonymes définis, il convient de formuler sa requête à l'aide d'un langage d'interrogation.

Attention, vu la spécificité des outils, des mots clés génériques peuvent être utilisés sur un répertoire mais sur un moteur les résultats donneront beaucoup trop de bruit. Inversement, des termes trop précis dans un annuaire risquent de ne pas donner de réponse ! D'autre part, les différents outils de recherche n'utilisent pas toutes ces possibilités et chacun possède un langage d'interrogation spécifique. Cette remarque peut donc aussi déterminer le choix de l'outil approprié. Les sites suivants peuvent vous y aider :

Plan de la page :

Généralités

Importance de l'ordre des mots

Pour la plupart des outils, global change donnera les mêmes résultats que change global. Mais ce n'est pas le cas pour tous. En effet, certains outils accordent un poids au mot en fonction de sa position : le premier mot sera plus important que le deuxième. Le nombre de résultats sera le même mais ils seront triés différemment. Si l'on utilise un outil qui ne tient pas compte de l'ordre des mots, l'utilisation des guillemets permet de l'y obliger : "global change"

Mots fréquents

Beaucoup de moteurs excluent les mots fréquents (a, and, any, as, be, but, is...) ce qui peut être problématique pour certaines recherches.

  • Utiliser un moteur qui n'exclut pas ces termes
  • mettre le terme dans une phrase entourée de guillemets mais certains moteurs ne tiennent pas compte des mots fréquents même dans une expression.
  • Certains moteurs permettent de rendre obligatoire l'apparition d'un mot à l'aide du signe +

Attention aussi en utilisant un moteur non francophone, les mots tels que "le, la, les, ..." seront pris comme un mot clé (résultat : beaucoup de bruit. )!

Comportement de certains moteurs vis à vis des mots fréquents (stop words)
<http://www.searchengineshowdown.com/features/byfeature.shtml#stop>

Q. Recherche sur la vitamine A
Avec Google (02/2005) :
vitamin a --> 16 600 000 résultats
vitamin +a --> 8 820 000 résultats
"vitamin a" --> 3 410 000 résultats

La casse (majuscule/minuscule)

La plupart des moteurs sont insensibles à la casse (il y'a quelques temps la plupart des moteurs la respectait !).

Il semble que désormais, seul AltaVista soit entièrement sensible à la casse à condition de mettre le mot recherche entre " ou en utilisant le formulaire de recherche avancé ou l'assistant de recherche. (Source : Web Search Tip of the Day A Case (of) Sensitive Search <http://searchenginewatch.com/webmasters/article.php/2167851>).

Comportement de certains moteurs vis à vis de la casse
<http://www.searchengineshowdown.com/features/byfeature.shtml#case>

Accents

La plupart des moteurs tiennent compte des accents, particulièrement les outils francophones, mais pas tous.

  • Pour certains, électrophorèse cherchera électrophorèse et electrophorese
  • Pour d'autres électrophorèse cherchera électrophorèse uniquement
  • Pour certains, electrophorese cherchera electrophorese et électrophorèse
  • Pour d'autres electrophorese cherchera electrophorese uniquement
Q. Recherche de site sur Star Wars épisode 1
avec google (02/2005):
star wars épisode 1--> 1 370 000 résultats
Star Wars Episode 1 --> 693 000 résultats
Stars Wars Épisode 1--> 1 370 000 résultats
Conclusion : Google n'est pas sensible à la casse mais tient compte des accents

Pluriel

Certains moteurs cherchent automatiquement le pluriel d'un mot au singulier (en fait ils effectuent une troncature par défaut c'est-à-dire que chat cherchera chat, chats, chatte, chattes, chaton, chatière, chatouille, chateaubriand...). Pour ceux qui ne le font pas, l'utilisation de la troncature permet de chercher le pluriel et le singulier.

< booléens - proximité - phrase - générique - champs - limites - imbriquée - naturel - Outils - top>

Les opérateurs booléens

Syntaxe de certains moteurs vis à vis des opérateurs booléens
<http://www.searchengineshowdown.com/features/byfeature.shtml#boolean>

Opérateurs par défaut

Les internautes ont pris l'habitude de taper un ou deux mots-clés séparés par un espace. L'espace est compris de deux manières différentes par les outils de recherche : un ET ou un OU, le OU par défaut étant le plus fréquent. Attention donc, lorsque l'on cherche global change, beaucoup d'outil chercheront en fait les pages contenant global, change ou les 2 c'est-à-dire beaucoup de bruit. .

Opérateur par défaut de certains moteurs
<http://www.searchengineshowdown.com/features/byfeature.shtml#defaults>

AND (ET)

Associer deux mots (ou plus) à une recherche est une excellente méthode, qui donne en général d'assez bons résultats en réduisant considérablement le nombre de pages trouvées. Pour effectuer une recherche AND, chaque outil a sa méthode. Voici les plus courantes :

Q. Informations sur la migration des cigognes
migration AND cigogne
+cigogne +migration
cigogne WITH migration
cigogne migration
(recherche AND par défaut)
cigogne migration
avec un bouton vous permettant de choisir all the words

 

OR (OU)

Associer deux mots différents avec l'opérateur OR n'est pas vraiment à conseiller dans la mesure où le nombre de résultats trouvés est en général impressionnant. Cela peut cependant être utile dans le cas où votre recherche peut s'exprimer de différentes manières (synonymes et concept liés). De même, les méthodes diffèrent en fonction de l'outil:

OR
Q. Informations sur le SIDA (en anglais)
AIDS OR HIV
AIDS HIV (OR par défaut)
AIDS HIV avec un menu déroulant (any of the words)

 

NOT (SAUF)

Ce peut être une excellente solution aux mots désignant plusieurs concepts ou lorsque l'on sait que tel type d'information ne nous sera d'aucune utilité. Cette méthode permet de réduire le bruit. .

NOT
Q.Information sur la chimie mais pas la chimie organique (en anglais)
chemistry not organic
chemistry -organic
chemistry AND NOT organic
chemistry BUT NOT organic
chemistry avec un champs permettant d'exclure le mot organic

< généralités - proximité - phrase - générique - champs - limites - imbriquée - naturel - Outils - top>

L'opérateur de proximité

2004 : ATTENTION ! depuis la fusion d'AltaVista, AlltheWeb et Inktomi en "Yahoo! Search" des fonctionalités de recherche qui n'existaient plus que sur ces moteurs ont disparu. C'est le cas de la recherche de proximité.

Cet opérateur n'existe que sur certains moteurs et n'est souvent accessible qu'à partir du formulaire de recherche avancée. Il permet de rechercher deux mots qui doivent obligatoirement se situer l'un près de l'autre.

  • linux NEAR security
  • linux NEAR/12 security (pour les moteurs qui permettent de choisir l'éloignement entre les deux mots)
  • ...

Comportement de certains moteurs vis à vis de l'opérateur de proximité <http://www.searchengineshowdown.com/features/byfeature.shtml#proximity>

< généralités - booléens -phrase - générique - champs - limites - imbriquée - naturel - Outils - top>

Recherche d'une expression ou d'une phrase

Pour rechercher une expression, il suffit de la mettre entre guillemets.

Q.Informations sur le Mont Saint Michel
S."Mont Saint Michel"

< généralités - booléens - proximité - générique - champs - limites - imbriquée - naturel - Outils - top>

Le caractère générique (wildcard)

2004 : ATTENTION ! depuis la fusion d'AltaVista, AlltheWeb et Inktomi en "Yahoo! Search" des fonctionalités de recherche qui n'existaient plus que sur ces moteurs ont disparu. C'est le cas de la troncature.

Le caractère générique permet de remplacer n'importe quelle lettre ou chaîne de caractères. En plaçant une * (? ou%) à la suite d'un mot ou du début d'un mot, vous recherchez toutes les orthographes possibles de ce mot.

Exemples
bio* recherchera biologie, biology, biologiste(s), biotechnologie(s),...
p?r?mètre recherchera des mots comme périmètre ou paramètre

Comportement de certains moteurs vis à vis de la troncature
<http://www.searchengineshowdown.com/features/byfeature.shtml#truncation>

< généralités - booléens - proximité - phrase - champs - limites - imbriquée - naturel - Outils - top>

La recherche par champs

C'est une fonction mal connue et néanmoins très utile des moteurs de recherche. Elle permet de restreindre la recherche à certaines parties des pages Web, ce qui peut être très utile lorsque l'on obtient des résultats trop abondants.

2004 : ATTENTION ! depuis la fusion d'AltaVista, AlltheWeb et Inktomi en "Yahoo! Search" des fonctionalités de recherche qui n'existaient plus que sur ces moteurs ont disparu. C'est le cas de la recherche par taille de fichier et par IP ainsi que de la recherche dans les contenus textuels des fichiers flash.

Là encore, chaque moteur utilise sa propre syntaxe. Voici quelques exemples de ces champs :

La recherche par champs de certains moteurs
<http://www.searchengineshowdown.com/features/byfeature.shtml#fields>

Le titre

Recherche les mots clés uniquement dans le titre des pages Web.

Exemple : title:leucose - t:leucose

L'URL

La recherche se fait dans l'adresse Web. On peut donc chercher un mot dans une url ou un domaine.

Exemple :
url:darwin - u:darwin - - host:darwin - domain:com - site:com

Pour restreindre la recherche à un pays, on utilise les codes nationaux (site:.be)

Un lien

Ce champ permet de chercher les pages possédant un lien vers un site donné. Cette recherche peut être intéressante car un site pertinent pour une recherche sera sûrement référencé par d'autres sites pertinents du même thème.

Exemple : link:www.fundp.ac.be

< généralités - booléens - proximité - phrase - générique - limites - imbriquée - naturel - Outils - top>

Les limites

En règle générale, mais souvent dans les formulaires de recherche avancée, il est possible de limiter la recherche à certains critères comme la date, la langue, la région, le format de fichier,...

Les limites de recherche de certains moteurs
<http://www.searchengineshowdown.com/features/byfeature.shtml#limits>

La date

Les dates prises en compte sont soit celles de dernière mise à jour, soit celle de l'inscription (ou de l'indexation) du site. Elles sont souvent réduites à une période (les 3 derniers mois, les 6 derniers mois, l'année écoulée).

Le format

Cette fonctionalité très intéressante a été inaugurée par Google mais est disponible maintenant sur quelques moteurs. Elle permet de ne chercher que des fichiers pdf (Adobe) ou doc (MSWord) par exemple, ce qui est particulièrement intéressant quand on sait que de nombreux dossiers de fond, rapports, articles ... sont sous ces formats.

Exemple : filetype:pdf ou type:pdf

< généralités - booléens - proximité - phrase - générique - champs - imbriquée - naturel - Outils - top>

La recherche imbriquée

La recherche imbriquée permet d'utiliser plusieurs opérateurs à l'aide de parenthèses.

Q. pages ne parlant que du paludisme induit par les espèces du genre Plasmodium sauf P. falciparum
S.(malaria OR paludisme) AND (plasmodium NOT falciparum)

Cependant, ces recherches demandent de l'habitude et ne donnent pas toujours de meilleurs résultats que 2 bons mots clés associés à l'aide de l'un des opérateurs ci-dessus. En tout état de cause, il vaut mieux ne pas rendre la question trop complexe.

Q.sites parlant de l'écotoxicologie des loutres de rivière
S. ((lutra OR otter*) NOT "sea otter") AND (PCB* OR (mercure OR Hg))

< généralités - booléens - proximité - phrase - générique - champs - limites - naturel - Outils - top>

Langage naturel

La recherche en langage naturel consiste à poser une question sous forme de phrase au moteur comme "où trouver un plan de Bruxelles ?". Il interroge alors une base de données composée de questions déjà posées par les internautes et dont il possède la réponse. L'outil tente de rapprocher la question de l'une de celle de sa base de données. Les résultats sont composés d'une liste de ces questions.

Exemple :

Qu'est-ce que l'anthrax ? Sur infoclic (n'existe plus) : Infoclic

Qu'est-ce que le Patriot Act ? Sur Brainboost

 

Ce principe est intéressant mais est décevant pour des questions pointues.

< généralités - booléens- proximité - phrase - générique - champs - limites - imbriquée - Outils - top>

Outils

  • Le Search Wizard <http://21cif.imsa.edu/locate> peut vous apprendre à formuler une requête (pour Google dans ce cas).
  • De même le Finder d'Aeris vous aidera à formuler des requêtes complexes pour plusieurs outils de recherche.

  Des exercices sont associés à cette page (exercice 7, 8, 10 et 11)
 

CreativeCommons

Valid XHTML 1.0

Valid CSS!

Level Triple-A conformance icon, W3C-WAI Web Content Accessibility Guidelines 1.0

Best view with any browser

Outils Cours Exercices Imprimer support