Si vous lisez ceci c'est que vous ne pouvez profiter de l'interface de ce site de manière optimale. Aeris utilise les feuilles de style de manière à être visible par tous les navigateurs qui respectent les standards. Vous pouvez néanmoins avoir accès aux contenus :


Glossaire sur la recherche d'information sur Internet

Définitions tirés du Glossaire collaboratif du recherchiste internet <http://www.bbs-consultant.net/docs/sources/glossaire.pdf>

B-C-D-E-F-J-K-L-M-O-P-R-S-T-U-V-W-X

AGENT

Définition de Jacques Ferber in « Les Systèmes multiagents. Vers une intelligence collective », Inter-Editions, 1995. Entité physique ou virtuelle :

  • capable d'agir dans un environnement,
  • capable de communiquer directement avec d'autres agents,
  • qui est mue par un ensemble de tendances,
  • qui possède des ressources propres,
  • qui est capable de percevoir de manière limitée son environnement, et qui ne dispose que d'une représentation partielle de cet environnement,
  • qui possède des compétences,
  • qui offre des services,
  • qui peut éventuellement se reproduire.
     
AGENT INTELLIGENT

Logiciel visant à faciliter la recherche et la gestion de l'information sur l'Internet. Il possède des attributs propres et agit dans le but de d'accomplir un certain nombre de tâches pour un autre agent logiciel ou un humain. Voici les attributs définis par différents chercheurs comme Oren Etzioni, Daniel Weld, Stan Franklin et Art Graesser :

  1. Autonomie : un agent est capable de prendre des initiatives de manière autonome et d'exercer un contrôle sur ses actions;
  2. Collaboration : un agent est capable d'interagir et de collaborer avec d'autres agents logiciels ou avec des êtres humains dans le but d'accomplir ses actions;
  3. Apprentissage : un agent doit être capable de s'adapter au besoins de son utilisateur en analysant les actions passées;
  4. Réactivité : il répond dans le temps aux changements dans son environnement;
  5. Ciblage : un agent accepte des requêtes humaines précises mais décide de quelle manière les satisfaire, et n'agit pas seulement suite à un changement dans son environnement;
  6. Continuité : un agent travaille de manière continue;
  7. Flexibilité : les actions d'un agent ne sont pas entièrement prédéfinies; l'agent est capable de choisir ce qu'il va faire et dans quel ordre il le fait.
  8. Liberté d'action : contrairement à un logiciel ordinaire, un agent peut décider de lui-même la date de déclenchement d'une action;
  9. Sensibilité : chaque agent possède une sensibilité propre
  10. Mobilité : un agent est capable de se déplacer d'une machine à une autre au travers de différentes plateformes matérielles et architectures logicielles.
     
ALGORITHME DE PERTINENCE

Relevancy algorithm : Méthode utilisée par un moteur de recherche ou un répertoire pour relier les mots-clés d'une requête avec le contenu de chaque page, de telle sorte que les pages Web trouvées correspondent bien au sujet de la requête. Chaque outil de recherche est susceptible d'utiliser un algorithme différent et de le changer ou de l'améliorer. Voir aussi : critères de tri.

ANNUAIRE

Voir Répertoire

ASPIRATEUR DE SITE

Outil permettant de copier un site Web à distance pour le relire ensuite en local, depuis son propre disque dur.

BRUIT

Réponse non pertinente fournie lors d'une recherche d'information.

CADRE

Voir Frame

CONTENU DYNAMIQUE

Il s'agit de pages Web avec des informations qui changent ou sont changées automatiquement en fonction d'une base de données ou d'éléments provenant de l'utilisateur. (ex. suffixe .asp, .cfm, .cgi ou .shtml dans l'URL). Voir aussi Page dynamique

CRITERE DE TRI

Façon automatique de sélectionner les résultats retournés par le moteur de recherche, afin de présenter en début de liste ceux qui correspondent le mieux à la requête. On distingue généralement le tri par pertinence du tri par popularité. Voir aussi : algorithme de pertinence.

CRYPTAGE

Moyen de rendre secrète la communication informatique grâce à des logiciels d'encodage de données. Seul le possesseur de la clé de décodage peut interpréter le message. Aussi appelé "chiffrement".

DENSITE DES MOTS CLES

Une des propriétés qui permet d'indiquer l'importance de certains mots dans le texte d'une page Web. Certains outils de recherche utilisent cette propriété pour le tri. La formule de calcul = nombre d'occurrences du terme demandé / nombre de termes de la page en question, une fois éliminés les mots vides.

DIRECTORY

Voir Répertoire

EN-TETE heading tags

Ce sont les commandes qui se trouvent en tête des pages HTML. Certains moteurs de recherche donnent plus d'importance et de poids au texte qui s'y trouve.

EQUATION DE RECHERCHE

Formulation d'une question sous forme mots clés reliés par des termes logiques (ou opérateurs). Voir aussi opérateurs booléens.

FRAME

Synonymes : trame, cadre . Il s'agit d'une technique de programmation en HTML pour présenter deux ou plusieurs documents séparés dans une fenêtre du navigateur, les documents agissants l'un sur l'autre à travers différentes sous-fenêtres. Les frames posent souvent de gros problèmes d'indexation aux moteurs de recherche.

KEYWORD

Voir Mot-clé

LIEN MORT

Un lien qui ne mène plus à une page ou à un site, soit parce que le serveur est en panne, soit parce que la page a été déplacée ou bien n'existe plus. La plupart des outils de recherche ont des techniques pour ôter de telles pages de leur liste automatiquement. Mais l'Internet continuant à croître quotidiennement, il leur devient de plus en plus difficile de contrôler régulièrement toutes ces pages.

META-MOTEUR ou META-CHERCHEUR

Voir le cours

META TAG

Construction placée dans l'en-tête HTML des pages Web, fournissant des informations qui ne sont pas visibles par les navigateurs. Les plus courants des meta-tags (balises META) sont KEYWORDS et DESCRIPTION.

MOT CLE ou key-word

Mot ou groupe de mot, éventuellement dans une forme lexicographique normalisée, choisi dans le titre ou le texte d'un document, caractérisé par le contenu et permettant la recherche de ce document.

MOTEUR DE RECHERCHE

Voir le cours.

MOTEUR THEMATIQUE

Synonyme : moteur spécialisé : Il procède par catégorisation automatique de pages, généralement à partir de catégories prédéfinies et de mots-clés préétablis.

OPERATEUR BOOLEEN

Pour effectuer une recherche par mots clés, on couple souvent une suite de mots grâce à des opérateurs booléens. Venant du nom de George Boole (mathématicien britannique) ces opérateurs permettent d'élargir ou de restreindre la recherche en imposant certains mots et en en excluant d'autres. Il existe plusieurs opérateurs booléens :

  • le ET [AND] (la recherche se fait obligatoirement sur les deux mots saisis);
  • le OU [OR] (la recherche se fait soit sur l'un des mots saisis, soit sur l'autre, soit sur les deux);
  • le SAUF [WITHOUT] (qui exclut le terme en question de la recherche).
     

Voir le cours

OUTIL DE RECHERCHE

Terme générique pour tout service de recherche d'information sur le Web, combinant bien souvent désormais les procédés d'un répertoire et ceux d'un moteur de recherche, plus parfois de moteurs spécialisés.

PAGE DYNAMIQUE

Page HTMLdont le contenu n'est pas situé dans un fichier enregistré sur le serveur mais générées "à la volée" par une application informatique à partir d'un modèle de document HTMLen accédant à des informations situées dans une (ou des) base(s) de données. Les techniques utilisées sont variables, CGI langage de script, API propriétaires permettant de créer un lien entre la base de données et le serveur HTTP.

PAGE STATIQUE

Page HTMLdont le contenu est situé dans un fichier figé, enregistré sur le serveur Web.

POPULARITE

Synonyme : notoriété. Mesure le nombre et la qualité des liens pointant vers une page particulière. Plusieurs moteurs de recherche utilisent de plus en plus ce procédé dans le processus de tri.

PORTAIL

Terme générique pour désigner un site qui sert de point d'entrée sur l'Internet pour un nombre important d'utilisateurs. Un site portail offre une multitude de contenus, outils et services différents depuis la page d'accueil, Certains sont des répertoires professionnels organisés autour d'une thématique particulière, dotés d'un moteur de recherche interne, et d'autres ne sont que les points d'entrée sur l'internet offerts par les FAI à des abonnés grand public. Certains sont maintenus par des sociétés, d'autres par des particuliers, certains tendent à rendre captif un groupe d'internautes utlisateurs, d'autres ne cherchent qu'à renseigner. On considère également qu'un site doit générer beaucoup de trafic (surtout grand public) pour recevoir la qualification de portail et baser son offre sur les 3 axes suivants : recherche d'information, outil de communication (courriel, messagerie instantanée) et commerce en ligne.

POSITIONNEMENT ou ranking

Processus de classement des sites, des pages Web dans un moteur de recherche ou un répertoire afin que les sites les plus pertinents apparaissent en premier sur la page résultat lors d'une requête.

REGROUPEMENT ou cluster ou méthode de clustering

Affichage d'une seule adresse pour chaque site Web sur la page des résultats d'un outil de recherche. Cette méthode permet d'éviter qu'un petit nombre de sites occupe toutes les premiéres positions de résultats et en facilite la lecture pour l'utilisateur.

REPERTOIRE

Voir le cours.

REPERTOIRE GENERALISTE

Répertoire ayant pour vocation d'ndexer tous les sites et qui n'effectuent une censure que sur la base de principes prédéfinis (par exemple, des sites manifestement illégaux ou dont le référencement cherche à induire l'internaute en erreur). Exemples : Yahoo, Nomade

REPERTOIRE SPECIALISE

Répertoire dont les sites répertoriés relèvent tous d'un domaine ou d'un secteur particulier (le vin, le tourisme, le sport, l'agriculture, etc.). Un répertoire spécialisé peut, par exemple, ne prendre en compte que les entreprises d'un secteur, ou les produits d'un domaine.

REPERTOIRE SELECTIF

Répertoire dont les gestionnaires privilégient les sites de meilleure qualité et excluent les sites qu'ils n'estiment pas suffisamment intéressants. Exemple : bonWeb.com

REPERTOIRE CONTRIBUTIF, répertoire ouvert, (open directory)

Répertoire dont l'enrichissement est effectué par différentes équipes d'internautes. Ces répertoires confient la responsabilité d'une ou plusieurs catégories soit à des internautes experts reconnus dans leur domaine et rémunérés pour leur prestation (exemple : About.com), soit à des internautes bénévoles dont la compétence dans le domaine couvert par cette catégorie a été vérifiée. Ces internautes reçoivent alors les demandes de référencement de leur catégorie, décident ou non de référencer les sites et, le cas échéant, rédigent eux-mêmes la description du site (exemple : DMoz - Open Directory Project). Certains répertoires contributifs sont définis par des experts sélectionnées (exemple : Argus Clearing House).

REPERTOIRES D'OUTILS DE RECHERCHE

Synonymes : listes de listes, répertoires de répertoires - Répertoires spécialisés dans le référencement de répertoires et d'outils de recherche (moteurs de recherche, méta-moteurs, etc.). Exemple : 7alpha, Beaucoup

REQUETE

Synonymes : query, terme recherché. Mot, expression ou groupe de mots employés pour interroger un outil de recherche afin de localiser des pages sur le sujet recherché.

Voir le cours

ROBOT

Programmes de navigation qui suivent les liens hypertextes des pages Web mais qui ne sont par directement sous contrôle humain. Exemples : les spiders ou araignées des moteurs de recherche.

ROBOTS.TXT

Fichier texte déposé dans le répertoire principal d'un site Web pour interdire l'accès aux robots de certaines pages ou sous-répertoires du site.

SILENCE

Désigne l'ensemble des documents pertinents non retrouvés lors d'une recherche.

SITE FEDERATEUR

Voir le cours.

SPAMDEXING

Création ou modification d'un document avec l'intention de tromper un répertoire ou un système de classement automatique. Toute technique visant à augmenter le positionnement (ranking) potentiel d'un site aux dépens de la qualité du corpus de l'outil de recherche. Peut également être considérée comme du spamdexing.

TECHNIQUES DE POSITIONNEMENT

Le fait de modifier sa page Web afin que les moteurs de recherche traitent la page comme la plus appropriée pour une requête spécifique, ou un ensemble de requêtes.

TRI PAR PERTINENCE

Méthode de classement automatique des résultats retournés par le moteur de recherche qui s'appuie sur le calcul d'un score pour chaque réponse. La pertinence est alors basée sur des facteurs comme :

  • le poids d'un mot déterminé par sa place dans le document;
  • la densité : fréquence d'occurrence dans un document par rapport à la taille du document;
  • le poids d'un mot dans la base et sa fréquence d'occurrence dans toute la base;
  • la correspondance d'expression : similarité entre l'expression de la requête et l'expression correspondante dans un document;
  • relation de proximité : proximité des termes de la requête entre eux et dans le document. Cette technique est apparue avec la première génération de moteurs de recherche (à partir de 1994) et présente l'inconvénient d'être facile à détourner par les individus peu scrupuleux (Cf. Spamdexing). Elle est utilisée par des moteurs comme AltaVista, Excite, Inktomi, Voila...
     
TRI PAR POPULARITE

Méthode de classement automatique des résultats retournés par le moteur de recherche qui s'appuie soit sur le principe de citation (popularité) soit sur la mesure de l'audience.
Dans le premier cas, l'importance d'une page est évaluée en fonction des liens hypertexte qui pointent vers elle et en fonction de la nature du document qui la cite. Le tri est alors indépendant du contenu, mais les documents récents ou peu cités par les autres sont défavorisés. Google avec son système de PageRank en est l'exemple le plus connu.
Dans le second cas, l'importance d'une page est fonction du nombre de visites reçues lors d'une requête sur un moteur de recherche. C'est l'analyse du comportement de l'internaute qui détermine la popularité d'une page par rapport à un mot-clé. Solution DirectHit utilisée par HotBot et LookSmart par exemple.

URL
Uniform Resource Locator : adresse d'un site Web.
 
VEILLE (les 4 types de veille)
  1. Concurrentielle : comme le nom l'indique, le veilleur s'intéressera ici aux concurrents actuels ou potentiels de l'entreprise.
  2. Environnementale : cette veille se focalise sur la réglementation, la normalisation et tous les facteurs susceptibles d'influencer directement ou indirectement l'activité de l'entreprise.
  3. Commerciale : le veilleur s'intéresse ici aux clients, fournisseurs et marchés de l'entreprise et marché du travail.
  4. Technologique : tout ce qui est du domaine de la recherche est ici surveillé : brevets, produits, services, procédés de fabrication, matériaux, systèmes d'information...etc.
     
 
Web INVISIBLE
Voir le cours.
 

CreativeCommons

Valid XHTML 1.0

Valid CSS!

Level Triple-A conformance icon, W3C-WAI Web Content Accessibility Guidelines 1.0

Best view with any browser

Outils Cours Exercices Imprimer support