Si vous lisez ceci c'est que vous ne pouvez profiter de l'interface de ce site de manière optimale. Aeris utilise les feuilles de style de manière à être visible par tous les navigateurs qui respectent les standards. Vous pouvez néanmoins avoir accès aux contenus :
Définitions tirés du Glossaire collaboratif du recherchiste internet <http://www.bbs-consultant.net/docs/sources/glossaire.pdf>
B-C-D-E-F-J-K-L-M-O-P-R-S-T-U-V-W-X
Définition de Jacques Ferber in « Les Systèmes multiagents. Vers une intelligence collective », Inter-Editions, 1995. Entité physique ou virtuelle :
Logiciel visant à faciliter la recherche et la gestion de l'information sur l'Internet. Il possède des attributs propres et agit dans le but de d'accomplir un certain nombre de tâches pour un autre agent logiciel ou un humain. Voici les attributs définis par différents chercheurs comme Oren Etzioni, Daniel Weld, Stan Franklin et Art Graesser :
Relevancy algorithm : Méthode utilisée par un moteur de recherche ou un répertoire pour relier les mots-clés d'une requête avec le contenu de chaque page, de telle sorte que les pages Web trouvées correspondent bien au sujet de la requête. Chaque outil de recherche est susceptible d'utiliser un algorithme différent et de le changer ou de l'améliorer. Voir aussi : critères de tri.
Voir Répertoire
Outil permettant de copier un site Web à distance pour le relire ensuite en local, depuis son propre disque dur.
Réponse non pertinente fournie lors d'une recherche d'information.
Voir Frame
Il s'agit de pages Web avec des informations qui changent ou sont changées automatiquement en fonction d'une base de données ou d'éléments provenant de l'utilisateur. (ex. suffixe .asp, .cfm, .cgi ou .shtml dans l'URL). Voir aussi Page dynamique
Façon automatique de sélectionner les résultats retournés par le moteur de recherche, afin de présenter en début de liste ceux qui correspondent le mieux à la requête. On distingue généralement le tri par pertinence du tri par popularité. Voir aussi : algorithme de pertinence.
Moyen de rendre secrète la communication informatique grâce à des logiciels d'encodage de données. Seul le possesseur de la clé de décodage peut interpréter le message. Aussi appelé "chiffrement".
Une des propriétés qui permet d'indiquer l'importance de certains mots dans le texte d'une page Web. Certains outils de recherche utilisent cette propriété pour le tri. La formule de calcul = nombre d'occurrences du terme demandé / nombre de termes de la page en question, une fois éliminés les mots vides.
Voir Répertoire
Ce sont les commandes qui se trouvent en tête des pages HTML. Certains moteurs de recherche donnent plus d'importance et de poids au texte qui s'y trouve.
Formulation d'une question sous forme mots clés reliés par des termes logiques (ou opérateurs). Voir aussi opérateurs booléens.
Synonymes : trame, cadre . Il s'agit d'une technique de programmation en HTML pour présenter deux ou plusieurs documents séparés dans une fenêtre du navigateur, les documents agissants l'un sur l'autre à travers différentes sous-fenêtres. Les frames posent souvent de gros problèmes d'indexation aux moteurs de recherche.
Voir Mot-clé
Un lien qui ne mène plus à une page ou à un site, soit parce que le serveur est en panne, soit parce que la page a été déplacée ou bien n'existe plus. La plupart des outils de recherche ont des techniques pour ôter de telles pages de leur liste automatiquement. Mais l'Internet continuant à croître quotidiennement, il leur devient de plus en plus difficile de contrôler régulièrement toutes ces pages.
Voir le cours
Construction placée dans l'en-tête HTML des pages Web, fournissant des informations qui ne sont pas visibles par les navigateurs. Les plus courants des meta-tags (balises META) sont KEYWORDS et DESCRIPTION.
Mot ou groupe de mot, éventuellement dans une forme lexicographique normalisée, choisi dans le titre ou le texte d'un document, caractérisé par le contenu et permettant la recherche de ce document.
Voir le cours.
Synonyme : moteur spécialisé : Il procède par catégorisation automatique de pages, généralement à partir de catégories prédéfinies et de mots-clés préétablis.
Pour effectuer une recherche par mots clés, on couple souvent une suite de mots grâce à des opérateurs booléens. Venant du nom de George Boole (mathématicien britannique) ces opérateurs permettent d'élargir ou de restreindre la recherche en imposant certains mots et en en excluant d'autres. Il existe plusieurs opérateurs booléens :
Voir le cours
Terme générique pour tout service de recherche d'information sur le Web, combinant bien souvent désormais les procédés d'un répertoire et ceux d'un moteur de recherche, plus parfois de moteurs spécialisés.
Page HTMLdont le contenu n'est pas situé dans un fichier enregistré sur le serveur mais générées "à la volée" par une application informatique à partir d'un modèle de document HTMLen accédant à des informations situées dans une (ou des) base(s) de données. Les techniques utilisées sont variables, CGI langage de script, API propriétaires permettant de créer un lien entre la base de données et le serveur HTTP.
Page HTMLdont le contenu est situé dans un fichier figé, enregistré sur le serveur Web.
Synonyme : notoriété. Mesure le nombre et la qualité des liens pointant vers une page particulière. Plusieurs moteurs de recherche utilisent de plus en plus ce procédé dans le processus de tri.
Terme générique pour désigner un site qui sert de point d'entrée sur l'Internet pour un nombre important d'utilisateurs. Un site portail offre une multitude de contenus, outils et services différents depuis la page d'accueil, Certains sont des répertoires professionnels organisés autour d'une thématique particulière, dotés d'un moteur de recherche interne, et d'autres ne sont que les points d'entrée sur l'internet offerts par les FAI à des abonnés grand public. Certains sont maintenus par des sociétés, d'autres par des particuliers, certains tendent à rendre captif un groupe d'internautes utlisateurs, d'autres ne cherchent qu'à renseigner. On considère également qu'un site doit générer beaucoup de trafic (surtout grand public) pour recevoir la qualification de portail et baser son offre sur les 3 axes suivants : recherche d'information, outil de communication (courriel, messagerie instantanée) et commerce en ligne.
Processus de classement des sites, des pages Web dans un moteur de recherche ou un répertoire afin que les sites les plus pertinents apparaissent en premier sur la page résultat lors d'une requête.
Affichage d'une seule adresse pour chaque site Web sur la page des résultats d'un outil de recherche. Cette méthode permet d'éviter qu'un petit nombre de sites occupe toutes les premiéres positions de résultats et en facilite la lecture pour l'utilisateur.
Voir le cours.
Répertoire ayant pour vocation d'ndexer tous les sites et qui n'effectuent une censure que sur la base de principes prédéfinis (par exemple, des sites manifestement illégaux ou dont le référencement cherche à induire l'internaute en erreur). Exemples : Yahoo, Nomade
Répertoire dont les sites répertoriés relèvent tous d'un domaine ou d'un secteur particulier (le vin, le tourisme, le sport, l'agriculture, etc.). Un répertoire spécialisé peut, par exemple, ne prendre en compte que les entreprises d'un secteur, ou les produits d'un domaine.
Répertoire dont les gestionnaires privilégient les sites de meilleure qualité et excluent les sites qu'ils n'estiment pas suffisamment intéressants. Exemple : bonWeb.com
Répertoire dont l'enrichissement est effectué par différentes équipes d'internautes. Ces répertoires confient la responsabilité d'une ou plusieurs catégories soit à des internautes experts reconnus dans leur domaine et rémunérés pour leur prestation (exemple : About.com), soit à des internautes bénévoles dont la compétence dans le domaine couvert par cette catégorie a été vérifiée. Ces internautes reçoivent alors les demandes de référencement de leur catégorie, décident ou non de référencer les sites et, le cas échéant, rédigent eux-mêmes la description du site (exemple : DMoz - Open Directory Project). Certains répertoires contributifs sont définis par des experts sélectionnées (exemple : Argus Clearing House).
Synonymes : listes de listes, répertoires de répertoires - Répertoires spécialisés dans le référencement de répertoires et d'outils de recherche (moteurs de recherche, méta-moteurs, etc.). Exemple : 7alpha, Beaucoup
Synonymes : query, terme recherché. Mot, expression ou groupe de mots employés pour interroger un outil de recherche afin de localiser des pages sur le sujet recherché.
Voir le cours
Programmes de navigation qui suivent les liens hypertextes des pages Web mais qui ne sont par directement sous contrôle humain. Exemples : les spiders ou araignées des moteurs de recherche.
Fichier texte déposé dans le répertoire principal d'un site Web pour interdire l'accès aux robots de certaines pages ou sous-répertoires du site.
Désigne l'ensemble des documents pertinents non retrouvés lors d'une recherche.
Voir le cours.
Création ou modification d'un document avec l'intention de tromper un répertoire ou un système de classement automatique. Toute technique visant à augmenter le positionnement (ranking) potentiel d'un site aux dépens de la qualité du corpus de l'outil de recherche. Peut également être considérée comme du spamdexing.
Le fait de modifier sa page Web afin que les moteurs de recherche traitent la page comme la plus appropriée pour une requête spécifique, ou un ensemble de requêtes.
Méthode de classement automatique des résultats retournés par le moteur de recherche qui s'appuie sur le calcul d'un score pour chaque réponse. La pertinence est alors basée sur des facteurs comme :
Méthode de classement automatique des résultats
retournés par le moteur de recherche qui s'appuie soit sur
le principe de citation (popularité) soit sur la mesure de
l'audience.
Dans le premier cas, l'importance d'une page est évaluée
en fonction des liens hypertexte qui pointent vers elle et en fonction
de la nature du document qui la cite. Le tri est alors indépendant
du contenu, mais les documents récents ou peu cités
par les autres sont défavorisés. Google avec son système
de PageRank en est l'exemple le plus connu.
Dans le second cas, l'importance d'une page est fonction du nombre
de visites reçues lors d'une requête sur un moteur
de recherche. C'est l'analyse du comportement de l'internaute qui
détermine la popularité d'une page par rapport à
un mot-clé. Solution DirectHit utilisée par HotBot
et LookSmart par exemple.
© Guillemette
Lauters 1999-2006
Les contenus rédactionnels de ce site sont publiés sous licence
"Creative
Commons"