Ce document est publié sous licence "CreativeCommons",
© Guillemette Lauters 1999-2006
Imprimé le 13/3/2010
Le but de ce cours est de permettre à l'étudiant de devenir rapidement autonome dans le domaine de la recherche d'information sur Internet et ce sur le long terme. [partie encore en cours de rédaction]
Sur Internet on trouve toutes sortes d'informations, cela va des articles
scientifiques en ligne jusqu'à la commande de billet d'avion
en passant par la discussion en direct, ...
>> 1. Que trouve-t-on
sur Internet?.
Internet, réseau international d'ordinateurs hétérogènes
communiquant grâce aux protocoles de la famille TCP/IP, a été
créé dans les années 70. Ses services sont vastes
et englobent aussi bien le Web, système réparti de recherche
documentaire en mode hypertexte, et le courrier électronique
que les informations fournies par les groupes de discussion, les news,
les forums, mais aussi par FTP, Telnet, et Gopher.
>>2 Historique d'Internet
et >>3 Les services d'Internet.
De plus on peut trouver toutes sortes de documents sous différents
formats de fichiers (textes, images, vidéos, sons, application,...).
Afin de lire et utiliser ces fichiers, il faut posséder les logiciels
appropriés.
>>4 Documents et formats.
Si l'on trouve de tout sur Internet, il convient de rester attentif
au fait que l'information y est hétérogène, instable,
multilingue... et que l'information n'y est pas toujours fiable. De
plus, aucun des outils de recherche ne couvre la totalité des
ressources.
>>5 Caractéristiques
de l'information sur Internet.
La plus grande partie des ressources Web ne sont pas accessibles via
les outils de recherche communs. C'est ce qu'on appelle le Web invisible
.
>>6 Le Web invisible.
Pour bien s'y retrouver, il faut tout d'abord comprendre comment sont
formées les URL des sites. En effet, elles se basent toutes sur
le même principe : protocole://ordinateur/repertoire/fichier.html#ancre
.
>>7 Comprendre l'URL d'un site.
Ce système facilite grandement la recherche intuitive de site
dont on connaît le nom. Cela permet aussi de retrouver une page
qui " n'existe plus " sans devoir passer par un outil de recherche.
>>8 La recherche intuitive
.
Néanmoins, cette méthode est largement insuffisante pour
la plupart des recherches sur Internet. Il existe heureusement de nombreux
outils qui permettent de les faciliter. Ces outils sont représentés
essentiellement, mais pas uniquement, par les moteurs de recherche et
les annuaires. Chaque famille d'outil possède ses avantages et
ses inconvénients en fonction du type de recherche.
>>9 Typologie des outils
de recherche sur Internet.
Vu leur nombre et leur spécificité (un moteur ne fonctionnera
pas exactement comme un autre) , il est utile de choisir un certain nombre
de ces outils, de bien les connaître et de les utiliser régulièrement.
Cela n'empêchant évidemment pas de consulter d'autres outils
plus pertinents en fonction de la recherche.
>>10 Boîte à
outils.
La recherche sur Internet diffère très peu, du point de
vue de la méthodologie, de la recherche documentaire classique.
>>11 Méthodologie
de la recherche documentaire
Les étapes préalables à la recherche permettent
de répondre à un certain nombre de questions (type
d'information recherchée, type de document, quantité
d'information, limites de la recherche, ...), de traduire la recherche
en mots-clés et finalement de choisir le service d'Internet
et la famille d'outils les plus pertinents en fonction de ces différents
paramètres.
>>12 Préparer sa recherche.
Les outils de recherche, à de rares exceptions près, ne
comprennent pas le langage humain. Il faut donc traduire la question
dans un langage d'interrogation propre à l'outil choisi.
>>13 Exprimer sa recherche
(requête et opérateurs booléens)
Ce choix n'est pas toujours facile et il n'y a hélas pas de
solution miracle, nous ne donnerons ici que quelques exemples.
>>14 Choisir le bon outil
(exemples).
Une fois les documents pertinents trouvés, il peut être
utile de consulter leurs références pour cerner le sujet.
Il reste ensuite à évaluer, classer et traiter l'information
afin de la communiquer. Ce sont les dernières étapes de
la recherche documentaire, qu'elle soit classique ou sur Internet. Néanmoins,
on n'évalue pas un livre de la même façon qu'une
page Web. En effet, sur le Web, n'importe qui peut éditer n'importe
quoi, dès lors il est indispensable de savoir évaluer
les ressources issues de ce média.
>>15. Evaluer les ressources.
Pour finir, comme toutes références, les ressources issues
d'Internet doivent être citée selon des règles
précises.
>>16. Citer les références.
< Mozilla - Netscape - Internet Explorer - Synthèses/Comparaisons - Lynx >
Voir aussi la page logiciels
< Ajouter un bookmark - Organiser les bookmarks >
Vous avez aussi la possibilité d'exporter vos bookmarks (Signets dans Netscape ou Favoris dans Internet Explorer) au format HTML à partir de votre navigateur. En enregistrant ce fichier sur une disquette, vous pouvez avoir vos signets à disposition sur n'importe quel ordinateur.
Certains sites permettent de définir vos bookmarks personnels et même d'importer le fichier html créé par votre navigateur, après avoir sélectionné un nom d'utilisateur et un mot de passe. Cela vous permet de pouvoir accéder à vos bookmarks quel que soit la machine (connectée à Internet) que vous utilisez. A titre d'exemple, My Yahoo!, disponible à partir de la page d'accueil de Yahoo! possède cette fonction.
Lorsque vous vous trouvez sur un site intéressant et que vous désirez pouvoir y accéder facilement, lancez la commande Add Bookmark (Ajouter un signet dans Netscape version française et Ajouter aux Favoris dans Internet Explorer) du menu Bookmarks (Signets, Favoris). Ou encore, utilisez le raccourci commande + D. Le nom du site se trouvera alors en bas de la liste des bookmarks (accessible en sélectionnant le menu Bookmarks, Signets ou Favoris). Pour visiter le site, il suffit alors de sélectionner son nom.
Avec Netscape et Internet explorer, vous avez la possibilité d'organiser vos bookmarks (Favoris>Organiser les Favoris ou commande+B). C'est un outil essentiel pour la recherche documentaire et pour la navigation sur Internet en général. En effet, vous pouvez regrouper vos sites dans des dossiers et sous-dossiers et organiser ainsi vos bookmarks de façon hiérarchique et structurée. Cela vous permet de retrouver rapidement les sites traitant d'un sujet donné.
D'autre part, si le titre de la page proposé par l'auteur de la page ne vous parle pas, changez-le sans hésiter. Il est en effet fréquent qu'un signet ne serve pas pendant des mois.
Il existe, par ailleurs, des logiciels qui vous permettent de mieux gérer vos bookmarks. Le site Mégagiciel en donne une liste <http://www.megagiciel.com/logiciels/313.html> non exhaustive.
De tout et n'importe quoi :
< 60 - 70/80 - 80/90 - En savoir plus >
En 1957, suite au lancement du premier Spoutnik par les Soviétiques, le président Dwight D. Eisenhower crée l'ARPA (Advanced Research Project Agency) au sein du DoD (Department of Defense) pour piloter un certain nombre de projets dans le but d'assurer aux USA la supériorité scientifique et technique sur leurs voisins Russes. Cette organisation regroupait certains des plus brillants cerveaux américains qui développèrent le premier satellite opérationnel des US en 18 mois. Quelques années après, l'ARPA commença à s'intéresser aux réseaux d'ordinateurs et aux technologies de la communication.
![]() |
En 1967, Lawrence G. Roberts, récemment arrivé à la tête du projet de réseau informatique à l'ARPA, publie ses "Plans pour le réseau ARPANET" au cours d'une conférence. Lors de cette conférence sera aussi publié un papier sur un concept de réseau à commutation de paquets par Donald Davies et Robert Scantlebury du NPL (National Physical Laboratory Royaume Uni) et également un article de Paul Baran de la Rand Corporation (militaires) au sujet de l'utilisation d'un réseau à commutation de paquet pour transmission sécurisée de la voix. Les militaires s'inquiétaient en effet de voir les dirigeants privés de communication si les lignes de téléphones disparaissaient après un bombardement. Ainsi le projet de la Rand s'intéressait à l'idée des paquets passant de noeud en noeud ayant la même autorité sans système central, une anarchie technologique qui même en cas de destruction partielle du réseau, en cas de guerre nucléaire pourrait continuer à fonctionner. Il est amusant de noter que ces groupes ont travaillé en parallèle sur des concepts similaires et sans avoir connaissance des travaux des autres pour aboutir en même temps à la même conclusion !
C'est aussi à cause de la similitude entre le projet de la RAND et le projet de l'ARPA qu'est née la fausse rumeur selon laquelle le réseau Arpanet avait été lancé à cause du besoin de relier les ordinateurs entre eux par un réseau insensible aux destructions d'une guerre nucléaire.
Opérationnel en 1969, le réseau Arpanet ne relie initialement que 4 instituts universitaires. Après avoir résolu certains problèmes techniques, Arpanet devient réellement opérationnel, permettant aux quatre institutions de transférer des données et d'effectuer à distance certains calculs longs sur plusieurs ordinateurs afin d'aller plus vite.
Tout au long des années 70, les laboratoires de recherche sont progressivement reliés au réseau Arpanet. Contrairement aux réseaux conventionnels qui ne pouvaient accommoder que des machines de même type, Arpanet présentait un énorme avantage, celui de pouvoir mettre en liaison des machines hétérogènes (Unix, IBM,...) , à condition toutefois qu'elles communiquent toutes selon le même mode. Cette normalisation impliquait une sorte de « charte », un protocole standard universel. Le protocole utilisé sur Arpanet au début des années 1970 s'appelait le NCP (Network Control Protocol). Cependant, dès 1973 on envisage l'établissement d'un nouveau protocole plus performant, capable de mieux acheminer les messages en cas de destruction partielle du réseau en cas de guerre.
Environ dix ans plus tard en 1983, le NCP est définitivement abandonné au profit du TCP/IP que nous utilisons encore aujourd'hui et qui constitue le protocole de base d'Internet. TCP est chargé de segmenter le message en paquets et de réarranger ces derniers à la réception, tandis que IP est chargé d'assurer l'acheminement des paquets d'ordinateur en ordinateur jusqu'à destination.
En 1977, Internet devient réalité car le TCP/IP est effectivement utilisé pour relier divers réseaux à Arpanet. Le nombre d'ordinateurs connectés dépasse alors la centaine et depuis, ce nombre ne cesse d'augmenter d'année en année.
L'origine du Web remonte à mars 1989 lorsque Tim Berners-Lee, un informaticien au CERN, propose de créer sur le site Internet du CERN un ensemble de documents reliés les uns aux autres par des liens hypertextes, afin de faciliter la recherche d'informations pour les physiciens des particules. En 1991 (300 000 ordinateurs connectés) , alors que le nombre d'ordinateurs connectés atteint les 300 000, le plus grand site Internet au monde est celui du CERN, futur berceau du Web, un vaste ensemble mondial de documents dits hypertextes et hypermédias distribués sur Internet.
En 1992 (1 000 000 de machines connectées), le premier lien vers le site Web du CERN est créé sur le serveur de Fermilab aux États-Unis: la toile mondiale commence à se tisser. Les années 1990 ont vu le Net continuer à grossir à une vitesse exponentielle sous l'impulsion du Web. En 1993, on comptait 600 sites, en 1995 plus de 15 000 , le WWW devient le service le plus important sur Internet.
Aujourd'hui (décembre 2002), le nombre de personnes reliées à Internet est de 580 millions (soit 9.27% de la population mondiale). Quant aux nombres de sites Web il était estimé en juillet 2003 à 42 298 371 (ce qui représente des milliards de pages Web) ! L'augmentation du nombre de sites c'est cependant fortement ralentie, de 53% par an en 1999 à -1%/an en 2002. La croissance négative est due au ralentissement du nombre de nouveaux sites par an associé à la disparition régulière des anciens sites (17% des sites créés en 2001 disparaissaient en 2002). Par contre, les sites eux ont tendance croître annuellement. Le nombre de pages web continue donc d'augmenter. En janvier 2005, Google (qui est le moteur indexant le plus de pages Web à l'heure actuelle), estimait ce nombre à 8 058 044 651 ! Sans compter les pages du Web invisible estimées à 3,5 billion (3,5 1012 ! ) pour à peu près 200 000 sites (2001) !
Par ailleurs, Cyveillance (2004) fait les estimations suivantes :
Sur l'Internet, on peut trouver tout type de document :
Chaque type de document est numérisé sous un format spécifique qui nécessite, pour le visualiser ou le retraiter, des logiciels particuliers. Les navigateurs récents intègrent désormais de nombreux "plug-ins" permettant de visualiser certains documents.
Mais pour les autres, sans le logiciel approprié, il est impossible de les consulter. Dans ce cas, il faut reconnaître le format du fichier et chercher un logiciel capable de l'ouvrir.
Pour cela, regardez son extension (exemple : rapport .doc, application.exe...). Puis, effectuez une recherche sur :
Ces outils de recherche spécialisés référencient les extensions et indiquent le programme nécessaire à leur visualisation.
Pour ceux que cela intéresse vous pouvez aussi télécharger le glossaire des extensions de fichiers (.zip - 1.32 Mb) (source : Informatique pratique, <www.infoprat.net> )
L'information sur internet est
Par ailleurs,
Les meilleurs moteurs de recherche indexent moins de 20% du Web. En effet, les outils de recherche (en particulier les moteurs) ne référencient pas les pages suivantes :
Les données relatives à ces documents constituant le Web invisible peuvent être
Le Web invisible contient notamment des bases de données spécialisées très utiles lors de la recherche documentaire (par exemple des bases de données d'articles scientifiques, ...). Heureusement, il existe maintenant des outils de recherche spécialisés dans le Web Invisible (voir les outils Web invisible)!
Par ailleurs, il existe sur internet une partie encore plus cachée que le Web invisible, ce sont les documents situés sur les machines clientes (votre ordinateur, celui de votre voisin). Il existe des logiciels à télécharger sur votre machine qui permettent de partager avec tous les utilisateurs de ces logiciels, les documents que vous voulez. C'est ce qu'on appelle le "peer-to-peer search system " représenté essentiellement par le protocole Gnutella <http://gnutella.wego.com/>. Ce système permet l'échange de mp3, de vidéo mais aussi de documents ou d'applications.
L'adresse d'un site (URL) donne de nombreuses informations d'un seul coup d'oeil (si l'URL n'est pas écrite, il suffit de pointer la souris sur le lien, l'URL apparaît en bas du navigateur). Elle se présente de la manière suivante :
|
protocole:// |
Protocole utilisé pour le dialogue entre les différentes machines connectées. http est le protocole utilisé pour les pages Web. Il existe d'autres protocoles (par exemple FTP, gopher...). |
|
ordinateur/ |
Nom de l'ordinateur sur lequel se trouvent les fichiers (nom d'hôte). Ce nom d'hôte est divisé en domaine et sous domaine Par exemple, www.fundp.ac.be - est un serveur Web (www.) situé en Belgique (be) dans le sous-domaine académique (ac) et il se nomme fundp (Faculté Universitaire Notre-Dame de la Paix à Namur) Les domaines principaux sont les suivants (Liste complète des domaines <http://www.siteware.ch/Webresources/domains/>) :
|
|
répertoire/ |
Répertoire dans lequel se trouve, sur le serveur, le document. Souvent, il existe des sous répertoires. |
|
document.html |
Nom de la page Web, ou du fichier (voir documents et formats), demandée |
|
#ancre |
Détermine un endroit précis de la page Web |
Ainsi, avec l'adresse d'un site on peut savoir s'il est officiel, universitaire, dans quel pays il se situe... Et si l'organisation en répertoires et sous-répertoires est logique (cela dépend du concepteur) on peut avoir une idée du sujet.
Exemple :
Que peut-on dire de la page dont l'adresse est :
http://jama.ama-assn.org/issues/v281n17/rfull/joc81655.html ?
Intuitivement, on peut penser que le document est un article (rfull) du N°17 du Vol 281(v281n17) du journal JAMA (Journal of American Medical Association), situé dans les archives on-line des journaux scientifiques publiés par l'AMA (American Medical Association).
Mais attention, le nom d'un site est parfois trompeur et certaines personnes en tirent profit.
Exemple : http://www.whitehouse.com/ , http://www.whitehouse.org/ vs http://www.whitehouse.gov
En conclusion, si l'analyse de l'URL d'un site donne de bons indices ils sont loin d'être suffisants pour se faire une opinion définitive sur la qualité de l'information que l'on y trouve.
< Internet - Web - Courrier - Liste de discussion - Chat - FTP - Gopher - Telnet >
Définitions tirés de l'encyclopédie
libre Wikipédia et du DICTIONNAIRE
DE L'INTERNAUTE (IBM) <http://www.can.ibm.com/francais/dico/>.
Vous trouverez d'autres définitions relatives à l'informatique
aux adresses
recensées <http://globegate.utm.edu/french/globegate_mirror/compdico.html>
par le Globe-Gate Project of the University of Tennessee-Martin.
L'internet ou Internet est un réseau mondial de réseaux informatiques interconnectés reposant sur le protocole IP. Le terme désigne en anglais n'importe quelle interconnexion de réseaux d'ordinateurs, d'où la contraction : inter + net (abréviation de network, réseau).
Internet sert de support à de nombreux systèmes, notamment le Web (hypertexte) qui en a fait la popularité. Par extension, le terme Internet peut désigner, à tort, le World Wide Web alors que celui-ci n'en désigne qu'une des utilisations, le courrier électronique en étant une autre, tout aussi populaire.
Famille de protocoles de transmission de données entre ordinateurs.
Ces protocoles offrent des services d'accès à distance,
de transfert de fichiers, de courrier électronique, et englobe
les protocoles suivants : TCP, IP, HTTP, FTP, SMTP, POP3, IMAP,Telnet
et DNS.
< Web - Courrier - Liste de discussion - Chat - FTP - Gopher - Telnet - top >
Le World Wide Web (ou WWW ou W3, souvent appelé Web) signifie littéralement la "toile d'araignée recouvrant le monde". Cette image représente tous les ordinateurs interconnectés à travers le monde, mais le World Wide Web désigne plus précisément le système hypertexte que supporte le réseau Internet. Les liens hypertextes sont commes les fils d'une toile d'araignée qui relient les pages d'un site à l'autre.
Un hypertexte est un ensemble de textes lisibles à l'aide d'une interface informatique, et reliés entre eux par des liens (ou hyperliens) associés à certains mots. Pour Ted Nelson, qui a inventé le terme «hypertexte» en 1965, la définition est un peu plus large puisqu'elle recouvre tous les systèmes d'écriture non-linéaire utilisant l'informatique. Actuellement, le World Wide Web est l'hypertexte le plus vaste et le plus connu.
Mode hypertexte étendu qui permet à l'utilisateur de naviguer sans parcours préétabli à travers les données textuelles, sonores ou visuelles, les images animées ou les séquences vidéo.
Technique de communication qui réunit sur un seul support d'information les données suivantes : textes, graphiques, images et sons.
Dans un document hypertexte, liaison établie à partir d'une zone activable du texte représentée par un mot--clé ou une icône clé, ce qui permet d'avoir accès à d'autres renseignements.
Logiciel de navigation conçu pour le Web, qui permet aux utilisateurs d'explorer les ressources d'Internet, en particulier les documents hypertextes. Un navigateur permet de se connecter à un serveur Web, en utilisant le protocole HTTP, pour transférer et afficher des pages Web au format HTML. La plupart des navigateurs gèrent aussi d'autres protocoles, comme le HTTPS (sites Web sécurisés) et le FTP (transfert de fichiers), ou encore les transactions de paiement sécurisées en SSL et SET. Les navigateurs doivent aussi gérer plusieurs autres technologies utilisées sur le Web. Parmi les plus connues, on peut citer les CSS, le DHTML, le XHTML et le Javascript. Ces technologies sont standardisées par le W3C (à l'exception d'extensions non normalisées comme Javascript, Flash ou Java).
Les navigateurs Web sont donc des logiciels très complexes et en constante évolution, car de nouveaux standards ou des révisions des standards existants ne cessent de voir le jour.
ex. Mozilla, Lynx, Netscape, Internet Explorer, Opera,...
Emplacement uniformisé de ressource. Noms et adresses qui, sous forme de chaînes de caractères, refèrent à des ressources sur le Web ce qui permet aux utilisateurs des réseaux Internet ou intranet de repérer l'endroit où se trouvent les informations recherchées sous forme d'adresse (p. ex. : http://www.fao.org/).
Une URL est constituée d'un nom de protocole, du nom d'un ordinateur hôte, d'un port (en option), d'un répertoire (en option) et d'un nom de fichier (en option).
protocole://ordinateur/répertoire/fichier.html
Les URI (pluriel d'URL) peuvent aussi servir à joindre d'autres ressources Internet telles que les sites FTP, les serveurs gopher, les adresses telnet, etc.
En informatique, le plugin, ou greffon en français, est un petit logiciel venant se greffer à une application afin de lui apporter de nouvelles fonctions, des améliorations, etc. Le greffon ne peut fonctionner seul, il ne peut être appelé qu'à partir du programme auquel il a été ajouté. Il existe de nombreux plugins pour les navigateurs Web comme Flash, RealOne player, quicktime, ...
Dans un navigateur Web, marque qui permet de conserver en mémoire la référence consultée (document, page ou site) afin d'y avoir directement accès la prochaine fois.
< Internet - Courrier - Liste de discussion - Chat - FTP - Gopher - Telnet - top >
Mode de transmission d'un message entre un expéditeur et un destinataire. On nomme courrier électronique le service de transfert de messages que l'on envoie par Internet vers la boîte aux lettres électronique des personnes à qui ces messages sont destinés. Par métonymie, on appelle également courrier électronique l'ensemble des messages ainsi échangés. Pour recevoir et consulter des messages, il est indispensable de posséder une adresse électronique. C'est un mode de communication asynchrone : à l'inverse du téléphone par exemple, il ne nécessite pas la présence simultanée des deux parties en communication.
Coordonnées électroniques
d'un utilisateur (personne ou machine) comprenant son nom
d'utilisateur suivi du symbole @, du nom de son serveur de messagerie
(généralement le nom de son entreprise ou organisation,
suivi du code de son doamine d'appartenance)
ex. pierre.dupont@hotmail.com
< Internet - Web - Liste de discussion - Chat - FTP - Gopher - Telnet - top >
Réunion en différé des utilisateurs du réseau Internet, soit par messagerie électronique, soit par le réseau Usenet, articulé autour d'un sujet thématique.
Usenet (également connu sous le nom NetNews) est un ensemble de protocoles servant à générer, stocker et récupérer des "articles" (qui sont proches, dans leur structure, des emails), et permet l'échange de ces articles entre les membres d'une communauté qui peut être répartie sur une zone potentiellement très étendue. Usenet est organisé autour du principe de groupes de discussion ou newsgroups, qui rassemblent chacun des articles (contributions) sur un sujet précis. Les sujets des groupes de discussion sont organisés selon une hiérarchie. Les utilisateurs emploient généralement un logiciel client appelé lecteur de news (parfois aussi appelé client de news, en référence au modèle client-serveur) pour lire et composer des articles Usenet. La plupart des navigateurs Internet permettent d'accéder à Usenet, mais ils sont réduits aux fonctions de base, manquant de bien des fonctions orientées spécifiquement vers la lecture d'articles Usenet.
< Internet - Web - Courrier - Chat - FTP - Gopher - Telnet - top >
Service d'échange de messages en temps réel (synchrone) entre plusieurs utilisateurs du réseau Internet, qui correspond en fait à un service de conférence électronique improvisée qui s'articule autour du mode questions et réponses. Le succès d'IRC a été quelque peu diminué par l'arrivée des messageries instantanées (MSN, Yahoo Messenger, ...) Ces réseaux restent néanmoins très utilisés par ceux qui veulent discuter sans passer par un programme client propriétaire.
< Internet - Web - Courrier - Liste de discussion - FTP - Gopher - Telnet - top >
Dans Internet, protocole de communication TCP/IP qui assure la transmission de fichiers sans perte de données entre deux ordinateurs reliés au réseau Internet. Il permet, depuis un ordinateur, de copier des fichiers depuis ou vers un autre ordinateur du réseau, ou encore de supprimer ou modifier des fichiers sur cet ordinateur.
< Internet - Web - Courrier - Liste de discussion - Chat - Gopher - Telnet - top >
Protocole Internet de recherche documentaire
piloté par menu qui permet à l'internaute de
naviguer dans l'espace Gopher et d'en consulter les ressources.
Complètement supplanté par le Web (il tombe dans l'oubli
en 1996), Gopher possède cependant des fonctions qui n'existent
pas sur les serveurs Web. En 2000, Gopher est placé sours
licence OpenSource et en 2002 sortait la version 3.0.Aujourd'hui,
les menus Gopher disponibles peuvent s'avérer être
des sources uniques d'information même si MSIE ne gère
plus ce protocole depuis 2002, Mozilla permet encore d'y accéder.
Note : Terme emprunté à l'anglais pour désigner
le petit rongeur, appelé spermophile en français,
qui est la mascotte officielle de l'État du Minnesota (Gopher
State) et de l'Université du Minnesota (Golden Gopher), institution
où a été conçu ce protocole en 1991.
Il s'agit aussi d'un jeu de mots anglais à partir duquel
"go for" signifie "aller chercher".

Exemples :
Plus d'infos :
< Internet - Web - Courrier - Liste de discussion - Chat - FTP - Telnet - top >
Dans Internet, protocole d'émulation de terminal qui permet aux utilisateurs reliés à un ordinateur hôte de se connecter aux ressources matérielles et logicielles d'un autre ordinateur hôte.
< Internet - Web - Courrier - Liste de discussion - Chat - FTP - Gopher >
< 4XX - 5XX - 3XX - 2XX- les autres >
Lorsque l'on demande une page, il peut arriver que l'un des messages suivants apparaissent. Voici leur signification et ce qu'il y a lieu de faire dans ce cas.
En raison d'une syntaxe erronée, la demande n'a pas
pu être comprise par le serveur.
Vérifer la syntaxe de l'URL.
Le paramètre du message spécifie les formes d'autorisation
acceptables.
Le client doit reformuler sa requête
avec les bonnes données d'autorisation (identification par
mot de passe).
L'information demandée est soumise à un droit
d'entrée. Il est nécessaire d'avoir une authentification
correcte.
Le client doit reformuler sa demande
avec les bonnes données.
La requête est tout simplement interdite, non autorisée...
Il n'y a rien à faire ! Néanmoins,
si le site semble intéressant, il faut
remonter l'adresse jusqu'à ce qu'une page fonctionne.
Le serveur n'a rien trouvé à l'adresse spécifiée.
Soit la ressource n'existe plus à l'adresse spécifiée,
soit l'URL est erronnée.
Verifier l'adresse demandée. S'il
n'y a pas d'erreur, la page a pu être déplacée.
Il convient donc de
remonter l'adresse jusqu'à ce qu'une page fonctionne
et faire une recherche sur le site..
Attention, parfois le serveur retourne une 404 au lieu d'une
400.
500 Internal Server Error
Le serveur a rencontré un évènement inattendu
qui l'a empêché de donner correctement suite à
la demande. Le serveur ne peut pas répondre à
la requête suite à une erreur interne...
Réessayer plus tard.
Le serveur ne supporte pas le service demandé ou le
type de requête qui a été envoyé.
Il n'y a rien à faire
Le serveur ne peut pas vous répondre à l'instant
présent, car le trafic est trop dense.
Réessayer plus tard.
Erreur équivalente à une Internal Server Error (500) mais dans le cas précis où le serveur accède à d'autres services que le HTTP ou effectue des requêtes indirectes découlant de la requête initiale. Cette erreur indique que la réponse du service demandé ou une des requête indirecte n'a pas été retournée au serveur correctement.
Le document demandé à été déplacé définitivement à une nouvelle URL. La redirection vers la nouvelle adresse est automatique.
Les données demandées ont été trouvées à une nouvelle URL, mais ont cependant peut-être été déplacées temporairement...
L'URL demandée peut être trouvée à une autre URI (spécifiée dans l'en-tête Location) et peut être récupérée en effectuant une requête GET.
Si le client a effectué une commande GET conditionnelle (en demandant si le document a été modifié depuis la dernière fois) et que le document n'a pas été modifié il renvoie ce code.
La requête a été accomplie correctement. L'information demandée va suivre.
Elle suit une commande POST, elle indique la réussite, le corps du reste du document est censé indiquer l'URL à laquelle le document nouvellement créé devrait se trouver.
La requête a été acceptée, mais le serveur ne peut pas determiner si une action a été effectuée ou un fichier envoyé.
Cet erreur est reçue en réponse à une commande GET, elle indique qu'une partie des informations demandées n'a pas été acheminée vers le client.
Le serveur a reçu la requête mais aucune donnée n'a été renvoyée.
< Recherche - Classement des résultats - Présentation des résultats >
Les moteurs de recherche sont les outils à utiliser quand on cherche une information précise. Leur couverture est beaucoup plus importante que celle des annuaires, mais reste très parcellaire (environ 20% du Web pour les meilleurs d'entre eux). Il est indispensable de bien connaître la façon de les utiliser, leurs avantages et leurs limites.
Les moteurs de recherche indexent régulièrement des millions de PAGES Web dans une base de données. Pour cela, la plupart des moteurs de recherche utilisent des robots (programmes automatiques aussi appelés spiders ou crawlers) qui inventorient les pages Web et ajoutent les nouvelles adresses à leur base de données. Ces informations sont complétées par les auteurs de pages Web qui informent, de leur propre initiative, les moteurs de recherche de l'existence de leurs pages.
En plus des moteurs généralistes, il existe maintenant de nombreux moteurs de recherche spécialisés dans une discipline donnée, ou pour un type de document particulier (images, vidéos,...)
Chaque robot fonctionne à sa manière. Voilà pourquoi les résultats peuvent être différents pour une même requête selon que l'on utilise tel ou tel moteur. Les 3 principaux systèmes d'indexation utilisés par les robots sont les suivants (certains en utilisent plusieurs):
Exemples :
< Recherche - Classement des résultats - Présentation des résultats - top>
Les moteurs de recherche proposent un formulaire de recherche simple disponible sur la page d'accueil.
Exemple : AlltheWeb <http://www.alltheWeb.com>, formulaire de recherche simple

Un formulaire de recherche avancée, beaucoup plus puissant est généralement proposé (par un lien).
Exemple : Google recherche avancée <http://www.google.com/advanced_search?hl=fr>
Le moteur cherchera l'occurrence du(des) mot(s) recherché(s) dans sa base de données contenant plusieurs millions de pages.
Attention, la recherche s'effectue dans la base de données du moteur et pas sur la totalité de l'Internet ! De plus il existe une part non-négligeable du Web totalement inaccessible aux moteurs : le Web invisible
< Classement des résultats - Présentation des résultats - top >
Les résultats seront classés selon un algorithme de pertinence propre au moteur (présence du mot dans le titre, dans le texte, dans les balises métas, dans l'url, indice de popularité...).
Exemple :
Attention cependant, de nombreux moteurs proposent sur leurs pages de résultats des liens sponsorisés. Dans le milieu du e-commerce et du e-marketing, c'est ce qu'on appelle le positionnement payant : des sociétés achètent aux enchères certains mots clés afin de se retrouver dans les premiers résultats d'une requête comprenant ce mot.
Ces liens ne sont pas nécessairement (les plus) pertinents pour la recherche en tant que telle et n'ont en général pour but que de ramener des clients potentiels à la société. "Le lien sponsorisé est au web ce que la publi-information est à la presse écrite, ou l'infomercial à la télévision, à savoir un simple message publicitaire payé par un annonceur pour faire passer une information." (Philippe Crouzillacq, 01net).
Avec le développement des techniques de positionnement payant, c'est la notion de pertinence des outils de recherche qui est menacée. En effet, ces liens peuvent représenter de 20 à plus de 80% de la première page de résultats. Or la distinction entre les liens sponsorisés et les liens classiques n'est pas toujours évidente (cadre légèrement bleuté, indication "lien commercial"). Une enquête récente a d'ailleurs montré que plus de 70% des américains cliquaient sur des liens sponsorisés sans le savoir (étude de Pew Internet, janvier 2005 ) !
Exemple : recherche sur la calvitie

< Recherche - Présentation des résultats - top >
La façon de présenter les résultats est, elle aussi, propre à chaque moteur (titre de la page, petite description, adresse, mais aussi date de mise à jour, auteur, sites similaires, pertinence en %, ...).
Enfin, la plupart des moteurs effectuent un clustering (c'est-à-dire qu'ils ne proposent qu'un seul lien pour un site même si plusieurs pages de ce site correspondent à la requête). On peut en général accéder aux autres pages du site à l'aide d'un lien du type "Autres pages de ce site".
Exemple : Northernlight présentation des résultats :

< Recherche - Classement des résultats >
Voir aussi les spécificités de certains moteurs.
< Recherche - Résultats - Avenir ? >
Ce genre de recherche se fait quand on désire explorer un domaine assez vaste, c'est-à-dire lorsque le sujet de recherche peut faire l'objet d'un site entier.
Les répertoires ou annuaires sont très différents des moteurs. Alors que ces derniers indexent automatiquement des PAGES Web, les annuaires recensent des SITES classés par catégories et sous catégories. Ce classement est effectué par la main de l'homme et, dès lors, la pertinence et la qualité des sites sont en général bien meilleures que sur un moteur de recherche.

Les responsables construisent donc une base de données de fiches descriptives contenant de l'information comme le titre, l'adresse URL, les sujets traités (sport, éducation, arts et spectacles, etc.), une description et éventuellement un commentaire et des mots-clés.
A côté des annuaires généraux, il existe maintenant de nombreux annuaires spécialisés dans un domaine précis (un pays, la médecine, l'éducation, ...).
Exemples :
La recherche par mots-clés dans un annuaire s'effectue sur l'occurrence des mots dans le contenu des fiches descriptives et non sur le contenu des pages du site (à la différence des moteurs).
La recherche peut aussi se faire en descendant la hiérarchie de catégories de la plus générale à la plus spécifique.
Le répertoire proposera d'abord une liste de catégories contenant le(s) mots(s) demandé(s), suivie d'une liste de sites dont la fiche correspond à la recherche, classés par pertinence.
Exemple :

Certains annuaires proposent ensuite les résultats d'un moteur de recherche
Exemple : Yahoo (avant 2004 Yahoo! proposait les résulats de Google. Yahoo! a depuis lancé son propre moteur de recherche, Yahoo! Search).
Le résultat sera une liste de sites pertinents du domaine recherché, classés par ordre alphabétique.
Exemple :
Catégorie Science: Publications: Journals sur DMOZ
<http://dmoz.org/Science/Publications/Journals_and_Magazines/>
Depuis peu (nous sommes en février 2005), les professionnels de la recherche d'information s'inquiètent de l'avenir des annuaires de recherche. En effet, progressivement ils sont abandonnés (plus mis à jour) voire supprimés.
"Il y a encore quelques mois de cela, il existait de nombreux annuaires, conçus, gérés et maintenus par des documentalistes, notamment en France. On peut citer ceux de l'Open Directory, de Yahoo! France, d'AOL.FR, de Nomade, de Lycos, de MSN France, le Guide de Voila et bien d'autres. Aujourd'hui, qu'en est-il ?
Force est de constater que les moteurs de recherche ont, petit à petit, "grignoté" les parts de marché des annuaires et que ceux-ci se retrouvent avec de bien faibles miettes de trafic aujourd'hui. Est-ce la fin des annuaires ? Ce serait bien triste car ce type d'outil apporte certainement une pertinence humaine parfois indispensable et qui manque souvent aux moteurs de recherche, qui pêchent parfois par trop d'automatisation. Espérons que l'avenir nous permettra d'espérer que les annuaires reviennent sur le devant de la scène... La thématisation et la régionalisation seront-elles leurs voies de secours ?"
Source Abondance : <http://actu.abondance.com/2005-07/annuaires.php>
< Métamoteurs - Encyclopédies - Sites fédérateurs - Webring>
Ils permettent de débroussailler rapidement un sujet et de repérer les outils qui y répondent le mieux.
On distingue généralement 3 générations de métamoteurs :
Les métamoteurs permettent d'interroger simultanément plusieurs moteurs de recherche avec une même requête (du moins pour les métamoteurs de génération 2 et 3). Les résultats de la requête sont issus de plusieurs bases de données, ce qui permet une plus grande couverture de l'Internet. Le principal avantage des métamoteurs est donc l'exhaustivité.
Mais la même requête est envoyée à tous les moteurs, il est dès lors impossible de faire une requête complexe puisque chaque moteur utilise une syntaxe propre. L'usage des métamoteurs se limite donc souvent à des recherches simples.
Exemples :
Pour information, il existe d'autres outils faisant de la "métarecherche" : les agents dits intelligents (les métamoteurs sont qualifiés d'agents "semi-intelligents"). Ceux-ci sont en général des logiciels payants que l'on installe sur sa machine
La définition exacte d'un agent intelligent est "Objet utilisant les techniques de l'intelligence artificielle : il adapte son comportement à son environnement et en mémorisant ses expériences, se comporte comme un sous-système capable d'apprentissage : il enrichit le système qui l'utilise en ajoutant, au cours du temps, des fonctions automatiques de traitement, de contrôle, de mémorisation ou de transfert d'information." (AFNOR)
Les agents de recherche intelligents sont spécialisés dans la recherche d'information, plus ou moins autonomes et qui assistent l'utilisateur dans la recherche d'information, soit qu'ils opèrent directement en lieu et place de l'utilisateur, soit qu'ils aient une connaissance au moins partielle des objectifs ou du profil de l'utilisateur. Ils sont le plus souvent programmés avec des technologies d'intelligence artificielle. (définition tiré de Strategic-road.com)
Exemple :
Métamoteurs
Agents
< Encyclopédies - Sites fédérateurs - Webring>
Gratuites ou payantes, les encyclopédies en ligne ne sont pas à proprement parler des outils de recherche (même si certaines d'entre elles en intègrent). Elles sont néanmoins une source sûre, l'information y est de qualité et permanente. Elles sont donc souvent un passage obligé lors d'une recherche d'information.
Exemples :
< Métamoteurs - Sites fédérateurs - Webring>
Aucun outil n'est exhaustif et bien souvent, il faut en utiliser plusieurs pour arriver à ses fins. Les sites fédérateurs (Gateway, Portail, passerelle thématique) et les guides thématiques sélectionnent des sources de qualité dans un domaine précis. Créés par des professionnels de l'information ou des passionnés, ces sites proposent en général un recensement complet des meilleures ressources concernant un domaine. Par ailleurs, ils recensent bien souvent des ressources appartenant au Web invisible. Un site fédérateur peut donc proposer des répertoire spécialisés, des liens vers des répertoires ou pages de liens spécialisées, des articles en texte intégral ou une bibliographie en ligne, les actualités du secteur, les événements du secteur, des accès à des base de données, des offres/demandes d'emploi, un forum, des données chiffrées, des statistiques,des synthèses concernant le secteur,une liste de périodiques spécialisés, une liste d'experts, des cours, des conseils, des informations juridiques, etc.... Un site fédérateur très actif rassemble souvent une communauté de spécialistes autour de lui et devient donc un point de référence du domaine.
Exemples :
< Métamoteurs - Encyclopédies - Webring>
Les Webrings permettent de découvrir une multitude de sites correspondant à un thème donné. Il est possible depuis n'importe quel site membre d'obtenir la liste détaillée de tous les sites. Le Webring est géré manuellement et fait l'objet d'une sélection : gage de qualité et fiabilité.
Exemples :
< Métamoteurs - Encyclopédies - Sites fédérateurs >
< Fonctionalités intéressantes - Google - Yahoo!Search - Des moteurs à surveiller >
Cette fonctionalité a été lancée pour la première fois par Google. La version cache d'une page est la page telle qu'elle était lors du dernier passage du moteur, archivée par ce dernier. Très pratique pour retrouver des pages disparues mais aussi pour des pages qui changent très souvent et dont le contenu est archivé ailleurs au fur et à mesure (cas des blogs par exemple), utile aussi dans le cas de pages accessibles sur abonnement mais publiées d'abord gratuitement.
Cette version cache permet aussi de mettre en évidence les mots recherchés dans la page en les surlignant, ce qui s'avère particulièrement utile avec de longs documents.

Moteurs concernés : Google, Yahoo! Search, Gigablast
Cette fonctionalité très intéressante a été inaugurée par Google mais est disponible maintenant sur quelques moteurs. Elle permet de ne chercher que des fichiers pdf (Adobe) ou doc (MSWord) par exemple, ce qui est particulièrement intéressant quand on sait que de nombreux dossiers de fond, rapports, articles ... sont sous ces formats.
Moteurs concernés : Google, Yahoo! Search, Gigablast
Lancée pour la première fois par le regretté Northern Light, cette fonctionalité permet d'affiner sa recherche. En effet, une fois la recherche lancée, les résultats similaires (d'après le moteur) sont regroupés automatiquement dans des dossiers thématiques. Par exemple, une recherche sur "bioindicateurs" dans Vivismo proposera les dossiers suivants :

Moteurs concernés : Wisenut, Teoma, Ez2find (métamoteur), Vivismo (métamoteur), KillerInfo (métamoteur)
Contrainte : ne fonctionne pas sur mac.
Cet outil s'appuie sur les ressources de Dmoz (l'Open directory project) et les lies à l'aide de liens sémantiques.

KartOO est un métamoteur graphique.
"Les internautes novices peuvent trouver l'information recherchée grâce à KartOO car nous leurs permettons d'avoir une vision globale des thématiques connexes à la requête tapée, de préciser leur pensée en rajoutant ou en enlevant ces thématiques générées dynamiquement à la requête originelle d'un simple clic sur des boutons + et - associés, de visualiser les sites Web les plus pertinents et les liens sémantiques reliant les sites les uns aux autres par l'intermédiaire d'une interface cartographique visuelle et intuitive. [...] KartOO interroge à l'heure actuelle quatorze moteurs, dont MSN, Voila, AllTheWeb. La liste est accessible sur KartOO dans l'option de recherche avancée et va s'allonger. Chaque fois qu'un site est affiché, la source est précisée. "
Laurent
BALEYDIER de KARTOO
<http://www.enfin.com/entretiens/l-baleydier.php>

"Recherche rapide et facile. [...] google a fait un compromis entre son extrême simplicité d'utilisation et la complexité de son système de classement de résultats"
A lire :
L'algorithme de pertinence de Google se base essentiellement sur l'indice de popularité. Ce système est utilisé à la fois pour les résultats du moteur et pour le classement des sites dans son répertoire (qui est en fait celui de l'Open Directory).
"Le principe de PageRank est simple : tout lien pointant de la
page A à la page B est considéré comme un vote
de la page A en faveur de la page B. Toutefois, Google ne limite pas
son évaluation au nombre de « votes » (liens) reçus
par la page ; il procède également à une analyse
de la page qui contient le lien. Les liens présents dans des
pages jugées importantes par Google ont plus de « poids »,
et contribuent ainsi à « élire » d'autres
pages. "
[Source Google
<http://www.google.com/intl/fr/why_use.html>]
Le bouton "j'ai de la chance" du formulaire de recherche de Google permet d'afficher directement la page que Google considère comme la plus pertinente pour une recherche donnée.
A lire :
Google était jusqu'il y a peu le seul moteur à indexer d'autres formats en dehors des pages Web :
Il suffit de taper filetype:ppt pour trouver des documents powerpoint ou utiliser le fomulaire de recherche avancée <http://www.google.com/advanced_search?hl=fr>.
Dans ces résultats, Google propose un lien vers la version de la page telle qu'elle était lors de son indexation ce qui est extrêmement utile pour les pages disparues (erreurs 404).

A lire :
Depuis août 2003, Google propose une recherche incluant les synonymes par l'intermédiaire du tilde (~). Par exemple, une recherche sur biology ~course cherchera des pages comprenant le mot biology associé à des termes comme course(s), classe(s), tutorial, lecture(s), training, ... La recherche incluant les synonymes n'est pas encore très efficace en français.
Pour savoir quels synonymes sont utilisés il suffit de faire une recherche incluant les synonymes en excluant le mot dont on recherche les synonymes, puis de regarder les pages de résultats :
Exemple :
< Yahoo!Search - Des moteurs à surveiller - Représentation graphique et liens sémantiques >
Ayant racheté AltaVista, AllTheWeb et Inktomi, Yahoo! a combiné les technologies de ces différents moteurs pour créer Yahoo! Search lancé en février 2004.
"Il nous semble évident que Yahoo! a "réussi son coup" en proposant dès le départ, un outil très proche de Google, certes, mais surtout légèrement plus pertinent, ce qui n'était déjà pas une mince affaire. YST a certainement profité de la baisse de qualité des résultats de Google, constatée par beaucoup depuis quelques mois, pour dépasser, de peu certes, le leader actuel en termes de pertinence. Lorsque quelques bugs de jeunesse auront été corrigés, Yahoo! pourrait avoir à sa disposition une première pierre qui lui permettra de bâtir un véritable mur technologique dans les mois qui viennent. [Source : Abondance]"
A lire :
< Google - Des moteurs à surveiller - Représentation graphique et liens sémantiques >
"Teoma [...] prend, comme Google, l'indice de popularité
[...] comme critère prédominant, mais de façon
légèrement différente. Il utilise tout d'abord
cet indice de popularité, donc la façon dont les pages
sont liées entre elles, pour identifier des "communautés"
sur le Web.
Puis, à l'intérieur de ces communautés, il tente
d'établir les pages qui sont les plus pertinentes par rapport
à la requête demandée. Il s'agit donc du concept
de Google, mais adapté à des "univers" précis et
spécialisés sur certains domaines uniquement. Teoma, comme
Northern Light, propose de reclasser les liens proposés dans
des dossiers thématiques[...]. Enfin, il propose des catégories
d'annuaires ou des pages riches en liens (nommés "Expert Links"
à droite) sur le thème demandé. L'index de Teoma
ne comprend cependant que 100 millions de pages, ce qui est un peu faible
aujourd'hui pour espérer jouer les "gros bras" dans ce domaine...
Mais il [...] devrait "grossir" dans les mois qui viennent. "
[Source : Abondance
<http://www.abondance.com/trucs-et-astuces/outils25.html>]
"Ce nouveau moteur [...] utilise plusieurs techniques pour juger
de la pertinence d'un document : l'analyse du texte de la page, du texte
des liens qui pointent vers cette page ainsi que des termes qui entourent
ces liens, mais également du contenu des pages pointant vers
le document analysé. [...] Pas si éloigné que cela
de l'algorithme de Google, cependant... [...]. Enfin, dans ses pages
de résultats, il tente une catégorisation des liens proposés
assez proches des "Custom Search Folders" de l'excellent Northern Light
[...]."
[Source : Abondance
<http://www.abondance.com/trucs-et-astuces/outils25.html>]
Lancé officiellement en septembre 2001, il semble jouer dans la cours des grands et annonce 1,495,332,308 de pages indexées sur sa page d'accueil (11/2001) ce qui le place d'emblé parmi le 3 plus gros moteurs.
"Lancé en mars 2002, ce "petit" moteur propose
des fonctionalités intéressantes. A l'instar de Google,
Gigablast prope une fonction cache (mémorisation de la page sur
les serveurs des moteurs). Dans les résultats, chaque page est
également assortie de sa date d'indexation par le moteur et de
sa date de dernière modification par le webmaster. Depuis l'été
2003, Gigablast indexe plusieurs formats de documents : PDF (Adobe),
PostScript (.ps), PowerPoint (.ppt), Excel (.xls), Word (.doc) et également
les documents ASCII (.text). Pour l'instant, la faiblesse de Gigablast
est la petite taille de son index qui augmente toutefois régulièrement
: 200 millions de pages en août 2003, 250 en janvier 2004. A suivre..."
[Source : Intelligence
center <http://c.asselin.free.fr/french/moteurs2.htm>
]
Vu le nombre sans cesse croissant d'outils de recherche généralistes ou spécialisés, il n'est pas question ici d'imposer un choix. La recherche d'information sur Internet commence, pour le novice, par chercher les outils qui lui conviennent (par essais et erreurs en partie). Pour cela, il existe maintenant des moteurs de moteurs et des annuaires d'annuaires. Pour les outils généraux, rien n'empêche, au contraire car ils sont validés, de choisir un outil très connu (Google, Yahoo,...)!
Ces choix effectués, il faut comprendre le fonctionnement de ces outils et apprendre leur langage d'interrogation. Pour cela, il ne faut pas hésiter à consulter l'aide en ligne des outils et les comparaisons d'outils.
Exemple :
Par ailleurs, vu l'évolution des outils de recherche, ces choix ne doivent pas être définitifs.
Enfin, chaque recherche étant particulière, il ne faut pas hésiter à consulter d'autres outils.
Pour vous aider à faire ces choix vous pouvez consulter les outils de la section du même nom (voir menu de gauche).
Les outils suivants devraient être idéalement classés dans vos bookmarks (dans un répertoire Recherche par exemple) :
Par ailleurs, dans votre boîte à outils, vous pouvez aussi inclure :
Définitions tirés du Glossaire collaboratif du recherchiste internet <http://www.bbs-consultant.net/docs/sources/glossaire.pdf>
B-C-D-E-F-J-K-L-M-O-P-R-S-T-U-V-W-X
Définition de Jacques Ferber in « Les Systèmes multiagents. Vers une intelligence collective », Inter-Editions, 1995. Entité physique ou virtuelle :
Logiciel visant à faciliter la recherche et la gestion de l'information sur l'Internet. Il possède des attributs propres et agit dans le but de d'accomplir un certain nombre de tâches pour un autre agent logiciel ou un humain. Voici les attributs définis par différents chercheurs comme Oren Etzioni, Daniel Weld, Stan Franklin et Art Graesser :
Relevancy algorithm : Méthode utilisée par un moteur de recherche ou un répertoire pour relier les mots-clés d'une requête avec le contenu de chaque page, de telle sorte que les pages Web trouvées correspondent bien au sujet de la requête. Chaque outil de recherche est susceptible d'utiliser un algorithme différent et de le changer ou de l'améliorer. Voir aussi : critères de tri.
Voir Répertoire
Outil permettant de copier un site Web à distance pour le relire ensuite en local, depuis son propre disque dur.
Réponse non pertinente fournie lors d'une recherche d'information.
Voir Frame
Il s'agit de pages Web avec des informations qui changent ou sont changées automatiquement en fonction d'une base de données ou d'éléments provenant de l'utilisateur. (ex. suffixe .asp, .cfm, .cgi ou .shtml dans l'URL). Voir aussi Page dynamique
Façon automatique de sélectionner les résultats retournés par le moteur de recherche, afin de présenter en début de liste ceux qui correspondent le mieux à la requête. On distingue généralement le tri par pertinence du tri par popularité. Voir aussi : algorithme de pertinence.
Moyen de rendre secrète la communication informatique grâce à des logiciels d'encodage de données. Seul le possesseur de la clé de décodage peut interpréter le message. Aussi appelé "chiffrement".
Une des propriétés qui permet d'indiquer l'importance de certains mots dans le texte d'une page Web. Certains outils de recherche utilisent cette propriété pour le tri. La formule de calcul = nombre d'occurrences du terme demandé / nombre de termes de la page en question, une fois éliminés les mots vides.
Voir Répertoire
Ce sont les commandes qui se trouvent en tête des pages HTML. Certains moteurs de recherche donnent plus d'importance et de poids au texte qui s'y trouve.
Formulation d'une question sous forme mots clés reliés par des termes logiques (ou opérateurs). Voir aussi opérateurs booléens.
Synonymes : trame, cadre . Il s'agit d'une technique de programmation en HTML pour présenter deux ou plusieurs documents séparés dans une fenêtre du navigateur, les documents agissants l'un sur l'autre à travers différentes sous-fenêtres. Les frames posent souvent de gros problèmes d'indexation aux moteurs de recherche.
Voir Mot-clé
Un lien qui ne mène plus à une page ou à un site, soit parce que le serveur est en panne, soit parce que la page a été déplacée ou bien n'existe plus. La plupart des outils de recherche ont des techniques pour ôter de telles pages de leur liste automatiquement. Mais l'Internet continuant à croître quotidiennement, il leur devient de plus en plus difficile de contrôler régulièrement toutes ces pages.
Voir le cours
Construction placée dans l'en-tête HTML des pages Web, fournissant des informations qui ne sont pas visibles par les navigateurs. Les plus courants des meta-tags (balises META) sont KEYWORDS et DESCRIPTION.
Mot ou groupe de mot, éventuellement dans une forme lexicographique normalisée, choisi dans le titre ou le texte d'un document, caractérisé par le contenu et permettant la recherche de ce document.
Voir le cours.
Synonyme : moteur spécialisé : Il procède par catégorisation automatique de pages, généralement à partir de catégories prédéfinies et de mots-clés préétablis.
Pour effectuer une recherche par mots clés, on couple souvent une suite de mots grâce à des opérateurs booléens. Venant du nom de George Boole (mathématicien britannique) ces opérateurs permettent d'élargir ou de restreindre la recherche en imposant certains mots et en en excluant d'autres. Il existe plusieurs opérateurs booléens :
Voir le cours
Terme générique pour tout service de recherche d'information sur le Web, combinant bien souvent désormais les procédés d'un répertoire et ceux d'un moteur de recherche, plus parfois de moteurs spécialisés.
Page HTMLdont le contenu n'est pas situé dans un fichier enregistré sur le serveur mais générées "à la volée" par une application informatique à partir d'un modèle de document HTMLen accédant à des informations situées dans une (ou des) base(s) de données. Les techniques utilisées sont variables, CGI langage de script, API propriétaires permettant de créer un lien entre la base de données et le serveur HTTP.
Page HTMLdont le contenu est situé dans un fichier figé, enregistré sur le serveur Web.
Synonyme : notoriété. Mesure le nombre et la qualité des liens pointant vers une page particulière. Plusieurs moteurs de recherche utilisent de plus en plus ce procédé dans le processus de tri.
Terme générique pour désigner un site qui sert de point d'entrée sur l'Internet pour un nombre important d'utilisateurs. Un site portail offre une multitude de contenus, outils et services différents depuis la page d'accueil, Certains sont des répertoires professionnels organisés autour d'une thématique particulière, dotés d'un moteur de recherche interne, et d'autres ne sont que les points d'entrée sur l'internet offerts par les FAI à des abonnés grand public. Certains sont maintenus par des sociétés, d'autres par des particuliers, certains tendent à rendre captif un groupe d'internautes utlisateurs, d'autres ne cherchent qu'à renseigner. On considère également qu'un site doit générer beaucoup de trafic (surtout grand public) pour recevoir la qualification de portail et baser son offre sur les 3 axes suivants : recherche d'information, outil de communication (courriel, messagerie instantanée) et commerce en ligne.
Processus de classement des sites, des pages Web dans un moteur de recherche ou un répertoire afin que les sites les plus pertinents apparaissent en premier sur la page résultat lors d'une requête.
Affichage d'une seule adresse pour chaque site Web sur la page des résultats d'un outil de recherche. Cette méthode permet d'éviter qu'un petit nombre de sites occupe toutes les premiéres positions de résultats et en facilite la lecture pour l'utilisateur.
Voir le cours.
Répertoire ayant pour vocation d'ndexer tous les sites et qui n'effectuent une censure que sur la base de principes prédéfinis (par exemple, des sites manifestement illégaux ou dont le référencement cherche à induire l'internaute en erreur). Exemples : Yahoo, Nomade
Répertoire dont les sites répertoriés relèvent tous d'un domaine ou d'un secteur particulier (le vin, le tourisme, le sport, l'agriculture, etc.). Un répertoire spécialisé peut, par exemple, ne prendre en compte que les entreprises d'un secteur, ou les produits d'un domaine.
Répertoire dont les gestionnaires privilégient les sites de meilleure qualité et excluent les sites qu'ils n'estiment pas suffisamment intéressants. Exemple : bonWeb.com
Répertoire dont l'enrichissement est effectué par différentes équipes d'internautes. Ces répertoires confient la responsabilité d'une ou plusieurs catégories soit à des internautes experts reconnus dans leur domaine et rémunérés pour leur prestation (exemple : About.com), soit à des internautes bénévoles dont la compétence dans le domaine couvert par cette catégorie a été vérifiée. Ces internautes reçoivent alors les demandes de référencement de leur catégorie, décident ou non de référencer les sites et, le cas échéant, rédigent eux-mêmes la description du site (exemple : DMoz - Open Directory Project). Certains répertoires contributifs sont définis par des experts sélectionnées (exemple : Argus Clearing House).
Synonymes : listes de listes, répertoires de répertoires - Répertoires spécialisés dans le référencement de répertoires et d'outils de recherche (moteurs de recherche, méta-moteurs, etc.). Exemple : 7alpha, Beaucoup
Synonymes : query, terme recherché. Mot, expression ou groupe de mots employés pour interroger un outil de recherche afin de localiser des pages sur le sujet recherché.
Voir le cours
Programmes de navigation qui suivent les liens hypertextes des pages Web mais qui ne sont par directement sous contrôle humain. Exemples : les spiders ou araignées des moteurs de recherche.
Fichier texte déposé dans le répertoire principal d'un site Web pour interdire l'accès aux robots de certaines pages ou sous-répertoires du site.
Désigne l'ensemble des documents pertinents non retrouvés lors d'une recherche.
Voir le cours.
Création ou modification d'un document avec l'intention de tromper un répertoire ou un système de classement automatique. Toute technique visant à augmenter le positionnement (ranking) potentiel d'un site aux dépens de la qualité du corpus de l'outil de recherche. Peut également être considérée comme du spamdexing.
Le fait de modifier sa page Web afin que les moteurs de recherche traitent la page comme la plus appropriée pour une requête spécifique, ou un ensemble de requêtes.
Méthode de classement automatique des résultats retournés par le moteur de recherche qui s'appuie sur le calcul d'un score pour chaque réponse. La pertinence est alors basée sur des facteurs comme :
Méthode de classement automatique des résultats
retournés par le moteur de recherche qui s'appuie soit sur
le principe de citation (popularité) soit sur la mesure de
l'audience.
Dans le premier cas, l'importance d'une page est évaluée
en fonction des liens hypertexte qui pointent vers elle et en fonction
de la nature du document qui la cite. Le tri est alors indépendant
du contenu, mais les documents récents ou peu cités
par les autres sont défavorisés. Google avec son système
de PageRank en est l'exemple le plus connu.
Dans le second cas, l'importance d'une page est fonction du nombre
de visites reçues lors d'une requête sur un moteur
de recherche. C'est l'analyse du comportement de l'internaute qui
détermine la popularité d'une page par rapport à
un mot-clé. Solution DirectHit utilisée par HotBot
et LookSmart par exemple.
Avant toute recherche complexe, il convient de comprendre et préciser le sujet.
--> Suite Préparer sa recherche
Pour chaque ressource pertinente trouvée, il est très utile de consulter la bibliographie citée par l'auteur. Celle-ci permet en effet d'avoir rapidement une liste de références sur le sujet. Il ne reste plus ensuite qu'à les trouver et consulter leurs références...
Après la démarche préalable (recherche documentaire) vous devez pouvoir répondre aux question suivantes :
Définir le type de recherche à effectuer :
et donc le type d'information
Pour vous aider dans le choix des mots clefs et des synonymes (français et anglais), vous pouvez utiliser Rameau, Le grand dictionnaire terminologique et la section Dictionnaires et encyclopédies des outils.
A l'aide de ces différentes réponses, vous êtes en mesure de choisir
Attention, vu la spécificité des outils, des mots clés génériques peuvent être utilisés sur un répertoire mais sur un moteur les résultats donneront beaucoup trop de bruit. Inversement, des termes trop précis dans un annuaire risquent de ne pas donner de réponse ! D'autre part, les différents outils de recherche n'utilisent pas toutes ces possibilités et chacun possède un langage d'interrogation spécifique. Cette remarque peut donc aussi déterminer le choix de l'outil approprié. Les sites suivants peuvent vous y aider :
Plan de la page :
Pour la plupart des outils, global change donnera les mêmes résultats que change global. Mais ce n'est pas le cas pour tous. En effet, certains outils accordent un poids au mot en fonction de sa position : le premier mot sera plus important que le deuxième. Le nombre de résultats sera le même mais ils seront triés différemment. Si l'on utilise un outil qui ne tient pas compte de l'ordre des mots, l'utilisation des guillemets permet de l'y obliger : "global change"
Beaucoup de moteurs excluent les mots fréquents (a, and, any, as, be, but, is...) ce qui peut être problématique pour certaines recherches.
Attention aussi en utilisant un moteur non francophone, les mots tels que "le, la, les, ..." seront pris comme un mot clé (résultat : beaucoup de bruit. )!
Comportement
de certains moteurs vis à vis des mots fréquents (stop
words)
<http://www.searchengineshowdown.com/features/byfeature.shtml#stop>
La plupart des moteurs sont insensibles à la casse (il y'a quelques temps la plupart des moteurs la respectait !).
Il semble que désormais, seul AltaVista soit entièrement sensible à la casse à condition de mettre le mot recherche entre " ou en utilisant le formulaire de recherche avancé ou l'assistant de recherche. (Source : Web Search Tip of the Day A Case (of) Sensitive Search <http://searchenginewatch.com/webmasters/article.php/2167851>).
Comportement
de certains moteurs vis à vis de la casse
<http://www.searchengineshowdown.com/features/byfeature.shtml#case>
La plupart des moteurs tiennent compte des accents, particulièrement les outils francophones, mais pas tous.
Certains moteurs cherchent automatiquement le pluriel d'un mot au singulier (en fait ils effectuent une troncature par défaut c'est-à-dire que chat cherchera chat, chats, chatte, chattes, chaton, chatière, chatouille, chateaubriand...). Pour ceux qui ne le font pas, l'utilisation de la troncature permet de chercher le pluriel et le singulier.
< booléens - proximité - phrase - générique - champs - limites - imbriquée - naturel - Outils - top>
Syntaxe
de certains moteurs vis à vis des opérateurs booléens
<http://www.searchengineshowdown.com/features/byfeature.shtml#boolean>
Les internautes ont pris l'habitude de taper un ou deux mots-clés séparés par un espace. L'espace est compris de deux manières différentes par les outils de recherche : un ET ou un OU, le OU par défaut étant le plus fréquent. Attention donc, lorsque l'on cherche global change, beaucoup d'outil chercheront en fait les pages contenant global, change ou les 2 c'est-à-dire beaucoup de bruit. .
Opérateur
par défaut de certains moteurs
<http://www.searchengineshowdown.com/features/byfeature.shtml#defaults>
Associer deux mots (ou plus) à une recherche est une excellente méthode, qui donne en général d'assez bons résultats en réduisant considérablement le nombre de pages trouvées. Pour effectuer une recherche AND, chaque outil a sa méthode. Voici les plus courantes :
|
|
Associer deux mots différents avec l'opérateur OR n'est pas vraiment à conseiller dans la mesure où le nombre de résultats trouvés est en général impressionnant. Cela peut cependant être utile dans le cas où votre recherche peut s'exprimer de différentes manières (synonymes et concept liés). De même, les méthodes diffèrent en fonction de l'outil:
![]() |
|
Ce peut être une excellente solution aux mots désignant plusieurs concepts ou lorsque l'on sait que tel type d'information ne nous sera d'aucune utilité. Cette méthode permet de réduire le bruit. .
![]() |
|
< généralités - proximité - phrase - générique - champs - limites - imbriquée - naturel - Outils - top>
2004 : ATTENTION ! depuis la fusion d'AltaVista, AlltheWeb et Inktomi en "Yahoo! Search" des fonctionalités de recherche qui n'existaient plus que sur ces moteurs ont disparu. C'est le cas de la recherche de proximité.
Cet opérateur n'existe que sur certains moteurs et n'est souvent accessible qu'à partir du formulaire de recherche avancée. Il permet de rechercher deux mots qui doivent obligatoirement se situer l'un près de l'autre.
Comportement de certains moteurs vis à vis de l'opérateur de proximité <http://www.searchengineshowdown.com/features/byfeature.shtml#proximity>
< généralités - booléens -phrase - générique - champs - limites - imbriquée - naturel - Outils - top>
Pour rechercher une expression, il suffit de la mettre entre guillemets.
< généralités - booléens - proximité - générique - champs - limites - imbriquée - naturel - Outils - top>
2004 : ATTENTION ! depuis la fusion d'AltaVista, AlltheWeb et Inktomi en "Yahoo! Search" des fonctionalités de recherche qui n'existaient plus que sur ces moteurs ont disparu. C'est le cas de la troncature.
Le caractère générique permet de remplacer n'importe quelle lettre ou chaîne de caractères. En plaçant une * (? ou%) à la suite d'un mot ou du début d'un mot, vous recherchez toutes les orthographes possibles de ce mot.
Comportement
de certains moteurs vis à vis de la troncature
<http://www.searchengineshowdown.com/features/byfeature.shtml#truncation>
< généralités - booléens - proximité - phrase - champs - limites - imbriquée - naturel - Outils - top>
C'est une fonction mal connue et néanmoins très utile des moteurs de recherche. Elle permet de restreindre la recherche à certaines parties des pages Web, ce qui peut être très utile lorsque l'on obtient des résultats trop abondants.
2004 : ATTENTION ! depuis la fusion d'AltaVista, AlltheWeb et Inktomi en "Yahoo! Search" des fonctionalités de recherche qui n'existaient plus que sur ces moteurs ont disparu. C'est le cas de la recherche par taille de fichier et par IP ainsi que de la recherche dans les contenus textuels des fichiers flash.
Là encore, chaque moteur utilise sa propre syntaxe. Voici quelques exemples de ces champs :
La
recherche par champs de certains moteurs
<http://www.searchengineshowdown.com/features/byfeature.shtml#fields>
Recherche les mots clés uniquement dans le titre des pages Web.
Exemple : title:leucose - t:leucose
La recherche se fait dans l'adresse Web. On peut donc chercher un mot dans une url ou un domaine.
Exemple :
url:darwin - u:darwin
- - host:darwin - domain:com
- site:com
Pour restreindre la recherche à un pays, on utilise les codes nationaux (site:.be)
Ce champ permet de chercher les pages possédant un lien vers un site donné. Cette recherche peut être intéressante car un site pertinent pour une recherche sera sûrement référencé par d'autres sites pertinents du même thème.
Exemple : link:www.fundp.ac.be
< généralités - booléens - proximité - phrase - générique - limites - imbriquée - naturel - Outils - top>
En règle générale, mais souvent dans les formulaires de recherche avancée, il est possible de limiter la recherche à certains critères comme la date, la langue, la région, le format de fichier,...
Les
limites de recherche de certains moteurs
<http://www.searchengineshowdown.com/features/byfeature.shtml#limits>
Les dates prises en compte sont soit celles de dernière mise à jour, soit celle de l'inscription (ou de l'indexation) du site. Elles sont souvent réduites à une période (les 3 derniers mois, les 6 derniers mois, l'année écoulée).
Cette fonctionalité très intéressante a été inaugurée par Google mais est disponible maintenant sur quelques moteurs. Elle permet de ne chercher que des fichiers pdf (Adobe) ou doc (MSWord) par exemple, ce qui est particulièrement intéressant quand on sait que de nombreux dossiers de fond, rapports, articles ... sont sous ces formats.
Exemple : filetype:pdf ou type:pdf
< généralités - booléens - proximité - phrase - générique - champs - imbriquée - naturel - Outils - top>
La recherche imbriquée permet d'utiliser plusieurs opérateurs à l'aide de parenthèses.
Cependant, ces recherches demandent de l'habitude et ne donnent pas toujours de meilleurs résultats que 2 bons mots clés associés à l'aide de l'un des opérateurs ci-dessus. En tout état de cause, il vaut mieux ne pas rendre la question trop complexe.
< généralités - booléens - proximité - phrase - générique - champs - limites - naturel - Outils - top>
La recherche en langage naturel consiste à poser une question sous forme de phrase au moteur comme "où trouver un plan de Bruxelles ?". Il interroge alors une base de données composée de questions déjà posées par les internautes et dont il possède la réponse. L'outil tente de rapprocher la question de l'une de celle de sa base de données. Les résultats sont composés d'une liste de ces questions.
Exemple :
Qu'est-ce que l'anthrax ? Sur infoclic (n'existe plus)
:
Qu'est-ce que le Patriot Act ? Sur Brainboost
Ce principe est intéressant mais est décevant pour des questions pointues.
< généralités - booléens- proximité - phrase - générique - champs - limites - imbriquée - Outils - top>
Pour beaucoup de sites, il n'est pas nécessaire de consulter un annuaire ou un moteur. En effet, lorsque l'on cherche un site dont on connaît l'institution, la société ou l'organisation, il est relativement facile de deviner l'adresse de ce site, à condition de bien comprendre comment sont formées les URL.
La recherche intuitive permet aussi de retrouver une page qui n'existe plus (erreur 404) ou des liens morts.
Coupez l'url à partir de la droite jusqu'à chaque /.
Les liens suivants peuvent vous aider à choisir l'outil ou le type d'outil dont vous avez besoin en fonction de votre recherche.
Les solutions proposées ici ne sont que des propositions. Elles utilisent pour la plupart les pages de la section outils.
R. Recherche sur Answers
--> Taper microscope dans le champ de recherche
-->Nous obtenons immédiatement une page de résultat
comprenant des définitions du mot "microscope"
et des articles encyclopédiques issus de plusieurs dictionnaires
et encyclopédies de référence, les traductions,
des liens de qualité sur le sujet, des sujets connexes,...
Voir
le résultat
R. Recherche dans l'encyclopédie
Atlas
(Webencyclo). Ici l'information est gratuite mais il est nécessaire
de s'inscrire.
-->Après s'être identifié, taper microscope
dans le champs de saisie
-->Dans la liste des résultats, choisir microscope
-->Voir
le résultat
R. Recherche d'un guide
-->Librarians'
Index to the internet, taper microscope
-->Le lien Introduction to Microscopy semble être
intéressant
-->Voir
le résultat
Avant de commencer une recherche bibliographique sur un sujet, il faut toujours se demander si quelqu'un n'a pas déjà fait cet effort. Cela n'empêche évidemment pas de la compléter en bibliothèque ou sur Internet (articles et/ou abstract des revues en ligne).
S'il est vrai que sur l'Internet on trouve en général ce que l'on cherche (à condition de bien chercher), on y trouve aussi n'importe quoi. Or il n'est pas si évident de distinguer les informations fiables de celles qui relèvent de la désinformation ou du manque d'information.
Contrairement aux éditions papier ou même électroniques (CD-ROM), l'Internet ne bénéficient en général pas de la revue par les pairs (Peer-Review) ni d'aucune autre évaluation. La facilité de créer un site Web permet à n'importe qui d'éditer, via l'Internet, ce qu'il veut.
On trouve ainsi, sur un sujet déterminé, des pages personnelles (qui ne sont pas toujours les moins fiables), des sites commerciaux, des sites universitaires, des sites gouvernementaux, des sites d'organisations internationales... La qualité des informations disponibles est donc elle aussi très variable.
D'autre part, les informations peuvent être disponibles dans différents formats et peuvent changer ou disparaître d'un jour à l'autre.
Premier indice de crédibilité, l'URL. Comme vu dans Comprendre l'URL d'un site, on peut déduire beaucoup de chose d'une URL , en particulier le domaine d'activité (société commerciale, université, ONG,...). Cependant, si l'analyse de l'URL d'un site donne de bons indices, ceux-ci sont loin d'être suffisants pour se faire une opinion définitive sur la qualité de l'information que l'on y trouve.
La source d'un document doit pouvoir être identifiée avec certitude. Si elle ne se trouve pas sur la page concernée, il convient de remonter les pages jusqu'à obtenir le nom de l'auteur (si possible ses qualifications sur le sujet concerné : son CV) et le nom de l'institution s'il y a lieu.
Une fois la source obtenue, vérifiez si le nom de l'institution correspond à l'URL, si l'adresse de contact de l'auteur est l'adresse de l'institution, si le mail de contact correspond à l'institution. Attention ce n'est pas toujours le cas, mais ce sont de bons indices de crédibilité.
Si la source ne peut-être obtenue, il vaut mieux ne pas utiliser l'information. De toute façon, ces informations sont nécessaires pour citer le document.
La date de création et la date de dernière mise à jour sont aussi des critères essentiels pour évaluer la crédibilité d'une information. Attention, il faut bien distinguer la date de mise à jour de la forme de celle du contenu, mais bien souvent ces deux dates ne sont pas distinguées. Si la date ne se trouve pas sur la page concernée (généralement visible dans le pied de la page) procédez de la manière décrite plus haut pour l'obtenir. Enfin, certains webmasters oublient de changer la date de mise à jour . Se fier dès lors à des éléments internes au texte du site : par exemple des nouvelles datées, des allusions à des faits passés, présents ou futurs (" en 2001 les travaux porteront sur ") etc.
D'autre part, l'actualité d'une information doit être relativisée en fonction du sujet. Il est des sciences qui évoluent au jour le jour (c'est souvent le cas en médecine et en biologie moléculaire), d'autre qui ne change pas pendant des années (systématique, ...).
De plus, des sites peuvent être de qualité lors de leur création et se laisser rapidement dépasser par les événements.
Si le contenu de la page n'est pas original ou contient des informations relatives à d'autres travaux (informations secondaires), les sources originales doivent être indiquées.
In fine, l'évaluation d'un document électronique doit pouvoir répondre aux questions suivantes :
Tout document utilisé dans la rédaction d'un rapport, d'un mémoire, d'une thèse ou d'un article, qu'il soit papier ou électronique, doit être cité. Mais, pas n'importe comment! Il existe en effet des règles strictes pour citer un document qu'on ne peut outrepasser, même pour un travail d'étudiant. Autant apprendre ces règles le plus tôt possible avant de prendre de mauvaises habitudes.
Auteur (Organisme ou auteur personnel dans le cas d'une page personnelle). Titre de la page d'accueil, [Type de support]. Adresse URL: fournir l'adresse URL de la ressource (date: jour, mois, année de la consultation par l'usager)
Exemple: Université Laval. Bibliothèque. Site de la Bibliothèque de l'Université Laval, [En ligne]. http://www.bibl.ulaval.ca/ (Page consultée le 8 mai 1996)
Auteur. «Titre de la ressource». [S'il y a lieu, ajouter la ressource plus large à laquelle le document cité est rattaché; procéder de la façon suivante: In Auteur/titre ou titre du site ou du document qui contient la ressource.] [Type de support]. Adresse URL: fournir l'adresse URL de la ressource (date: jour, mois, année de la consultation par l'usager)
Exemple :Caron, Rosaire. «Comment citer un document électronique?». In Université Laval. Bibliothèque. Site de la Bibliothèque de l'Université Laval, [En ligne]. http://www.bibl.ulaval.ca/doelec/citedoce.html (Page consultée le 27 mars 2000)
Nom du groupe [Type de support]. Adresse par courrier électronique (e-mail): listserv@adresse e-mail
Exemple : Alcohol & Drug Studies [En ligne]. Adresse par courrier électronique: alcohol@lmuacau.bitnet
Auteur du message. Sujet du message [Discussion]. Nom du groupe [Type de support]. (année, jour mois). Adresse par courrier électronique (e-mail): listserv@adresse e-mail
Remarque : [Discussion] dans le cas ou la citation fait référence à une discussion entre plusieurs intervenants.
Exemple : Leslie, Deborah J. Public vs. technical services: a new attack [Discussion]. Library Cataloging and Authorities Group [En ligne]. (1994, 22 septembre). Adresse par courrier électronique: autocat@ubvm.bitnet
Auteur. Sujet [Discussion] [En ligne]. (année, jour mois). Adresse (e-mail): Groupe de nouvelles Usenet: nom du groupe
Exemple: Palo, G. The Taj Mahal is a Hindu temple [Discussion] [En ligne]. (1993, 7 janvier). Adresse: Groupe de nouvelles Usenet: soc.history
Auteur. Sujet du message. (année, jour mois). [Courrier électronique (e-mail) à la personne qui reçoit le message], [En ligne]. Adresse par courrier électronique: adresse électronique (e-mail) de la personne qui reçoit le message
Exemple: Bourgault, Thérèse. Production d'étiquettes. (1995, 9 janvier). [Courrier électronique à Rosaire Caron], [En ligne]. Adresse par courrier électronique: rosaire.caron@bibl.ulaval.ca
Auteur. Titre (édition) [Type de support]. date. Adresse par FTP: Répertoire: Fichier
Exemple: Clinton, Bill. Clinton/Gore on issues of concern to gays and lesbians [En ligne]. 1992. Adresse par FTP: nptn.org Répertoire: pub/campaign.92/clinton.dir Fichier: c71.txt
Toutes ces règles sont issues du document suivant :
Caron, Rosaire. "Comment citer un document électronique? Genres de documents électronique ". In Université Laval. Bibliothèque. Site de la Bibliothèque de l'Université Laval, [En ligne]. http://www.bibl.ulaval.ca/doelec/doelec29.html (Page consultée le 26 octobre 2001)
Vous êtes libres :
Selon les conditions suivantes :
![]() |
Paternité. Vous devez citer le nom de l'auteur original. |
![]() |
Pas d'Utilisation Commerciale. Vous n'avez pas le droit d'utiliser cette création à des fins commerciales. |
![]() |
Partage des Conditions Initiales à l'Identique. Si vous modifiez, transformez ou adaptez cette création, vous n'avez le droit de distribuer la création qui en résulte que sous un contrat identique à celui-ci. |
Ce qui précède n'affecte en rien vos droits en tant qu'utilisateur (exceptions au droit d'auteur : copies réservées à l'usage privé du copiste, courtes citations, parodie...)
Ceci est le Résumé Explicatif du Code Juridique (la version intégrale du contrat) <http://creativecommons.org/licenses/by-nc-sa/2.0/be/legalcode.fr>.
Ce document est publié sous licence "CreativeCommons", AERIS, http://aeris.fr.tc © Guillemette Lauters 1999-2006