Imprimer

Ce document est publié sous licence "CreativeCommons", © Guillemette Lauters 1999-2006
Imprimé le 13/3/2010

AERIS - Cours - Objectifs

Objectifs spécifiques

Objectifs d'apprentissage

Le but de ce cours est de permettre à l'étudiant de devenir rapidement autonome dans le domaine de la recherche d'information sur Internet et ce sur le long terme. [partie encore en cours de rédaction]

Contenu

 

AERIS - Cours - Résumé

Sur Internet on trouve toutes sortes d'informations, cela va des articles scientifiques en ligne jusqu'à la commande de billet d'avion en passant par la discussion en direct, ...
>> 1. Que trouve-t-on sur Internet?.

Internet, réseau international d'ordinateurs hétérogènes communiquant grâce aux protocoles de la famille TCP/IP, a été créé dans les années 70. Ses services sont vastes et englobent aussi bien le Web, système réparti de recherche documentaire en mode hypertexte, et le courrier électronique que les informations fournies par les groupes de discussion, les news, les forums, mais aussi par FTP, Telnet, et Gopher.
>>2 Historique d'Internet et >>3 Les services d'Internet.

De plus on peut trouver toutes sortes de documents sous différents formats de fichiers (textes, images, vidéos, sons, application,...). Afin de lire et utiliser ces fichiers, il faut posséder les logiciels appropriés.
>>4 Documents et formats.

Si l'on trouve de tout sur Internet, il convient de rester attentif au fait que l'information y est hétérogène, instable, multilingue... et que l'information n'y est pas toujours fiable. De plus, aucun des outils de recherche ne couvre la totalité des ressources.
>>5 Caractéristiques de l'information sur Internet.

La plus grande partie des ressources Web ne sont pas accessibles via les outils de recherche communs. C'est ce qu'on appelle le Web invisible .
>>6 Le Web invisible.

Pour bien s'y retrouver, il faut tout d'abord comprendre comment sont formées les URL des sites. En effet, elles se basent toutes sur le même principe : protocole://ordinateur/repertoire/fichier.html#ancre .
>>7 Comprendre l'URL d'un site.

Ce système facilite grandement la recherche intuitive de site dont on connaît le nom. Cela permet aussi de retrouver une page qui " n'existe plus " sans devoir passer par un outil de recherche.
>>8 La recherche intuitive .

Néanmoins, cette méthode est largement insuffisante pour la plupart des recherches sur Internet. Il existe heureusement de nombreux outils qui permettent de les faciliter. Ces outils sont représentés essentiellement, mais pas uniquement, par les moteurs de recherche et les annuaires. Chaque famille d'outil possède ses avantages et ses inconvénients en fonction du type de recherche.
>>9 Typologie des outils de recherche sur Internet.

Vu leur nombre et leur spécificité (un moteur ne fonctionnera pas exactement comme un autre) , il est utile de choisir un certain nombre de ces outils, de bien les connaître et de les utiliser régulièrement. Cela n'empêchant évidemment pas de consulter d'autres outils plus pertinents en fonction de la recherche.
>>10 Boîte à outils.


La recherche sur Internet diffère très peu, du point de vue de la méthodologie, de la recherche documentaire classique.
>>11 Méthodologie de la recherche documentaire

Les étapes préalables à la recherche permettent de répondre à un certain nombre de questions (type d'information recherchée, type de document, quantité d'information, limites de la recherche, ...), de traduire la recherche en mots-clés et finalement de choisir le service d'Internet et la famille d'outils les plus pertinents en fonction de ces différents paramètres.
>>12 Préparer sa recherche.

Les outils de recherche, à de rares exceptions près, ne comprennent pas le langage humain. Il faut donc traduire la question dans un langage d'interrogation propre à l'outil choisi.
>>13 Exprimer sa recherche (requête et opérateurs booléens)

Ce choix n'est pas toujours facile et il n'y a hélas pas de solution miracle, nous ne donnerons ici que quelques exemples.
>>14 Choisir le bon outil (exemples).

Une fois les documents pertinents trouvés, il peut être utile de consulter leurs références pour cerner le sujet. Il reste ensuite à évaluer, classer et traiter l'information afin de la communiquer. Ce sont les dernières étapes de la recherche documentaire, qu'elle soit classique ou sur Internet. Néanmoins, on n'évalue pas un livre de la même façon qu'une page Web. En effet, sur le Web, n'importe qui peut éditer n'importe quoi, dès lors il est indispensable de savoir évaluer les ressources issues de ce média.
>>15. Evaluer les ressources.

Pour finir, comme toutes références, les ressources issues d'Internet doivent être citée selon des règles précises.
>>16. Citer les références.

AERIS - Cours - Table des matières

Prérequis

  1. Utilisation d'un ordinateur
  2. Utilisation des navigateurs
  3. Utilisation des signets (bookmarks)

Comprendre le Net

  1. Que trouve-t-on sur Internet?
    Une sélection d'exemples variés de ce que l'on peut trouver sur Internet  
  2. Historique d'Internet  
  3. Les services d'Internet
    Qu'est-ce qu'Internet, quels sont ses services? (Web, E-mail, News, FTP, Telnet, Gopher)  
  4. Documents et formats
    Quels types de documents trouvent-on sur le net? Comment les visualiser?...  
  5. Caractéristiques de l'information sur Internet  
  6. Le Web invisible
    Qu'est-ce que le Web invisible?  
  7. Les Weblogs
    Qu'est-ce qu'un Weblog?  
  8. Comprendre l'URL d'un site
    L'URL (l'adresse) d'un site ou d'une page donne de nombreuses informations  
  9. Internet, quelques définitions  
  10. La signification des messages d'erreurs
    Qu'est-ce qu'une erreur 404? 303?...

Connaître les outils

  1. Les moteurs
    Pour une recherche précise : "pages sur la sociobiologie des abeilles". Que recherchent-t-ils? Comment fonctionnent-ils?  
  2. Les annuaires
    Pour une recherche thématique de sites : "site sur les insectes". Que recherchent-t-ils? Comment fonctionnent-ils?  
  3. Les métamoteurs
    Ils permettent de dégrossir rapidement une recherche. Que recherchent-t-ils? Comment fonctionnent-ils?  
  4. Les encyclopédies  
  5. Les sites fédérateurs et les guides
    Sites recensant "toutes" les ressources dans un domaine précis. Recherche large dans un domaine précis.  
  6. Les Webrings
    Anneaux de sites traitant d'un même thème reliés entre eux. Recherche large dans un domaine précis. 
  7. Spécificités de certains moteurs
    Quelles sont les spécificités des moteurs préférés des professionnels ? Quels sont les nouveaux moteurs à surveiller ? Quelles sont les nouvelles tendances des outils de recherche ?  
  8. Boîte à outils
  9. Glossaire sur la recherche d'information sur Internet

Chercher

  1. Méthodologie de la recherche documentaire
  2. Préparer sa recherche  
  3. Exprimer sa recherche (requête et opérateurs booléens)
    Les outils de recherche, à de rares exceptions près, ne comprennent pas le langage humain. Il faut donc traduire la question dans un langage d'interrogation propre à l'outil choisi.  
  4. La recherche intuitive
    La recherche intuitive permet de trouver le site d'un organisme dont on connaît le nom, de retrouver une page disparue...  
  5. Choisir le bon outil (exemples)  
  6. Evaluer les ressources
    N'importe qui peut éditer n'importe quoi sur Internet, il est donc indispensable de savoir évaluer les ressources.  
  7. Citer les références
    Comme toutes références, les ressources issues d'Internet doivent être citée selon des règles précises.

Références et ressources

  1. Recherche sur Internet
  2. Le Web invisible
  3. Weblogs sur la recherche d'information
  4. Recherche documentaire
  5. Evaluation des sites Web
  6. Citer les références
  7. Autres ressources

AERIS - Cours - Chercher - La recherche intuitive

Composants et fonctionnement de base d'un ordinateur
Manipulation de disquettes et de cd(dvd)-rom
Maîtrise du clavier et de la souris

Environnements graphiques de types Windows, Mac ou KDE 

Windows

Mac

Linux

Mise en route et fermeture d'une application,
Manipulation des fenêtres d'applications et de documents

Manipulation de fichiers et de répertoires

AERIS - Cours - Prérequis - Utilisation des navigateurs

< Mozilla - Netscape - Internet Explorer - Synthèses/Comparaisons - Lynx >

Voir aussi la page logiciels

Mozilla

En français

Netscape

En français
En anglais

Internet explorer

En français

Synthèses - Comparaisons

En anglais

Lynx

En français
En anglais

AERIS - Cours - Prérequis - utilisation des signets

< Ajouter un bookmark - Organiser les bookmarks >

Vous avez aussi la possibilité d'exporter vos bookmarks (Signets dans Netscape ou Favoris dans Internet Explorer) au format HTML à partir de votre navigateur. En enregistrant ce fichier sur une disquette, vous pouvez avoir vos signets à disposition sur n'importe quel ordinateur.

Certains sites permettent de définir vos bookmarks personnels et même d'importer le fichier html créé par votre navigateur, après avoir sélectionné un nom d'utilisateur et un mot de passe. Cela vous permet de pouvoir accéder à vos bookmarks quel que soit la machine (connectée à Internet) que vous utilisez. A titre d'exemple, My Yahoo!, disponible à partir de la page d'accueil de Yahoo! possède cette fonction.

Ajouter un Bookmark

Lorsque vous vous trouvez sur un site intéressant et que vous désirez pouvoir y accéder facilement, lancez la commande Add Bookmark (Ajouter un signet dans Netscape version française et Ajouter aux Favoris dans Internet Explorer) du menu Bookmarks (Signets, Favoris). Ou encore, utilisez le raccourci commande + D. Le nom du site se trouvera alors en bas de la liste des bookmarks (accessible en sélectionnant le menu Bookmarks, Signets ou Favoris). Pour visiter le site, il suffit alors de sélectionner son nom.

Organiser les bookmarks

Avec Netscape et Internet explorer, vous avez la possibilité d'organiser vos bookmarks (Favoris>Organiser les Favoris ou commande+B). C'est un outil essentiel pour la recherche documentaire et pour la navigation sur Internet en général. En effet, vous pouvez regrouper vos sites dans des dossiers et sous-dossiers et organiser ainsi vos bookmarks de façon hiérarchique et structurée. Cela vous permet de retrouver rapidement les sites traitant d'un sujet donné.

D'autre part, si le titre de la page proposé par l'auteur de la page ne vous parle pas, changez-le sans hésiter. Il est en effet fréquent qu'un signet ne serve pas pendant des mois.

Il existe, par ailleurs, des logiciels qui vous permettent de mieux gérer vos bookmarks. Le site Mégagiciel en donne une liste <http://www.megagiciel.com/logiciels/313.html> non exhaustive.

AERIS - Cours - Comprendre Internet - Qu'y trouve-t-on ?

De tout et n'importe quoi :

AERIS - Cours - Comprendre Internet - Historique

< 60 - 70/80 - 80/90 - En savoir plus >

Les années 60 : contexte de guerre froide

En 1957, suite au lancement du premier Spoutnik par les Soviétiques, le président Dwight D. Eisenhower crée l'ARPA (Advanced Research Project Agency) au sein du DoD (Department of Defense) pour piloter un certain nombre de projets dans le but d'assurer aux USA la supériorité scientifique et technique sur leurs voisins Russes. Cette organisation regroupait certains des plus brillants cerveaux américains qui développèrent le premier satellite opérationnel des US en 18 mois. Quelques années après, l'ARPA commença à s'intéresser aux réseaux d'ordinateurs et aux technologies de la communication.

En 1967, Lawrence G. Roberts, récemment arrivé à la tête du projet de réseau informatique à l'ARPA, publie ses "Plans pour le réseau ARPANET" au cours d'une conférence. Lors de cette conférence sera aussi publié un papier sur un concept de réseau à commutation de paquets par Donald Davies et Robert Scantlebury du NPL (National Physical Laboratory Royaume Uni) et également un article de Paul Baran de la Rand Corporation (militaires) au sujet de l'utilisation d'un réseau à commutation de paquet pour transmission sécurisée de la voix. Les militaires s'inquiétaient en effet de voir les dirigeants privés de communication si les lignes de téléphones disparaissaient après un bombardement. Ainsi le projet de la Rand s'intéressait à l'idée des paquets passant de noeud en noeud ayant la même autorité sans système central, une anarchie technologique qui même en cas de destruction partielle du réseau, en cas de guerre nucléaire pourrait continuer à fonctionner. Il est amusant de noter que ces groupes ont travaillé en parallèle sur des concepts similaires et sans avoir connaissance des travaux des autres pour aboutir en même temps à la même conclusion !

C'est aussi à cause de la similitude entre le projet de la RAND et le projet de l'ARPA qu'est née la fausse rumeur selon laquelle le réseau Arpanet avait été lancé à cause du besoin de relier les ordinateurs entre eux par un réseau insensible aux destructions d'une guerre nucléaire.

Les années 70/80 : Arpanet et le protocole TCP/IP

Opérationnel en 1969, le réseau Arpanet ne relie initialement que 4 instituts universitaires. Après avoir résolu certains problèmes techniques, Arpanet devient réellement opérationnel, permettant aux quatre institutions de transférer des données et d'effectuer à distance certains calculs longs sur plusieurs ordinateurs afin d'aller plus vite.

Tout au long des années 70, les laboratoires de recherche sont progressivement reliés au réseau Arpanet. Contrairement aux réseaux conventionnels qui ne pouvaient accommoder que des machines de même type, Arpanet présentait un énorme avantage, celui de pouvoir mettre en liaison des machines hétérogènes (Unix, IBM,...) , à condition toutefois qu'elles communiquent toutes selon le même mode. Cette normalisation impliquait une sorte de « charte », un protocole standard universel. Le protocole utilisé sur Arpanet au début des années 1970 s'appelait le NCP (Network Control Protocol). Cependant, dès 1973 on envisage l'établissement d'un nouveau protocole plus performant, capable de mieux acheminer les messages en cas de destruction partielle du réseau en cas de guerre.

Environ dix ans plus tard en 1983, le NCP est définitivement abandonné au profit du TCP/IP que nous utilisons encore aujourd'hui et qui constitue le protocole de base d'Internet. TCP est chargé de segmenter le message en paquets et de réarranger ces derniers à la réception, tandis que IP est chargé d'assurer l'acheminement des paquets d'ordinateur en ordinateur jusqu'à destination.

Les années 80/90 : d'Internet au WWW

En 1977, Internet devient réalité car le TCP/IP est effectivement utilisé pour relier divers réseaux à Arpanet. Le nombre d'ordinateurs connectés dépasse alors la centaine et depuis, ce nombre ne cesse d'augmenter d'année en année.

L'origine du Web remonte à mars 1989 lorsque Tim Berners-Lee, un informaticien au CERN, propose de créer sur le site Internet du CERN un ensemble de documents reliés les uns aux autres par des liens hypertextes, afin de faciliter la recherche d'informations pour les physiciens des particules. En 1991 (300 000 ordinateurs connectés) , alors que le nombre d'ordinateurs connectés atteint les 300 000, le plus grand site Internet au monde est celui du CERN, futur berceau du Web, un vaste ensemble mondial de documents dits hypertextes et hypermédias distribués sur Internet.

En 1992 (1 000 000 de machines connectées), le premier lien vers le site Web du CERN est créé sur le serveur de Fermilab aux États-Unis: la toile mondiale commence à se tisser. Les années 1990 ont vu le Net continuer à grossir à une vitesse exponentielle sous l'impulsion du Web. En 1993, on comptait 600 sites, en 1995 plus de 15 000 , le WWW devient le service le plus important sur Internet.

Aujourd'hui (décembre 2002), le nombre de personnes reliées à Internet est de 580 millions (soit 9.27% de la population mondiale). Quant aux nombres de sites Web il était estimé en juillet 2003 à 42 298 371 (ce qui représente des milliards de pages Web) ! L'augmentation du nombre de sites c'est cependant fortement ralentie, de 53% par an en 1999 à -1%/an en 2002. La croissance négative est due au ralentissement du nombre de nouveaux sites par an associé à la disparition régulière des anciens sites (17% des sites créés en 2001 disparaissaient en 2002). Par contre, les sites eux ont tendance croître annuellement. Le nombre de pages web continue donc d'augmenter. En janvier 2005, Google (qui est le moteur indexant le plus de pages Web à l'heure actuelle), estimait ce nombre à 8 058 044 651 ! Sans compter les pages du Web invisible estimées à 3,5 billion (3,5 1012 ! ) pour à peu près 200 000 sites (2001) !

Par ailleurs, Cyveillance (2004) fait les estimations suivantes :

En savoir plus

Sources utilisées pour cet historique

Histoire

Statistiques


  Un exercice est associé à cette page (exercice 2)
 

AERIS - Cours - Comprendre Internet - Documents et formats

Sur l'Internet, on peut trouver tout type de document :

Chaque type de document est numérisé sous un format spécifique qui nécessite, pour le visualiser ou le retraiter, des logiciels particuliers. Les navigateurs récents intègrent désormais de nombreux "plug-ins" permettant de visualiser certains documents.

Mais pour les autres, sans le logiciel approprié, il est impossible de les consulter. Dans ce cas, il faut reconnaître le format du fichier et chercher un logiciel capable de l'ouvrir.

Pour cela, regardez son extension (exemple : rapport .doc, application.exe...). Puis, effectuez une recherche sur :

Ces outils de recherche spécialisés référencient les extensions et indiquent le programme nécessaire à leur visualisation.

Pour ceux que cela intéresse vous pouvez aussi télécharger le glossaire des extensions de fichiers (.zip - 1.32 Mb) (source : Informatique pratique, <www.infoprat.net> )


  Un exercice est associéà cette page (exercice 4)
 

AERIS - Cours - Comprendre Internet - Caractéristiques de l'info sur Internet

L'information sur internet est

Par ailleurs,

AERIS - Cours - Comprendre Internet - Le Web invisible

Les meilleurs moteurs de recherche indexent moins de 20% du Web. En effet, les outils de recherche (en particulier les moteurs) ne référencient pas les pages suivantes :

Les données relatives à ces documents constituant le Web invisible peuvent être

Le Web invisible contient notamment des bases de données spécialisées très utiles lors de la recherche documentaire (par exemple des bases de données d'articles scientifiques, ...). Heureusement, il existe maintenant des outils de recherche spécialisés dans le Web Invisible (voir les outils Web invisible)!

En savoir plus


Par ailleurs, il existe sur internet une partie encore plus cachée que le Web invisible, ce sont les documents situés sur les machines clientes (votre ordinateur, celui de votre voisin). Il existe des logiciels à télécharger sur votre machine qui permettent de partager avec tous les utilisateurs de ces logiciels, les documents que vous voulez. C'est ce qu'on appelle le "peer-to-peer search system " représenté essentiellement par le protocole Gnutella <http://gnutella.wego.com/>. Ce système permet l'échange de mp3, de vidéo mais aussi de documents ou d'applications.

AERIS - Cours - Comprendre Internet - Comprendre l'URL

L'adresse d'un site (URL) donne de nombreuses informations d'un seul coup d'oeil (si l'URL n'est pas écrite, il suffit de pointer la souris sur le lien, l'URL apparaît en bas du navigateur). Elle se présente de la manière suivante :

protocole://

Protocole utilisé pour le dialogue entre les différentes machines connectées. http est le protocole utilisé pour les pages Web. Il existe d'autres protocoles (par exemple FTP, gopher...).

ordinateur/

Nom de l'ordinateur sur lequel se trouvent les fichiers (nom d'hôte). Ce nom d'hôte est divisé en domaine et sous domaine

Par exemple, www.fundp.ac.be - est un serveur Web (www.) situé en Belgique (be) dans le sous-domaine académique (ac) et il se nomme fundp (Faculté Universitaire Notre-Dame de la Paix à Namur)

Les domaines principaux sont les suivants (Liste complète des domaines <http://www.siteware.ch/Webresources/domains/>) :

  • com : commercial,
  • edu : universités et éducation (US),
  • gov : organismes gouvernementaux,
  • int : organisations internationales,
  • mil : militaires (US),
  • net : réseaux,
  • org : ONG.
  • Un pays est déterminé par son code ISO (be - Belgique, fr - France, uk - Grande-Bretagne, ...)

répertoire/

Répertoire dans lequel se trouve, sur le serveur, le document. Souvent, il existe des sous répertoires.

document.html

Nom de la page Web, ou du fichier (voir documents et formats), demandée

#ancre

Détermine un endroit précis de la page Web

Ainsi, avec l'adresse d'un site on peut savoir s'il est officiel, universitaire, dans quel pays il se situe... Et si l'organisation en répertoires et sous-répertoires est logique (cela dépend du concepteur) on peut avoir une idée du sujet.

Exemple :

Que peut-on dire de la page dont l'adresse est :
http://jama.ama-assn.org/issues/v281n17/rfull/joc81655.html ?

Intuitivement, on peut penser que le document est un article (rfull) du N°17 du Vol 281(v281n17) du journal JAMA (Journal of American Medical Association), situé dans les archives on-line des journaux scientifiques publiés par l'AMA (American Medical Association).

Mais attention, le nom d'un site est parfois trompeur et certaines personnes en tirent profit.

Exemple : http://www.whitehouse.com/ , http://www.whitehouse.org/ vs http://www.whitehouse.gov

En conclusion, si l'analyse de l'URL d'un site donne de bons indices ils sont loin d'être suffisants pour se faire une opinion définitive sur la qualité de l'information que l'on y trouve.


  Des exercices sont associés à cette page (exercices 4 et 5)
 

AERIS - Cours - Comprendre Internet - Quelques définitions

< Internet - Web - Courrier - Liste de discussion - Chat - FTP - Gopher - Telnet >

Définitions tirés de l'encyclopédie libre Wikipédia et du DICTIONNAIRE DE L'INTERNAUTE (IBM) <http://www.can.ibm.com/francais/dico/>.
Vous trouverez d'autres définitions relatives à l'informatique aux adresses recensées <http://globegate.utm.edu/french/globegate_mirror/compdico.html> par le Globe-Gate Project of the University of Tennessee-Martin.


Internet, Net, réseau Internet

L'internet ou Internet est un réseau mondial de réseaux informatiques interconnectés reposant sur le protocole IP. Le terme désigne en anglais n'importe quelle interconnexion de réseaux d'ordinateurs, d'où la contraction : inter + net (abréviation de network, réseau).

Internet sert de support à de nombreux systèmes, notamment le Web (hypertexte) qui en a fait la popularité. Par extension, le terme Internet peut désigner, à tort, le World Wide Web alors que celui-ci n'en désigne qu'une des utilisations, le courrier électronique en étant une autre, tout aussi populaire.

TRANSFERT CONTROL PROTOCOL/INTERNET PROTOCOL (TCP/IP)

Famille de protocoles de transmission de données entre ordinateurs. Ces protocoles offrent des services d'accès à distance, de transfert de fichiers, de courrier électronique, et englobe les protocoles suivants : TCP, IP, HTTP, FTP, SMTP, POP3, IMAP,Telnet et DNS.

< Web - Courrier - Liste de discussion - Chat - FTP - Gopher - Telnet - top >


World Wide Web, Web, WWW, W3

Le World Wide Web (ou WWW ou W3, souvent appelé Web) signifie littéralement la "toile d'araignée recouvrant le monde". Cette image représente tous les ordinateurs interconnectés à travers le monde, mais le World Wide Web désigne plus précisément le système hypertexte que supporte le réseau Internet. Les liens hypertextes sont commes les fils d'une toile d'araignée qui relient les pages d'un site à l'autre.

Hypertexte

Un hypertexte est un ensemble de textes lisibles à l'aide d'une interface informatique, et reliés entre eux par des liens (ou hyperliens) associés à certains mots. Pour Ted Nelson, qui a inventé le terme «hypertexte» en 1965, la définition est un peu plus large puisqu'elle recouvre tous les systèmes d'écriture non-linéaire utilisant l'informatique. Actuellement, le World Wide Web est l'hypertexte le plus vaste et le plus connu.

Hypermédia

Mode hypertexte étendu qui permet à l'utilisateur de naviguer sans parcours préétabli à travers les données textuelles, sonores ou visuelles, les images animées ou les séquences vidéo.

Multimédia

Technique de communication qui réunit sur un seul support d'information les données suivantes : textes, graphiques, images et sons.

Link, Hyperlink, lien, lien hypertexte, hyperlien, lien dynamique

Dans un document hypertexte, liaison établie à partir d'une zone activable du texte représentée par un mot--clé ou une icône clé, ce qui permet d'avoir accès à d'autres renseignements.

Browser, navigateur, explorateur, fureteur, butineur

Logiciel de navigation conçu pour le Web, qui permet aux utilisateurs d'explorer les ressources d'Internet, en particulier les documents hypertextes. Un navigateur permet de se connecter à un serveur Web, en utilisant le protocole HTTP, pour transférer et afficher des pages Web au format HTML. La plupart des navigateurs gèrent aussi d'autres protocoles, comme le HTTPS (sites Web sécurisés) et le FTP (transfert de fichiers), ou encore les transactions de paiement sécurisées en SSL et SET. Les navigateurs doivent aussi gérer plusieurs autres technologies utilisées sur le Web. Parmi les plus connues, on peut citer les CSS, le DHTML, le XHTML et le Javascript. Ces technologies sont standardisées par le W3C (à l'exception d'extensions non normalisées comme Javascript, Flash ou Java).

Les navigateurs Web sont donc des logiciels très complexes et en constante évolution, car de nouveaux standards ou des révisions des standards existants ne cessent de voir le jour.

ex. Mozilla, Lynx, Netscape, Internet Explorer, Opera,...

Uniform Resource Locator, URL, adresse internet

Emplacement uniformisé de ressource. Noms et adresses qui, sous forme de chaînes de caractères, refèrent à des ressources sur le Web ce qui permet aux utilisateurs des réseaux Internet ou intranet de repérer l'endroit où se trouvent les informations recherchées sous forme d'adresse (p. ex. : http://www.fao.org/).

Une URL est constituée d'un nom de protocole, du nom d'un ordinateur hôte, d'un port (en option), d'un répertoire (en option) et d'un nom de fichier (en option).

protocole://ordinateur/répertoire/fichier.html

Les URI (pluriel d'URL) peuvent aussi servir à joindre d'autres ressources Internet telles que les sites FTP, les serveurs gopher, les adresses telnet, etc.

Plugin, plugiciel

En informatique, le plugin, ou greffon en français, est un petit logiciel venant se greffer à une application afin de lui apporter de nouvelles fonctions, des améliorations, etc. Le greffon ne peut fonctionner seul, il ne peut être appelé qu'à partir du programme auquel il a été ajouté. Il existe de nombreux plugins pour les navigateurs Web comme Flash, RealOne player, quicktime, ...

Bookmark, signet

Dans un navigateur Web, marque qui permet de conserver en mémoire la référence consultée (document, page ou site) afin d'y avoir directement accès la prochaine fois.

< Internet - Courrier - Liste de discussion - Chat - FTP - Gopher - Telnet - top >


E-mail, email, mel, courriel, courrier électronique

Mode de transmission d'un message entre un expéditeur et un destinataire. On nomme courrier électronique le service de transfert de messages que l'on envoie par Internet vers la boîte aux lettres électronique des personnes à qui ces messages sont destinés. Par métonymie, on appelle également courrier électronique l'ensemble des messages ainsi échangés. Pour recevoir et consulter des messages, il est indispensable de posséder une adresse électronique. C'est un mode de communication asynchrone : à l'inverse du téléphone par exemple, il ne nécessite pas la présence simultanée des deux parties en communication.

Adresse électronique, adresse Internet

Coordonnées électroniques d'un utilisateur (personne ou machine) comprenant son nom d'utilisateur suivi du symbole @, du nom de son serveur de messagerie (généralement le nom de son entreprise ou organisation, suivi du code de son doamine d'appartenance)
ex. pierre.dupont@hotmail.com

< Internet - Web - Liste de discussion - Chat - FTP - Gopher - Telnet - top >


Newsgroup, forum, groupe de nouvelles, forum de discussions thématique

Réunion en différé des utilisateurs du réseau Internet, soit par messagerie électronique, soit par le réseau Usenet, articulé autour d'un sujet thématique.

Usenet

Usenet (également connu sous le nom NetNews) est un ensemble de protocoles servant à générer, stocker et récupérer des "articles" (qui sont proches, dans leur structure, des emails), et permet l'échange de ces articles entre les membres d'une communauté qui peut être répartie sur une zone potentiellement très étendue. Usenet est organisé autour du principe de groupes de discussion ou newsgroups, qui rassemblent chacun des articles (contributions) sur un sujet précis. Les sujets des groupes de discussion sont organisés selon une hiérarchie. Les utilisateurs emploient généralement un logiciel client appelé lecteur de news (parfois aussi appelé client de news, en référence au modèle client-serveur) pour lire et composer des articles Usenet. La plupart des navigateurs Internet permettent d'accéder à Usenet, mais ils sont réduits aux fonctions de base, manquant de bien des fonctions orientées spécifiquement vers la lecture d'articles Usenet.

< Internet - Web - Courrier - Chat - FTP - Gopher - Telnet - top >


INTERNET RELAY CHAT (IRC), Chat

Service d'échange de messages en temps réel (synchrone) entre plusieurs utilisateurs du réseau Internet, qui correspond en fait à un service de conférence électronique improvisée qui s'articule autour du mode questions et réponses. Le succès d'IRC a été quelque peu diminué par l'arrivée des messageries instantanées (MSN, Yahoo Messenger, ...) Ces réseaux restent néanmoins très utilisés par ceux qui veulent discuter sans passer par un programme client propriétaire.

< Internet - Web - Courrier - Liste de discussion - FTP - Gopher - Telnet - top >


FILE TRANSFER PROTOCOL (FTP), protocole de transfert de fichiers

Dans Internet, protocole de communication TCP/IP qui assure la transmission de fichiers sans perte de données entre deux ordinateurs reliés au réseau Internet. Il permet, depuis un ordinateur, de copier des fichiers depuis ou vers un autre ordinateur du réseau, ou encore de supprimer ou modifier des fichiers sur cet ordinateur.

< Internet - Web - Courrier - Liste de discussion - Chat - Gopher - Telnet - top >


Gopher

Protocole Internet de recherche documentaire piloté par menu qui permet à l'internaute de naviguer dans l'espace Gopher et d'en consulter les ressources. Complètement supplanté par le Web (il tombe dans l'oubli en 1996), Gopher possède cependant des fonctions qui n'existent pas sur les serveurs Web. En 2000, Gopher est placé sours licence OpenSource et en 2002 sortait la version 3.0.Aujourd'hui, les menus Gopher disponibles peuvent s'avérer être des sources uniques d'information même si MSIE ne gère plus ce protocole depuis 2002, Mozilla permet encore d'y accéder.
Note : Terme emprunté à l'anglais pour désigner le petit rongeur, appelé spermophile en français, qui est la mascotte officielle de l'État du Minnesota (Gopher State) et de l'Université du Minnesota (Golden Gopher), institution où a été conçu ce protocole en 1991. Il s'agit aussi d'un jeu de mots anglais à partir duquel "go for" signifie "aller chercher".

Menu Gopher en 2004

Exemples :

Plus d'infos :

< Internet - Web - Courrier - Liste de discussion - Chat - FTP - Telnet - top >


Telnet, protocole Telnet

Dans Internet, protocole d'émulation de terminal qui permet aux utilisateurs reliés à un ordinateur hôte de se connecter aux ressources matérielles et logicielles d'un autre ordinateur hôte.

< Internet - Web - Courrier - Liste de discussion - Chat - FTP - Gopher >

AERIS - Cours - Comprendre Internet - Les messages d'erreurs

< 4XX - 5XX - 3XX - 2XX- les autres >

Lorsque l'on demande une page, il peut arriver que l'un des messages suivants apparaissent. Voici leur signification et ce qu'il y a lieu de faire dans ce cas.

Les erreur 4XX - Erreur de requête du client (le navigateur)

400 Bad Request

En raison d'une syntaxe erronée, la demande n'a pas pu être comprise par le serveur.
Vérifer la syntaxe de l'URL.

401 Unauthorized

Le paramètre du message spécifie les formes d'autorisation acceptables.
Le client doit reformuler sa requête avec les bonnes données d'autorisation (identification par mot de passe).

402 Payment required

L'information demandée est soumise à un droit d'entrée. Il est nécessaire d'avoir une authentification correcte.
Le client doit reformuler sa demande avec les bonnes données.

403 Forbidden

La requête est tout simplement interdite, non autorisée...
Il n'y a rien à faire ! Néanmoins, si le site semble intéressant, il faut remonter l'adresse jusqu'à ce qu'une page fonctionne.

404 Not Found

Le serveur n'a rien trouvé à l'adresse spécifiée. Soit la ressource n'existe plus à l'adresse spécifiée, soit l'URL est erronnée.
Verifier l'adresse demandée. S'il n'y a pas d'erreur, la page a pu être déplacée. Il convient donc de remonter l'adresse jusqu'à ce qu'une page fonctionne et faire une recherche sur le site..
Attention, parfois le serveur retourne une 404 au lieu d'une 400.

Les erreurs 5XX - Erreur de réponse du serveur

500 Internal Server Error

Le serveur a rencontré un évènement inattendu qui l'a empêché de donner correctement suite à la demande. Le serveur ne peut pas répondre à la requête suite à une erreur interne...
Réessayer plus tard.

501 Not Implemented

Le serveur ne supporte pas le service demandé ou le type de requête qui a été envoyé.
Il n'y a rien à faire

502 Service temporarily overloaded

Le serveur ne peut pas vous répondre à l'instant présent, car le trafic est trop dense.
Réessayer plus tard.

503 Service Unavailable

Erreur équivalente à une Internal Server Error (500) mais dans le cas précis où le serveur accède à d'autres services que le HTTP ou effectue des requêtes indirectes découlant de la requête initiale. Cette erreur indique que la réponse du service demandé ou une des requête indirecte n'a pas été retournée au serveur correctement.

Les redirections 3XX

301 Moved Permanently

Le document demandé à été déplacé définitivement à une nouvelle URL. La redirection vers la nouvelle adresse est automatique.

302 Moved Temporarily

Les données demandées ont été trouvées à une nouvelle URL, mais ont cependant peut-être été déplacées temporairement...

303 See Other

L'URL demandée peut être trouvée à une autre URI (spécifiée dans l'en-tête Location) et peut être récupérée en effectuant une requête GET.

304 Not Modified

Si le client a effectué une commande GET conditionnelle (en demandant si le document a été modifié depuis la dernière fois) et que le document n'a pas été modifié il renvoie ce code.

Les réussites 2XX

200 OK

La requête a été accomplie correctement. L'information demandée va suivre.

201 Created

Elle suit une commande POST, elle indique la réussite, le corps du reste du document est censé indiquer l'URL à laquelle le document nouvellement créé devrait se trouver.

202 Accepted

La requête a été acceptée, mais le serveur ne peut pas determiner si une action a été effectuée ou un fichier envoyé.

203 Non-Authoritative

Cet erreur est reçue en réponse à une commande GET, elle indique qu'une partie des informations demandées n'a pas été acheminée vers le client.

204 No Content

Le serveur a reçu la requête mais aucune donnée n'a été renvoyée.

Les autres messages

205 Reset Content
Le navigateur devra clarifier le formulaire utilisé pour cette transaction.
206 Partial Content
Le serveur renvoie uniquement une partie des données par rapport à la taille demandée. Ce code est utilisé lors de la réponse à une requête fournissant l'en-tête Range. Le serveur doit spécifier l'intervalle des données incluses dans la réponse avec l'en-tête Content-Range.
300 Multiple Choices
L'URI concerne un document qui a été traduit en plusieurs langues. Le serveur doit retourner des informations indiquant comment choisir une ressource précise.
305 Use Proxy
L'URI demandée doit être accessible via le proxy dans l'en-tête Location.
405 Method Not Allowed
La méthode spécifiée à la ligne de requête n'est pas autorisée pour la ressource identifiée par cette dernière.
406 Not Acceptable
La ressource identifiée par la demande ne peut générer que des entités de réponse possédant des caractéristiques de contenu «non acceptables» compte tenu des en-têtes Accept envoyés dans la demande.
407 Proxy Authentication Required
Vous devez être identifié à l'aide d'un serveur Proxy pour que cette demande puisse être traitée. Connectez-vous à votre serveur Proxy, puis réessayez.
408 Request Timeout
Le client n'a pas envoyé une requête complète dans le temps qui lui était imparti et le serveur a donc coupé la connexion. Le client doit recommencer sa requête.
409 Conflict
La requête provoque un conflit avec une autre requête ou avec la configuration du serveur. Des informations concernant le conflit peuvent être retournées dans la zone des données de la réponse.
410 Gone
L'URI demandée n'existe plus et a été définitivement supprimée du serveur...
411 Length Required
Le serveur n'a pas accepté la requête car il a besoin de connaître la taille de cette requête pour pouvoir y répondre.
412 Precondition Failed
La précondition donnée dans un ou plusieurs champs d'en-tête de demande a renvoyé la valeur FALSE lors de son test sur le serveur. Le client a placé des préconditions sur les méta-informations de la ressource actuelle (données de champs d'en-tête) pour empêcher que la méthode demandée ne soit appliquée à une autre ressource que celle prévue.
413 Request Entity Too Large
Le serveur A reffusé de procéder à la requête car la taille de son contenu est trop importante.
414 Request-URI Too Long
Le serveur ne peut traiter la requête car la taille de l'objet URI a retourner est invalide.
415 Unsupported Media Type
Le serveur ne traitera pas la requête parce que son entité-corps est écrit dans un format non supporté.
416 Requested range not valid
Le sous-ensemble de recherche spécifié est invalide
504 Gateway Timeout
Cette réponse est comme le code 408 (Request Time-out) sauf qu'ici, il s'agit d'une passerelle ou d'un mandataire qui se trouve en time-out.
505 HTTP Version Not Supported
Le serveur ne supporte pas la version du protocole HTTP utilisée dans la requête...

AERIS - Cours - Connaître les outils - Les moteurs de recherche

< Recherche - Classement des résultats - Présentation des résultats >

Les moteurs de recherche sont les outils à utiliser quand on cherche une information précise. Leur couverture est beaucoup plus importante que celle des annuaires, mais reste très parcellaire (environ 20% du Web pour les meilleurs d'entre eux). Il est indispensable de bien connaître la façon de les utiliser, leurs avantages et leurs limites.

Les moteurs de recherche indexent régulièrement des millions de PAGES Web dans une base de données. Pour cela, la plupart des moteurs de recherche utilisent des robots (programmes automatiques aussi appelés spiders ou crawlers) qui inventorient les pages Web et ajoutent les nouvelles adresses à leur base de données. Ces informations sont complétées par les auteurs de pages Web qui informent, de leur propre initiative, les moteurs de recherche de l'existence de leurs pages.

En plus des moteurs généralistes, il existe maintenant de nombreux moteurs de recherche spécialisés dans une discipline donnée, ou pour un type de document particulier (images, vidéos,...)

Chaque robot fonctionne à sa manière. Voilà pourquoi les résultats peuvent être différents pour une même requête selon que l'on utilise tel ou tel moteur. Les 3 principaux systèmes d'indexation utilisés par les robots sont les suivants (certains en utilisent plusieurs):

Exemples :

< Recherche - Classement des résultats - Présentation des résultats - top>

Recherche

Les moteurs de recherche proposent un formulaire de recherche simple disponible sur la page d'accueil.

Exemple : AlltheWeb <http://www.alltheWeb.com>, formulaire de recherche simple

Formulaire de recherche simple de Alltheweb

Un formulaire de recherche avancée, beaucoup plus puissant est généralement proposé (par un lien).

Exemple : Google recherche avancée <http://www.google.com/advanced_search?hl=fr>

Le moteur cherchera l'occurrence du(des) mot(s) recherché(s) dans sa base de données contenant plusieurs millions de pages.

Attention, la recherche s'effectue dans la base de données du moteur et pas sur la totalité de l'Internet ! De plus il existe une part non-négligeable du Web totalement inaccessible aux moteurs : le Web invisible

< Classement des résultats - Présentation des résultats - top >

Classement des résultats

Les résultats seront classés selon un algorithme de pertinence propre au moteur (présence du mot dans le titre, dans le texte, dans les balises métas, dans l'url, indice de popularité...).

Exemple :

Attention cependant, de nombreux moteurs proposent sur leurs pages de résultats des liens sponsorisés. Dans le milieu du e-commerce et du e-marketing, c'est ce qu'on appelle le positionnement payant : des sociétés achètent aux enchères certains mots clés afin de se retrouver dans les premiers résultats d'une requête comprenant ce mot.

Ces liens ne sont pas nécessairement (les plus) pertinents pour la recherche en tant que telle et n'ont en général pour but que de ramener des clients potentiels à la société. "Le lien sponsorisé est au web ce que la publi-information est à la presse écrite, ou l'infomercial à la télévision, à savoir un simple message publicitaire payé par un annonceur pour faire passer une information." (Philippe Crouzillacq, 01net).

Avec le développement des techniques de positionnement payant, c'est la notion de pertinence des outils de recherche qui est menacée. En effet, ces liens peuvent représenter de 20 à plus de 80% de la première page de résultats. Or la distinction entre les liens sponsorisés et les liens classiques n'est pas toujours évidente (cadre légèrement bleuté, indication "lien commercial"). Une enquête récente a d'ailleurs montré que plus de 70% des américains cliquaient sur des liens sponsorisés sans le savoir (étude de Pew Internet, janvier 2005 ) !

Exemple : recherche sur la calvitie

< Recherche - Présentation des résultats - top >

Présentation des résultats

La façon de présenter les résultats est, elle aussi, propre à chaque moteur (titre de la page, petite description, adresse, mais aussi date de mise à jour, auteur, sites similaires, pertinence en %, ...).

Enfin, la plupart des moteurs effectuent un clustering (c'est-à-dire qu'ils ne proposent qu'un seul lien pour un site même si plusieurs pages de ce site correspondent à la requête). On peut en général accéder aux autres pages du site à l'aide d'un lien du type "Autres pages de ce site".

Exemple : Northernlight présentation des résultats :

Résultats sur Northernlight

< Recherche - Classement des résultats >

Voir aussi les spécificités de certains moteurs.


  Un exercice est associé à cette page (exercice 6)
 

AERIS - Cours - Connaître les outils - Les annuaires (répertoire, directory)

< Recherche - Résultats - Avenir ? >

Ce genre de recherche se fait quand on désire explorer un domaine assez vaste, c'est-à-dire lorsque le sujet de recherche peut faire l'objet d'un site entier.

Les répertoires ou annuaires sont très différents des moteurs. Alors que ces derniers indexent automatiquement des PAGES Web, les annuaires recensent des SITES classés par catégories et sous catégories. Ce classement est effectué par la main de l'homme et, dès lors, la pertinence et la qualité des sites sont en général bien meilleures que sur un moteur de recherche.

Classement par catégorie sur Dmoz

Les responsables construisent donc une base de données de fiches descriptives contenant de l'information comme le titre, l'adresse URL, les sujets traités (sport, éducation, arts et spectacles, etc.), une description et éventuellement un commentaire et des mots-clés.

A côté des annuaires généraux, il existe maintenant de nombreux annuaires spécialisés dans un domaine précis (un pays, la médecine, l'éducation, ...).

Exemples :

Recherche

Par mots-clés

La recherche par mots-clés dans un annuaire s'effectue sur l'occurrence des mots dans le contenu des fiches descriptives et non sur le contenu des pages du site (à la différence des moteurs).

Par catégories

La recherche peut aussi se faire en descendant la hiérarchie de catégories de la plus générale à la plus spécifique.

Résultats

Par mots-clés

Le répertoire proposera d'abord une liste de catégories contenant le(s) mots(s) demandé(s), suivie d'une liste de sites dont la fiche correspond à la recherche, classés par pertinence.

Exemple :

Certains annuaires proposent ensuite les résultats d'un moteur de recherche

Exemple : Yahoo (avant 2004 Yahoo! proposait les résulats de Google. Yahoo! a depuis lancé son propre moteur de recherche, Yahoo! Search).

Résultat de recherche sur Yahoo, pages fournies par Google

Par catégories

Le résultat sera une liste de sites pertinents du domaine recherché, classés par ordre alphabétique.

Exemple :
Catégorie Science: Publications: Journals sur DMOZ <http://dmoz.org/Science/Publications/Journals_and_Magazines/>

Avenir des annuaires ?

Depuis peu (nous sommes en février 2005), les professionnels de la recherche d'information s'inquiètent de l'avenir des annuaires de recherche. En effet, progressivement ils sont abandonnés (plus mis à jour) voire supprimés.

"Il y a encore quelques mois de cela, il existait de nombreux annuaires, conçus, gérés et maintenus par des documentalistes, notamment en France. On peut citer ceux de l'Open Directory, de Yahoo! France, d'AOL.FR, de Nomade, de Lycos, de MSN France, le Guide de Voila et bien d'autres. Aujourd'hui, qu'en est-il ?

Force est de constater que les moteurs de recherche ont, petit à petit, "grignoté" les parts de marché des annuaires et que ceux-ci se retrouvent avec de bien faibles miettes de trafic aujourd'hui. Est-ce la fin des annuaires ? Ce serait bien triste car ce type d'outil apporte certainement une pertinence humaine parfois indispensable et qui manque souvent aux moteurs de recherche, qui pêchent parfois par trop d'automatisation. Espérons que l'avenir nous permettra d'espérer que les annuaires reviennent sur le devant de la scène... La thématisation et la régionalisation seront-elles leurs voies de secours ?"

Source Abondance : <http://actu.abondance.com/2005-07/annuaires.php>


  Un exercice est associé à cette page (exercice 6)
 

AERIS - Cours - Connaître les outils - Métamoteurs, encyclopédies, sites fédérateurs, webring

< Métamoteurs - Encyclopédies - Sites fédérateurs - Webring>

Les métamoteurs - dégrossir rapidement

Ils permettent de débroussailler rapidement un sujet et de repérer les outils qui y répondent le mieux.

On distingue généralement 3 générations de métamoteurs :

  1. Première génération : ils rassemblent sur une même interface un certain nombre de moteurs et outils de recherche. Ils ne permettent pas une interrogation simultanée mais offrent néanmoins un gain de temps.
  2. Seconde génération : ces métamoteurs interrogent simultanément plusieurs outils de recherche. Mais ils affichent les résultats moteurs par moteurs sans éliminer les doublons ni procéder à l'analyse de pertinence. L'utilisateur doit évaluer les résultats en se connectant site par site.
  3. Troisiéme génération : ces métamoteurs, les plus sophistiqués, sélectionnent les sites dans différents moteurs, éliminent les doublons et affichent les résultats selon des critères de pertinence ou par type de document.

Les métamoteurs permettent d'interroger simultanément plusieurs moteurs de recherche avec une même requête (du moins pour les métamoteurs de génération 2 et 3). Les résultats de la requête sont issus de plusieurs bases de données, ce qui permet une plus grande couverture de l'Internet. Le principal avantage des métamoteurs est donc l'exhaustivité.

Mais la même requête est envoyée à tous les moteurs, il est dès lors impossible de faire une requête complexe puisque chaque moteur utilise une syntaxe propre. L'usage des métamoteurs se limite donc souvent à des recherches simples.

Exemples :

Pour information, il existe d'autres outils faisant de la "métarecherche" : les agents dits intelligents (les métamoteurs sont qualifiés d'agents "semi-intelligents"). Ceux-ci sont en général des logiciels payants que l'on installe sur sa machine

La définition exacte d'un agent intelligent est "Objet utilisant les techniques de l'intelligence artificielle : il adapte son comportement à son environnement et en mémorisant ses expériences, se comporte comme un sous-système capable d'apprentissage : il enrichit le système qui l'utilise en ajoutant, au cours du temps, des fonctions automatiques de traitement, de contrôle, de mémorisation ou de transfert d'information." (AFNOR)

Les agents de recherche intelligents sont spécialisés dans la recherche d'information, plus ou moins autonomes et qui assistent l'utilisateur dans la recherche d'information, soit qu'ils opèrent directement en lieu et place de l'utilisateur, soit qu'ils aient une connaissance au moins partielle des objectifs ou du profil de l'utilisateur. Ils sont le plus souvent programmés avec des technologies d'intelligence artificielle. (définition tiré de Strategic-road.com)

Exemple :

En savoir plus

Métamoteurs

Agents

< Encyclopédies - Sites fédérateurs - Webring>

Les encyclopédies en lignes

Gratuites ou payantes, les encyclopédies en ligne ne sont pas à proprement parler des outils de recherche (même si certaines d'entre elles en intègrent). Elles sont néanmoins une source sûre, l'information y est de qualité et permanente. Elles sont donc souvent un passage obligé lors d'une recherche d'information.

Exemples :

< Métamoteurs - Sites fédérateurs - Webring>

Les sites fédérateurs et les guides - recherche large dans un domaine précis

Aucun outil n'est exhaustif et bien souvent, il faut en utiliser plusieurs pour arriver à ses fins. Les sites fédérateurs (Gateway, Portail, passerelle thématique) et les guides thématiques sélectionnent des sources de qualité dans un domaine précis. Créés par des professionnels de l'information ou des passionnés, ces sites proposent en général un recensement complet des meilleures ressources concernant un domaine. Par ailleurs, ils recensent bien souvent des ressources appartenant au Web invisible. Un site fédérateur peut donc proposer des répertoire spécialisés, des liens vers des répertoires ou pages de liens spécialisées, des articles en texte intégral ou une bibliographie en ligne, les actualités du secteur, les événements du secteur, des accès à des base de données, des offres/demandes d'emploi, un forum, des données chiffrées, des statistiques,des synthèses concernant le secteur,une liste de périodiques spécialisés, une liste d'experts, des cours, des conseils, des informations juridiques, etc.... Un site fédérateur très actif rassemble souvent une communauté de spécialistes autour de lui et devient donc un point de référence du domaine.

Exemples :

< Métamoteurs - Encyclopédies - Webring>

Les Webrings - recherche large dans un domaine précis

Les Webrings permettent de découvrir une multitude de sites correspondant à un thème donné. Il est possible depuis n'importe quel site membre d'obtenir la liste détaillée de tous les sites. Le Webring est géré manuellement et fait l'objet d'une sélection : gage de qualité et fiabilité.

Exemples :

< Métamoteurs - Encyclopédies - Sites fédérateurs >


  Un exercice est associé à cette page (exercice 6)
 

AERIS - Cours - Connaître les outils - Spécificités de certains moteurs

< Fonctionalités intéressantes -  Google - Yahoo!Search - Des moteurs à surveiller >

Fonctionalités intéressantes

Page archivée en mémoire, version cache

Cette fonctionalité a été lancée pour la première fois par Google. La version cache d'une page est la page telle qu'elle était lors du dernier passage du moteur, archivée par ce dernier. Très pratique pour retrouver des pages disparues mais aussi pour des pages qui changent très souvent et dont le contenu est archivé ailleurs au fur et à mesure (cas des blogs par exemple), utile aussi dans le cas de pages accessibles sur abonnement mais publiées d'abord gratuitement.

Cette version cache permet aussi de mettre en évidence les mots recherchés dans la page en les surlignant, ce qui s'avère particulièrement utile avec de longs documents.

Google cope cachée

Moteurs concernés : Google, Yahoo! Search, Gigablast

Format de fichiers

Cette fonctionalité très intéressante a été inaugurée par Google mais est disponible maintenant sur quelques moteurs. Elle permet de ne chercher que des fichiers pdf (Adobe) ou doc (MSWord) par exemple, ce qui est particulièrement intéressant quand on sait que de nombreux dossiers de fond, rapports, articles ... sont sous ces formats.

Moteurs concernés : Google, Yahoo! Search, Gigablast

Regroupement thématiques à la volée (clustered résults, custom search folders)

Lancée pour la première fois par le regretté Northern Light, cette fonctionalité permet d'affiner sa recherche. En effet, une fois la recherche lancée, les résultats similaires (d'après le moteur) sont regroupés automatiquement dans des dossiers thématiques. Par exemple, une recherche sur "bioindicateurs" dans Vivismo proposera les dossiers suivants :

Moteurs concernés : Wisenut, Teoma, Ez2find (métamoteur), Vivismo (métamoteur), KillerInfo (métamoteur)

Représentation graphique / Cartographie /sémantique

WebBrain http://www.Webbrain.com/

Webbrain

Contrainte : ne fonctionne pas sur mac.

Cet outil s'appuie sur les ressources de Dmoz (l'Open directory project) et les lies à l'aide de liens sémantiques.

Webbrain

KartOO http://www.kartoo.com

KartOO

KartOO est un métamoteur graphique.

"Les internautes novices peuvent trouver l'information recherchée grâce à KartOO car nous leurs permettons d'avoir une vision globale des thématiques connexes à la requête tapée, de préciser leur pensée en rajoutant ou en enlevant ces thématiques générées dynamiquement à la requête originelle d'un simple clic sur des boutons + et - associés, de visualiser les sites Web les plus pertinents et les liens sémantiques reliant les sites les uns aux autres par l'intermédiaire d'une interface cartographique visuelle et intuitive. [...] KartOO interroge à l'heure actuelle quatorze moteurs, dont MSN, Voila, AllTheWeb. La liste est accessible sur KartOO dans l'option de recherche avancée et va s'allonger. Chaque fois qu'un site est affiché, la source est précisée. "

Laurent BALEYDIER de KARTOO
<http://www.enfin.com/entretiens/l-baleydier.php>

KartOO

Mais également

Spécificités de Google <www.google.com>

Google

"Recherche rapide et facile. [...] google a fait un compromis entre son extrême simplicité d'utilisation et la complexité de son système de classement de résultats"

Recherche simple et avancée

A lire :

Algorithme de pertinence : Rank page

L'algorithme de pertinence de Google se base essentiellement sur l'indice de popularité. Ce système est utilisé à la fois pour les résultats du moteur et pour le classement des sites dans son répertoire (qui est en fait celui de l'Open Directory).

"Le principe de PageRank est simple : tout lien pointant de la page A à la page B est considéré comme un vote de la page A en faveur de la page B. Toutefois, Google ne limite pas son évaluation au nombre de « votes » (liens) reçus par la page ; il procède également à une analyse de la page qui contient le lien. Les liens présents dans des pages jugées importantes par Google ont plus de « poids », et contribuent ainsi à « élire » d'autres pages. "
[Source Google <http://www.google.com/intl/fr/why_use.html>]

Avantage
Les pages trouvées sont en quelque sorte évaluées par des pairs (peer review) puisqu'un site référencé par de nombreux sites du même domaine sera bien classé. A l'usage on constate qu'effectivement les résultats de Google sont très pertinents.
Inconvénients :
Les pages récentes et méconnues sont négligées, de même que les pages traitant d'un sujet peu populaire

J'ai de la chance

Le bouton "j'ai de la chance" du formulaire de recherche de Google permet d'afficher directement la page que Google considère comme la plus pertinente pour une recherche donnée.

A lire :

Formats de fichiers

Google était jusqu'il y a peu le seul moteur à indexer d'autres formats en dehors des pages Web :

Il suffit de taper filetype:ppt pour trouver des documents powerpoint ou utiliser le fomulaire de recherche avancée <http://www.google.com/advanced_search?hl=fr>.

Pages archivées en mémoires

Dans ces résultats, Google propose un lien vers la version de la page telle qu'elle était lors de son indexation ce qui est extrêmement utile pour les pages disparues (erreurs 404).

Google cope cachée

A lire :

Recherche incluant les synonymes

Depuis août 2003, Google propose une recherche incluant les synonymes par l'intermédiaire du tilde (~). Par exemple, une recherche sur biology ~course cherchera des pages comprenant le mot biology associé à des termes comme course(s), classe(s), tutorial, lecture(s), training, ... La recherche incluant les synonymes n'est pas encore très efficace en français.

Pour savoir quels synonymes sont utilisés il suffit de faire une recherche incluant les synonymes en excluant le mot dont on recherche les synonymes, puis de regarder les pages de résultats :

Exemple :

Sites exclusivement consacrés à Google

< Yahoo!Search - Des moteurs à surveiller - Représentation graphique et liens sémantiques >

Spécificité de Yahoo! Search <search.yahoo.com>

Ayant racheté AltaVista, AllTheWeb et Inktomi, Yahoo! a combiné les technologies de ces différents moteurs pour créer Yahoo! Search lancé en février 2004.

"Il nous semble évident que Yahoo! a "réussi son coup" en proposant dès le départ, un outil très proche de Google, certes, mais surtout légèrement plus pertinent, ce qui n'était déjà pas une mince affaire. YST a certainement profité de la baisse de qualité des résultats de Google, constatée par beaucoup depuis quelques mois, pour dépasser, de peu certes, le leader actuel en termes de pertinence. Lorsque quelques bugs de jeunesse auront été corrigés, Yahoo! pourrait avoir à sa disposition une première pierre qui lui permettra de bâtir un véritable mur technologique dans les mois qui viennent. [Source : Abondance]"

Recherche simple et avancée

A lire :

< Google - Des moteurs à surveiller - Représentation graphique et liens sémantiques >

Des moteurs à surveiller

Teoma http://teoma.com/

"Teoma [...] prend, comme Google, l'indice de popularité [...] comme critère prédominant, mais de façon légèrement différente. Il utilise tout d'abord cet indice de popularité, donc la façon dont les pages sont liées entre elles, pour identifier des "communautés" sur le Web. Puis, à l'intérieur de ces communautés, il tente d'établir les pages qui sont les plus pertinentes par rapport à la requête demandée. Il s'agit donc du concept de Google, mais adapté à des "univers" précis et spécialisés sur certains domaines uniquement. Teoma, comme Northern Light, propose de reclasser les liens proposés dans des dossiers thématiques[...]. Enfin, il propose des catégories d'annuaires ou des pages riches en liens (nommés "Expert Links" à droite) sur le thème demandé. L'index de Teoma ne comprend cependant que 100 millions de pages, ce qui est un peu faible aujourd'hui pour espérer jouer les "gros bras" dans ce domaine... Mais il [...] devrait "grossir" dans les mois qui viennent. "
[Source : Abondance <http://www.abondance.com/trucs-et-astuces/outils25.html>]

WiseNut http://wisenut.com/

"Ce nouveau moteur [...] utilise plusieurs techniques pour juger de la pertinence d'un document : l'analyse du texte de la page, du texte des liens qui pointent vers cette page ainsi que des termes qui entourent ces liens, mais également du contenu des pages pointant vers le document analysé. [...] Pas si éloigné que cela de l'algorithme de Google, cependant... [...]. Enfin, dans ses pages de résultats, il tente une catégorisation des liens proposés assez proches des "Custom Search Folders" de l'excellent Northern Light [...]."
[Source : Abondance <http://www.abondance.com/trucs-et-astuces/outils25.html>]

Lancé officiellement en septembre 2001, il semble jouer dans la cours des grands et annonce 1,495,332,308 de pages indexées sur sa page d'accueil (11/2001) ce qui le place d'emblé parmi le 3 plus gros moteurs.

Gigablast http://www.gigablast.com/

"Lancé en mars 2002, ce "petit" moteur propose des fonctionalités intéressantes. A l'instar de Google, Gigablast prope une fonction cache (mémorisation de la page sur les serveurs des moteurs). Dans les résultats, chaque page est également assortie de sa date d'indexation par le moteur et de sa date de dernière modification par le webmaster. Depuis l'été 2003, Gigablast indexe plusieurs formats de documents : PDF (Adobe), PostScript (.ps), PowerPoint (.ppt), Excel (.xls), Word (.doc) et également les documents ASCII (.text). Pour l'instant, la faiblesse de Gigablast est la petite taille de son index qui augmente toutefois régulièrement : 200 millions de pages en août 2003, 250 en janvier 2004. A suivre..."
[Source : Intelligence center <http://c.asselin.free.fr/french/moteurs2.htm> ]

 

AERIS - Cours - Connaître les outils - Boîte à outils

Vu le nombre sans cesse croissant d'outils de recherche généralistes ou spécialisés, il n'est pas question ici d'imposer un choix. La recherche d'information sur Internet commence, pour le novice, par chercher les outils qui lui conviennent (par essais et erreurs en partie). Pour cela, il existe maintenant des moteurs de moteurs et des annuaires d'annuaires. Pour les outils généraux, rien n'empêche, au contraire car ils sont validés, de choisir un outil très connu (Google, Yahoo,...)!

Ces choix effectués, il faut comprendre le fonctionnement de ces outils et apprendre leur langage d'interrogation. Pour cela, il ne faut pas hésiter à consulter l'aide en ligne des outils et les comparaisons d'outils.

Exemple :

Par ailleurs, vu l'évolution des outils de recherche, ces choix ne doivent pas être définitifs.

Enfin, chaque recherche étant particulière, il ne faut pas hésiter à consulter d'autres outils.

Pour vous aider à faire ces choix vous pouvez consulter les outils de la section du même nom (voir menu de gauche).


Les outils suivants devraient être idéalement classés dans vos bookmarks (dans un répertoire Recherche par exemple) :

Par ailleurs, dans votre boîte à outils, vous pouvez aussi inclure :

AERIS - Cours - Connaître les outils - Glossaire

Définitions tirés du Glossaire collaboratif du recherchiste internet <http://www.bbs-consultant.net/docs/sources/glossaire.pdf>

B-C-D-E-F-J-K-L-M-O-P-R-S-T-U-V-W-X

AGENT

Définition de Jacques Ferber in « Les Systèmes multiagents. Vers une intelligence collective », Inter-Editions, 1995. Entité physique ou virtuelle :

AGENT INTELLIGENT

Logiciel visant à faciliter la recherche et la gestion de l'information sur l'Internet. Il possède des attributs propres et agit dans le but de d'accomplir un certain nombre de tâches pour un autre agent logiciel ou un humain. Voici les attributs définis par différents chercheurs comme Oren Etzioni, Daniel Weld, Stan Franklin et Art Graesser :

  1. Autonomie : un agent est capable de prendre des initiatives de manière autonome et d'exercer un contrôle sur ses actions;
  2. Collaboration : un agent est capable d'interagir et de collaborer avec d'autres agents logiciels ou avec des êtres humains dans le but d'accomplir ses actions;
  3. Apprentissage : un agent doit être capable de s'adapter au besoins de son utilisateur en analysant les actions passées;
  4. Réactivité : il répond dans le temps aux changements dans son environnement;
  5. Ciblage : un agent accepte des requêtes humaines précises mais décide de quelle manière les satisfaire, et n'agit pas seulement suite à un changement dans son environnement;
  6. Continuité : un agent travaille de manière continue;
  7. Flexibilité : les actions d'un agent ne sont pas entièrement prédéfinies; l'agent est capable de choisir ce qu'il va faire et dans quel ordre il le fait.
  8. Liberté d'action : contrairement à un logiciel ordinaire, un agent peut décider de lui-même la date de déclenchement d'une action;
  9. Sensibilité : chaque agent possède une sensibilité propre
  10. Mobilité : un agent est capable de se déplacer d'une machine à une autre au travers de différentes plateformes matérielles et architectures logicielles.
     
ALGORITHME DE PERTINENCE

Relevancy algorithm : Méthode utilisée par un moteur de recherche ou un répertoire pour relier les mots-clés d'une requête avec le contenu de chaque page, de telle sorte que les pages Web trouvées correspondent bien au sujet de la requête. Chaque outil de recherche est susceptible d'utiliser un algorithme différent et de le changer ou de l'améliorer. Voir aussi : critères de tri.

ANNUAIRE

Voir Répertoire

ASPIRATEUR DE SITE

Outil permettant de copier un site Web à distance pour le relire ensuite en local, depuis son propre disque dur.

BRUIT

Réponse non pertinente fournie lors d'une recherche d'information.

CADRE

Voir Frame

CONTENU DYNAMIQUE

Il s'agit de pages Web avec des informations qui changent ou sont changées automatiquement en fonction d'une base de données ou d'éléments provenant de l'utilisateur. (ex. suffixe .asp, .cfm, .cgi ou .shtml dans l'URL). Voir aussi Page dynamique

CRITERE DE TRI

Façon automatique de sélectionner les résultats retournés par le moteur de recherche, afin de présenter en début de liste ceux qui correspondent le mieux à la requête. On distingue généralement le tri par pertinence du tri par popularité. Voir aussi : algorithme de pertinence.

CRYPTAGE

Moyen de rendre secrète la communication informatique grâce à des logiciels d'encodage de données. Seul le possesseur de la clé de décodage peut interpréter le message. Aussi appelé "chiffrement".

DENSITE DES MOTS CLES

Une des propriétés qui permet d'indiquer l'importance de certains mots dans le texte d'une page Web. Certains outils de recherche utilisent cette propriété pour le tri. La formule de calcul = nombre d'occurrences du terme demandé / nombre de termes de la page en question, une fois éliminés les mots vides.

DIRECTORY

Voir Répertoire

EN-TETE heading tags

Ce sont les commandes qui se trouvent en tête des pages HTML. Certains moteurs de recherche donnent plus d'importance et de poids au texte qui s'y trouve.

EQUATION DE RECHERCHE

Formulation d'une question sous forme mots clés reliés par des termes logiques (ou opérateurs). Voir aussi opérateurs booléens.

FRAME

Synonymes : trame, cadre . Il s'agit d'une technique de programmation en HTML pour présenter deux ou plusieurs documents séparés dans une fenêtre du navigateur, les documents agissants l'un sur l'autre à travers différentes sous-fenêtres. Les frames posent souvent de gros problèmes d'indexation aux moteurs de recherche.

KEYWORD

Voir Mot-clé

LIEN MORT

Un lien qui ne mène plus à une page ou à un site, soit parce que le serveur est en panne, soit parce que la page a été déplacée ou bien n'existe plus. La plupart des outils de recherche ont des techniques pour ôter de telles pages de leur liste automatiquement. Mais l'Internet continuant à croître quotidiennement, il leur devient de plus en plus difficile de contrôler régulièrement toutes ces pages.

META-MOTEUR ou META-CHERCHEUR

Voir le cours

META TAG

Construction placée dans l'en-tête HTML des pages Web, fournissant des informations qui ne sont pas visibles par les navigateurs. Les plus courants des meta-tags (balises META) sont KEYWORDS et DESCRIPTION.

MOT CLE ou key-word

Mot ou groupe de mot, éventuellement dans une forme lexicographique normalisée, choisi dans le titre ou le texte d'un document, caractérisé par le contenu et permettant la recherche de ce document.

MOTEUR DE RECHERCHE

Voir le cours.

MOTEUR THEMATIQUE

Synonyme : moteur spécialisé : Il procède par catégorisation automatique de pages, généralement à partir de catégories prédéfinies et de mots-clés préétablis.

OPERATEUR BOOLEEN

Pour effectuer une recherche par mots clés, on couple souvent une suite de mots grâce à des opérateurs booléens. Venant du nom de George Boole (mathématicien britannique) ces opérateurs permettent d'élargir ou de restreindre la recherche en imposant certains mots et en en excluant d'autres. Il existe plusieurs opérateurs booléens :

Voir le cours

OUTIL DE RECHERCHE

Terme générique pour tout service de recherche d'information sur le Web, combinant bien souvent désormais les procédés d'un répertoire et ceux d'un moteur de recherche, plus parfois de moteurs spécialisés.

PAGE DYNAMIQUE

Page HTMLdont le contenu n'est pas situé dans un fichier enregistré sur le serveur mais générées "à la volée" par une application informatique à partir d'un modèle de document HTMLen accédant à des informations situées dans une (ou des) base(s) de données. Les techniques utilisées sont variables, CGI langage de script, API propriétaires permettant de créer un lien entre la base de données et le serveur HTTP.

PAGE STATIQUE

Page HTMLdont le contenu est situé dans un fichier figé, enregistré sur le serveur Web.

POPULARITE

Synonyme : notoriété. Mesure le nombre et la qualité des liens pointant vers une page particulière. Plusieurs moteurs de recherche utilisent de plus en plus ce procédé dans le processus de tri.

PORTAIL

Terme générique pour désigner un site qui sert de point d'entrée sur l'Internet pour un nombre important d'utilisateurs. Un site portail offre une multitude de contenus, outils et services différents depuis la page d'accueil, Certains sont des répertoires professionnels organisés autour d'une thématique particulière, dotés d'un moteur de recherche interne, et d'autres ne sont que les points d'entrée sur l'internet offerts par les FAI à des abonnés grand public. Certains sont maintenus par des sociétés, d'autres par des particuliers, certains tendent à rendre captif un groupe d'internautes utlisateurs, d'autres ne cherchent qu'à renseigner. On considère également qu'un site doit générer beaucoup de trafic (surtout grand public) pour recevoir la qualification de portail et baser son offre sur les 3 axes suivants : recherche d'information, outil de communication (courriel, messagerie instantanée) et commerce en ligne.

POSITIONNEMENT ou ranking

Processus de classement des sites, des pages Web dans un moteur de recherche ou un répertoire afin que les sites les plus pertinents apparaissent en premier sur la page résultat lors d'une requête.

REGROUPEMENT ou cluster ou méthode de clustering

Affichage d'une seule adresse pour chaque site Web sur la page des résultats d'un outil de recherche. Cette méthode permet d'éviter qu'un petit nombre de sites occupe toutes les premiéres positions de résultats et en facilite la lecture pour l'utilisateur.

REPERTOIRE

Voir le cours.

REPERTOIRE GENERALISTE

Répertoire ayant pour vocation d'ndexer tous les sites et qui n'effectuent une censure que sur la base de principes prédéfinis (par exemple, des sites manifestement illégaux ou dont le référencement cherche à induire l'internaute en erreur). Exemples : Yahoo, Nomade

REPERTOIRE SPECIALISE

Répertoire dont les sites répertoriés relèvent tous d'un domaine ou d'un secteur particulier (le vin, le tourisme, le sport, l'agriculture, etc.). Un répertoire spécialisé peut, par exemple, ne prendre en compte que les entreprises d'un secteur, ou les produits d'un domaine.

REPERTOIRE SELECTIF

Répertoire dont les gestionnaires privilégient les sites de meilleure qualité et excluent les sites qu'ils n'estiment pas suffisamment intéressants. Exemple : bonWeb.com

REPERTOIRE CONTRIBUTIF, répertoire ouvert, (open directory)

Répertoire dont l'enrichissement est effectué par différentes équipes d'internautes. Ces répertoires confient la responsabilité d'une ou plusieurs catégories soit à des internautes experts reconnus dans leur domaine et rémunérés pour leur prestation (exemple : About.com), soit à des internautes bénévoles dont la compétence dans le domaine couvert par cette catégorie a été vérifiée. Ces internautes reçoivent alors les demandes de référencement de leur catégorie, décident ou non de référencer les sites et, le cas échéant, rédigent eux-mêmes la description du site (exemple : DMoz - Open Directory Project). Certains répertoires contributifs sont définis par des experts sélectionnées (exemple : Argus Clearing House).

REPERTOIRES D'OUTILS DE RECHERCHE

Synonymes : listes de listes, répertoires de répertoires - Répertoires spécialisés dans le référencement de répertoires et d'outils de recherche (moteurs de recherche, méta-moteurs, etc.). Exemple : 7alpha, Beaucoup

REQUETE

Synonymes : query, terme recherché. Mot, expression ou groupe de mots employés pour interroger un outil de recherche afin de localiser des pages sur le sujet recherché.

Voir le cours

ROBOT

Programmes de navigation qui suivent les liens hypertextes des pages Web mais qui ne sont par directement sous contrôle humain. Exemples : les spiders ou araignées des moteurs de recherche.

ROBOTS.TXT

Fichier texte déposé dans le répertoire principal d'un site Web pour interdire l'accès aux robots de certaines pages ou sous-répertoires du site.

SILENCE

Désigne l'ensemble des documents pertinents non retrouvés lors d'une recherche.

SITE FEDERATEUR

Voir le cours.

SPAMDEXING

Création ou modification d'un document avec l'intention de tromper un répertoire ou un système de classement automatique. Toute technique visant à augmenter le positionnement (ranking) potentiel d'un site aux dépens de la qualité du corpus de l'outil de recherche. Peut également être considérée comme du spamdexing.

TECHNIQUES DE POSITIONNEMENT

Le fait de modifier sa page Web afin que les moteurs de recherche traitent la page comme la plus appropriée pour une requête spécifique, ou un ensemble de requêtes.

TRI PAR PERTINENCE

Méthode de classement automatique des résultats retournés par le moteur de recherche qui s'appuie sur le calcul d'un score pour chaque réponse. La pertinence est alors basée sur des facteurs comme :

TRI PAR POPULARITE

Méthode de classement automatique des résultats retournés par le moteur de recherche qui s'appuie soit sur le principe de citation (popularité) soit sur la mesure de l'audience.
Dans le premier cas, l'importance d'une page est évaluée en fonction des liens hypertexte qui pointent vers elle et en fonction de la nature du document qui la cite. Le tri est alors indépendant du contenu, mais les documents récents ou peu cités par les autres sont défavorisés. Google avec son système de PageRank en est l'exemple le plus connu.
Dans le second cas, l'importance d'une page est fonction du nombre de visites reçues lors d'une requête sur un moteur de recherche. C'est l'analyse du comportement de l'internaute qui détermine la popularité d'une page par rapport à un mot-clé. Solution DirectHit utilisée par HotBot et LookSmart par exemple.

URL
Uniform Resource Locator : adresse d'un site Web.
 
VEILLE (les 4 types de veille)
  1. Concurrentielle : comme le nom l'indique, le veilleur s'intéressera ici aux concurrents actuels ou potentiels de l'entreprise.
  2. Environnementale : cette veille se focalise sur la réglementation, la normalisation et tous les facteurs susceptibles d'influencer directement ou indirectement l'activité de l'entreprise.
  3. Commerciale : le veilleur s'intéresse ici aux clients, fournisseurs et marchés de l'entreprise et marché du travail.
  4. Technologique : tout ce qui est du domaine de la recherche est ici surveillé : brevets, produits, services, procédés de fabrication, matériaux, systèmes d'information...etc.
     
 
Web INVISIBLE
Voir le cours.
 

AERIS - Cours - Chercher - Méthodologie de la recherche documentaire

Délimiter le sujet

Avant toute recherche complexe, il convient de comprendre et préciser le sujet.

Définir les mots clés

Choisir les bons outils et formuler sa requête

--> Suite Préparer sa recherche

Consulter les références

Pour chaque ressource pertinente trouvée, il est très utile de consulter la bibliographie citée par l'auteur. Celle-ci permet en effet d'avoir rapidement une liste de références sur le sujet. Il ne reste plus ensuite qu'à les trouver et consulter leurs références...

Evaluer, classer et traiter l'information

Communiquer l'information

A consulter pour en savoir plus


  Des exercices sont associés à cette page (exercice 7, 8, 10 et 11)
 

AERIS - Cours - Chercher - Préparer sa recherche

Après la démarche préalable (recherche documentaire) vous devez pouvoir répondre aux question suivantes :

Quel est le type d'information que je recherche?

Définir le type de recherche à effectuer :

et donc le type d'information

Quel est le type de document ?

Quelle est la quantité d'information dont j'ai besoin ?

Combien de temps ai-je pour effectuer la recherche?

Quelles sont les limites de ma recherche ?

Comment puis-je définir la question que je me pose ?

Pour vous aider dans le choix des mots clefs et des synonymes (français et anglais), vous pouvez utiliser Rameau, Le grand dictionnaire terminologique et la section Dictionnaires et encyclopédies des outils.

Et donc, quels est l'outil qui peut m'aider le mieux ?

A l'aide de ces différentes réponses, vous êtes en mesure de choisir


  Des exercices sont associés à cette page (exercice 7, 8, 10 et 11)
 

AERIS - Cours - Chercher - Requête complexe et opérateurs booléens

Attention, vu la spécificité des outils, des mots clés génériques peuvent être utilisés sur un répertoire mais sur un moteur les résultats donneront beaucoup trop de bruit. Inversement, des termes trop précis dans un annuaire risquent de ne pas donner de réponse ! D'autre part, les différents outils de recherche n'utilisent pas toutes ces possibilités et chacun possède un langage d'interrogation spécifique. Cette remarque peut donc aussi déterminer le choix de l'outil approprié. Les sites suivants peuvent vous y aider :

Plan de la page :

Généralités

Importance de l'ordre des mots

Pour la plupart des outils, global change donnera les mêmes résultats que change global. Mais ce n'est pas le cas pour tous. En effet, certains outils accordent un poids au mot en fonction de sa position : le premier mot sera plus important que le deuxième. Le nombre de résultats sera le même mais ils seront triés différemment. Si l'on utilise un outil qui ne tient pas compte de l'ordre des mots, l'utilisation des guillemets permet de l'y obliger : "global change"

Mots fréquents

Beaucoup de moteurs excluent les mots fréquents (a, and, any, as, be, but, is...) ce qui peut être problématique pour certaines recherches.

Attention aussi en utilisant un moteur non francophone, les mots tels que "le, la, les, ..." seront pris comme un mot clé (résultat : beaucoup de bruit. )!

Comportement de certains moteurs vis à vis des mots fréquents (stop words)
<http://www.searchengineshowdown.com/features/byfeature.shtml#stop>

Q. Recherche sur la vitamine A
Avec Google (02/2005) :
vitamin a --> 16 600 000 résultats
vitamin +a --> 8 820 000 résultats
"vitamin a" --> 3 410 000 résultats

La casse (majuscule/minuscule)

La plupart des moteurs sont insensibles à la casse (il y'a quelques temps la plupart des moteurs la respectait !).

Il semble que désormais, seul AltaVista soit entièrement sensible à la casse à condition de mettre le mot recherche entre " ou en utilisant le formulaire de recherche avancé ou l'assistant de recherche. (Source : Web Search Tip of the Day A Case (of) Sensitive Search <http://searchenginewatch.com/webmasters/article.php/2167851>).

Comportement de certains moteurs vis à vis de la casse
<http://www.searchengineshowdown.com/features/byfeature.shtml#case>

Accents

La plupart des moteurs tiennent compte des accents, particulièrement les outils francophones, mais pas tous.

Q. Recherche de site sur Star Wars épisode 1
avec google (02/2005):
star wars épisode 1--> 1 370 000 résultats
Star Wars Episode 1 --> 693 000 résultats
Stars Wars Épisode 1--> 1 370 000 résultats
Conclusion : Google n'est pas sensible à la casse mais tient compte des accents

Pluriel

Certains moteurs cherchent automatiquement le pluriel d'un mot au singulier (en fait ils effectuent une troncature par défaut c'est-à-dire que chat cherchera chat, chats, chatte, chattes, chaton, chatière, chatouille, chateaubriand...). Pour ceux qui ne le font pas, l'utilisation de la troncature permet de chercher le pluriel et le singulier.

< booléens - proximité - phrase - générique - champs - limites - imbriquée - naturel - Outils - top>

Les opérateurs booléens

Syntaxe de certains moteurs vis à vis des opérateurs booléens
<http://www.searchengineshowdown.com/features/byfeature.shtml#boolean>

Opérateurs par défaut

Les internautes ont pris l'habitude de taper un ou deux mots-clés séparés par un espace. L'espace est compris de deux manières différentes par les outils de recherche : un ET ou un OU, le OU par défaut étant le plus fréquent. Attention donc, lorsque l'on cherche global change, beaucoup d'outil chercheront en fait les pages contenant global, change ou les 2 c'est-à-dire beaucoup de bruit. .

Opérateur par défaut de certains moteurs
<http://www.searchengineshowdown.com/features/byfeature.shtml#defaults>

AND (ET)

Associer deux mots (ou plus) à une recherche est une excellente méthode, qui donne en général d'assez bons résultats en réduisant considérablement le nombre de pages trouvées. Pour effectuer une recherche AND, chaque outil a sa méthode. Voici les plus courantes :

Q. Informations sur la migration des cigognes
migration AND cigogne
+cigogne +migration
cigogne WITH migration
cigogne migration
(recherche AND par défaut)
cigogne migration
avec un bouton vous permettant de choisir all the words

 

OR (OU)

Associer deux mots différents avec l'opérateur OR n'est pas vraiment à conseiller dans la mesure où le nombre de résultats trouvés est en général impressionnant. Cela peut cependant être utile dans le cas où votre recherche peut s'exprimer de différentes manières (synonymes et concept liés). De même, les méthodes diffèrent en fonction de l'outil:

OR
Q. Informations sur le SIDA (en anglais)
AIDS OR HIV
AIDS HIV (OR par défaut)
AIDS HIV avec un menu déroulant (any of the words)

 

NOT (SAUF)

Ce peut être une excellente solution aux mots désignant plusieurs concepts ou lorsque l'on sait que tel type d'information ne nous sera d'aucune utilité. Cette méthode permet de réduire le bruit. .

NOT
Q.Information sur la chimie mais pas la chimie organique (en anglais)
chemistry not organic
chemistry -organic
chemistry AND NOT organic
chemistry BUT NOT organic
chemistry avec un champs permettant d'exclure le mot organic

< généralités - proximité - phrase - générique - champs - limites - imbriquée - naturel - Outils - top>

L'opérateur de proximité

2004 : ATTENTION ! depuis la fusion d'AltaVista, AlltheWeb et Inktomi en "Yahoo! Search" des fonctionalités de recherche qui n'existaient plus que sur ces moteurs ont disparu. C'est le cas de la recherche de proximité.

Cet opérateur n'existe que sur certains moteurs et n'est souvent accessible qu'à partir du formulaire de recherche avancée. Il permet de rechercher deux mots qui doivent obligatoirement se situer l'un près de l'autre.

Comportement de certains moteurs vis à vis de l'opérateur de proximité <http://www.searchengineshowdown.com/features/byfeature.shtml#proximity>

< généralités - booléens -phrase - générique - champs - limites - imbriquée - naturel - Outils - top>

Recherche d'une expression ou d'une phrase

Pour rechercher une expression, il suffit de la mettre entre guillemets.

Q.Informations sur le Mont Saint Michel
S."Mont Saint Michel"

< généralités - booléens - proximité - générique - champs - limites - imbriquée - naturel - Outils - top>

Le caractère générique (wildcard)

2004 : ATTENTION ! depuis la fusion d'AltaVista, AlltheWeb et Inktomi en "Yahoo! Search" des fonctionalités de recherche qui n'existaient plus que sur ces moteurs ont disparu. C'est le cas de la troncature.

Le caractère générique permet de remplacer n'importe quelle lettre ou chaîne de caractères. En plaçant une * (? ou%) à la suite d'un mot ou du début d'un mot, vous recherchez toutes les orthographes possibles de ce mot.

Exemples
bio* recherchera biologie, biology, biologiste(s), biotechnologie(s),...
p?r?mètre recherchera des mots comme périmètre ou paramètre

Comportement de certains moteurs vis à vis de la troncature
<http://www.searchengineshowdown.com/features/byfeature.shtml#truncation>

< généralités - booléens - proximité - phrase - champs - limites - imbriquée - naturel - Outils - top>

La recherche par champs

C'est une fonction mal connue et néanmoins très utile des moteurs de recherche. Elle permet de restreindre la recherche à certaines parties des pages Web, ce qui peut être très utile lorsque l'on obtient des résultats trop abondants.

2004 : ATTENTION ! depuis la fusion d'AltaVista, AlltheWeb et Inktomi en "Yahoo! Search" des fonctionalités de recherche qui n'existaient plus que sur ces moteurs ont disparu. C'est le cas de la recherche par taille de fichier et par IP ainsi que de la recherche dans les contenus textuels des fichiers flash.

Là encore, chaque moteur utilise sa propre syntaxe. Voici quelques exemples de ces champs :

La recherche par champs de certains moteurs
<http://www.searchengineshowdown.com/features/byfeature.shtml#fields>

Le titre

Recherche les mots clés uniquement dans le titre des pages Web.

Exemple : title:leucose - t:leucose

L'URL

La recherche se fait dans l'adresse Web. On peut donc chercher un mot dans une url ou un domaine.

Exemple :
url:darwin - u:darwin - - host:darwin - domain:com - site:com

Pour restreindre la recherche à un pays, on utilise les codes nationaux (site:.be)

Un lien

Ce champ permet de chercher les pages possédant un lien vers un site donné. Cette recherche peut être intéressante car un site pertinent pour une recherche sera sûrement référencé par d'autres sites pertinents du même thème.

Exemple : link:www.fundp.ac.be

< généralités - booléens - proximité - phrase - générique - limites - imbriquée - naturel - Outils - top>

Les limites

En règle générale, mais souvent dans les formulaires de recherche avancée, il est possible de limiter la recherche à certains critères comme la date, la langue, la région, le format de fichier,...

Les limites de recherche de certains moteurs
<http://www.searchengineshowdown.com/features/byfeature.shtml#limits>

La date

Les dates prises en compte sont soit celles de dernière mise à jour, soit celle de l'inscription (ou de l'indexation) du site. Elles sont souvent réduites à une période (les 3 derniers mois, les 6 derniers mois, l'année écoulée).

Le format

Cette fonctionalité très intéressante a été inaugurée par Google mais est disponible maintenant sur quelques moteurs. Elle permet de ne chercher que des fichiers pdf (Adobe) ou doc (MSWord) par exemple, ce qui est particulièrement intéressant quand on sait que de nombreux dossiers de fond, rapports, articles ... sont sous ces formats.

Exemple : filetype:pdf ou type:pdf

< généralités - booléens - proximité - phrase - générique - champs - imbriquée - naturel - Outils - top>

La recherche imbriquée

La recherche imbriquée permet d'utiliser plusieurs opérateurs à l'aide de parenthèses.

Q. pages ne parlant que du paludisme induit par les espèces du genre Plasmodium sauf P. falciparum
S.(malaria OR paludisme) AND (plasmodium NOT falciparum)

Cependant, ces recherches demandent de l'habitude et ne donnent pas toujours de meilleurs résultats que 2 bons mots clés associés à l'aide de l'un des opérateurs ci-dessus. En tout état de cause, il vaut mieux ne pas rendre la question trop complexe.

Q.sites parlant de l'écotoxicologie des loutres de rivière
S. ((lutra OR otter*) NOT "sea otter") AND (PCB* OR (mercure OR Hg))

< généralités - booléens - proximité - phrase - générique - champs - limites - naturel - Outils - top>

Langage naturel

La recherche en langage naturel consiste à poser une question sous forme de phrase au moteur comme "où trouver un plan de Bruxelles ?". Il interroge alors une base de données composée de questions déjà posées par les internautes et dont il possède la réponse. L'outil tente de rapprocher la question de l'une de celle de sa base de données. Les résultats sont composés d'une liste de ces questions.

Exemple :

Qu'est-ce que l'anthrax ? Sur infoclic (n'existe plus) : Infoclic

Qu'est-ce que le Patriot Act ? Sur Brainboost

 

Ce principe est intéressant mais est décevant pour des questions pointues.

< généralités - booléens- proximité - phrase - générique - champs - limites - imbriquée - Outils - top>

Outils


  Des exercices sont associés à cette page (exercice 7, 8, 10 et 11)
 

AERIS - Cours - Chercher - La recherche intuitive

Pour beaucoup de sites, il n'est pas nécessaire de consulter un annuaire ou un moteur. En effet, lorsque l'on cherche un site dont on connaît l'institution, la société ou l'organisation, il est relativement facile de deviner l'adresse de ce site, à condition de bien comprendre comment sont formées les URL.

Q. Site des RNOB
R. Recherche intuitive : c'est une asbl belge
--> www.rnob.be
Q. Site de Microsoft
R. Recherche intuitive : c'est une société commerciale
--> www.microsoft.com
Q. Site de la FAO
R. Recherche intuitive : c'est une organisation internationale
--> www.fao.org

Couper les URL (remonter l'adresse)

La recherche intuitive permet aussi de retrouver une page qui n'existe plus (erreur 404) ou des liens morts.

Coupez l'url à partir de la droite jusqu'à chaque /.

Q. Dans le répertoire Darwin de mes bookmarks, j'ai la page suivante http://www2.lucidcafe.com/lucidcafe/library/96feb/charlesdarwin.html qui ne fonctionne pas et me renvoie sur la page d'accueil http://www.lucidcafe.com/ (ce qui revient à couper l'url jusqu'au nom de l'hôte). Comment retrouver ma page à partir de là?
 
R. Dans la première url, le mot Library apparaît, or sur la page une rubrique porte ce nom. Sur la page http://www.lucidcafe.com/library/library.html, il existe un lien vers un index http://www.lucidcafe.com/library/categoryindex.html, une recherche dans cette page (commande+F:Darwin) me permet de retrouver la page cherchée :
http://www.lucidcafe.com/library/96feb/darwin.html
 
Q. Avec une recherche sur les trous noirs, un moteur me propose parmi ses résultats la page suivante http://membres.lycos.fr/bholes/trous-noirs.html qui me renvoie l'erreur 404 de son hébergeur. Comment faire pour retrouver la page ?
 
R. Copier l'url et la coller dans la barre d'adresse du navigateur. En coupant l'url jusque http://membres.lycos.fr/bholes on tombe sur la page d'accueil d'un site d'étudiants du secondaire consacré aux trous noirs. En cliquant sur le lien plan du menu, on constate que le lien "developpement du sujet" répondra entre autre à la question Qu'est-ce qu'un trou noir? http://membres.lycos.fr/bholes/dvpt1.html

  Des exercices sont associés à cette page (exercice 7, 8, 10 et 11)
 

AERIS - Cours - Chercher - Choisir le bon outil

Sites utiles

Les liens suivants peuvent vous aider à choisir l'outil ou le type d'outil dont vous avez besoin en fonction de votre recherche.

Exemple de choix d'outil(s) en fonction de la recherche

Les solutions proposées ici ne sont que des propositions. Elles utilisent pour la plupart les pages de la section outils.

Site d'une institution ou d'une société dont on connaît le nom

Q. Site de la FAO
R. Recherche intuitive : c'est une organisation internationale
--> www.fao.org
Q. Site de l'Unité d'Appui Multimédia
R. Recherche par champs : le nom de cette unité doit se trouver dans le titre de la page
--> Dans Google : allintitle:unité d'appui multimédia

Des ressources fiables sur une discipline

Q. Sites de qualité dans le domaine de l'environnement
R. Guide par sujets
-->Argus Clearinghouse>Environment >Ecology > environmental resources > EnviroLink Network
--> voir le résultat

Des informations fiables sur un sujet général

Q. Informations générales sur les microscopes

R. Recherche sur Answers
--> Taper microscope dans le champ de recherche
-->Nous obtenons immédiatement une page de résultat comprenant des définitions du mot "microscope" et des articles encyclopédiques issus de plusieurs dictionnaires et encyclopédies de référence, les traductions, des liens de qualité sur le sujet, des sujets connexes,... Voir le résultat

R. Recherche dans l'encyclopédie Atlas (Webencyclo). Ici l'information est gratuite mais il est nécessaire de s'inscrire.
-->Après s'être identifié, taper microscope dans le champs de saisie
-->Dans la liste des résultats, choisir microscope
-->Voir le résultat

R. Recherche d'un guide
-->Librarians' Index to the internet, taper microscope
-->Le lien Introduction to Microscopy semble être intéressant
-->Voir le résultat

Une biographie

Q. Biographie de Charles Darwin
R. Recherche dans un moteur en utilisant les opérateurs
--> Dans Alta Vista : +biographie +"Charles Darwin"
--> voir les résultats
Q. Biographie de Galileo Galilei
R. Recherche dans un moteur spécialisé
  1. recherche d'un moteur spécialisé dans les biographie
    -->Dans Websearch [disponible à la rubrique Spécialisés de la section outils], taper biography (voir les résultats)
    -->Le lien Biographical and Historical People Search - biographies of famous people semble convenir
    -->Sur cette page, choisir par exemple le site Biography.com.
  2. Taper Galileo Galilei
--> voir les résultats
Q. Biographie de Ben Laden
R. Recherche dans une "méta encyclopédie"
    -->Dans Answers [disponible à la rubrique Dictionnaires et encyclopédies de la section outils], taper Ben Laden
    -->Answers nous propose 2 réponses possibles : "Osama Bin Laden" ou "Bin Laden Family"
    -->Choisir "Osama Bin Laden"
    --> voir les résultats
 

Une bibliographie

Avant de commencer une recherche bibliographique sur un sujet, il faut toujours se demander si quelqu'un n'a pas déjà fait cet effort. Cela n'empêche évidemment pas de la compléter en bibliothèque ou sur Internet (articles et/ou abstract des revues en ligne).

Q. Bibliographie sur les variations génétiques des diatomées
R. Dans Direct Search [disponible à la rubrique Bibliographie de la section outils], cliquer sur Science/Engineering puis consulter les liens regroupés sous Bibliographies le lien Bibliography of Genetic Variation in Natural Populations semble un bon départ
--> Sur cette page, cliquer sur Search, puis taper diatom dans le champs de recherche
Q. Bibliographie sur les erreurs médicales
R. Dans Noodlelinks [disponible à la rubrique Bibliographie de la section outils] taper medical mystake

Des outils de recherche spécialisés dans une discipline

Q. Outils en Biologie
R. Librarians' Index to the Internet>Advanced search, taper biology
Q. Outils en Médecine
R. Search Engine Guide> taper medicine (ou cliquer sur la catégorie Health)
--> Voir les résulats
Q. Outils espagnols
R. Ariane> Choisir Espagne
-->Voir les résultats

  Des exercices sont associés à cette page (exercice 7, 8, 10 et 11)
 

AERIS - Cours - Chercher - Evaluer les ressources

S'il est vrai que sur l'Internet on trouve en général ce que l'on cherche (à condition de bien chercher), on y trouve aussi n'importe quoi. Or il n'est pas si évident de distinguer les informations fiables de celles qui relèvent de la désinformation ou du manque d'information.

Contrairement aux éditions papier ou même électroniques (CD-ROM), l'Internet ne bénéficient en général pas de la revue par les pairs (Peer-Review) ni d'aucune autre évaluation. La facilité de créer un site Web permet à n'importe qui d'éditer, via l'Internet, ce qu'il veut.

On trouve ainsi, sur un sujet déterminé, des pages personnelles (qui ne sont pas toujours les moins fiables), des sites commerciaux, des sites universitaires, des sites gouvernementaux, des sites d'organisations internationales... La qualité des informations disponibles est donc elle aussi très variable.

D'autre part, les informations peuvent être disponibles dans différents formats et peuvent changer ou disparaître d'un jour à l'autre.

L'URL

Premier indice de crédibilité, l'URL. Comme vu dans Comprendre l'URL d'un site, on peut déduire beaucoup de chose d'une URL , en particulier le domaine d'activité (société commerciale, université, ONG,...). Cependant, si l'analyse de l'URL d'un site donne de bons indices, ceux-ci sont loin d'être suffisants pour se faire une opinion définitive sur la qualité de l'information que l'on y trouve.

Source du document

La source d'un document doit pouvoir être identifiée avec certitude. Si elle ne se trouve pas sur la page concernée, il convient de remonter les pages jusqu'à obtenir le nom de l'auteur (si possible ses qualifications sur le sujet concerné : son CV) et le nom de l'institution s'il y a lieu.

Une fois la source obtenue, vérifiez si le nom de l'institution correspond à l'URL, si l'adresse de contact de l'auteur est l'adresse de l'institution, si le mail de contact correspond à l'institution. Attention ce n'est pas toujours le cas, mais ce sont de bons indices de crédibilité.

Exemple :
Vous trouvez un article intéressant sur la neuropsychologie de Martin Jacques, qui se dit étudiant en dernière année de doctorat de médecine à l'ULB (Université de Bruxelles).
Si cet article se trouve sur une page Web dont l'adresse est www.ulb.ac.be/~jacques/neuropsy.html ou www.ulb.ac.be/facmed/labos/neuropsy/jacques.html et que le mail de ce Monsieur Jacques est mjacques@ulb.ac.be, c'est bon signe.

Si la source ne peut-être obtenue, il vaut mieux ne pas utiliser l'information. De toute façon, ces informations sont nécessaires pour citer le document.

Actualité

La date de création et la date de dernière mise à jour sont aussi des critères essentiels pour évaluer la crédibilité d'une information. Attention, il faut bien distinguer la date de mise à jour de la forme de celle du contenu, mais bien souvent ces deux dates ne sont pas distinguées. Si la date ne se trouve pas sur la page concernée (généralement visible dans le pied de la page) procédez de la manière décrite plus haut pour l'obtenir. Enfin, certains webmasters oublient de changer la date de mise à jour . Se fier dès lors à des éléments internes au texte du site : par exemple des nouvelles datées, des allusions à des faits passés, présents ou futurs (" en 2001 les travaux porteront sur… ") etc.

D'autre part, l'actualité d'une information doit être relativisée en fonction du sujet. Il est des sciences qui évoluent au jour le jour (c'est souvent le cas en médecine et en biologie moléculaire), d'autre qui ne change pas pendant des années (systématique, ...).

De plus, des sites peuvent être de qualité lors de leur création et se laisser rapidement dépasser par les événements.

Présence de références bibliographiques

Si le contenu de la page n'est pas original ou contient des informations relatives à d'autres travaux (informations secondaires), les sources originales doivent être indiquées.

Enfin

In fine, l'évaluation d'un document électronique doit pouvoir répondre aux questions suivantes :

Outils

Grilles d'analyse de sites Web


  Un exercice est associé à cette page (exercice 9)
 

AERIS - Cours - Chercher - Citer les références

Tout document utilisé dans la rédaction d'un rapport, d'un mémoire, d'une thèse ou d'un article, qu'il soit papier ou électronique, doit être cité. Mais, pas n'importe comment! Il existe en effet des règles strictes pour citer un document qu'on ne peut outrepasser, même pour un travail d'étudiant. Autant apprendre ces règles le plus tôt possible avant de prendre de mauvaises habitudes.

Un site Web

Auteur (Organisme ou auteur personnel dans le cas d'une page personnelle). Titre de la page d'accueil, [Type de support]. Adresse URL: fournir l'adresse URL de la ressource (date: jour, mois, année de la consultation par l'usager)

Exemple: Université Laval. Bibliothèque. Site de la Bibliothèque de l'Université Laval, [En ligne]. http://www.bibl.ulaval.ca/ (Page consultée le 8 mai 1996)

Une page Web (c'est à dire un document)

Auteur. «Titre de la ressource». [S'il y a lieu, ajouter la ressource plus large à laquelle le document cité est rattaché; procéder de la façon suivante: In Auteur/titre ou titre du site ou du document qui contient la ressource.] [Type de support]. Adresse URL: fournir l'adresse URL de la ressource (date: jour, mois, année de la consultation par l'usager)

Exemple :Caron, Rosaire. «Comment citer un document électronique?». In Université Laval. Bibliothèque. Site de la Bibliothèque de l'Université Laval, [En ligne]. http://www.bibl.ulaval.ca/doelec/citedoce.html (Page consultée le 27 mars 2000)

Un groupe de discussion

Nom du groupe [Type de support]. Adresse par courrier électronique (e-mail): listserv@adresse e-mail

Exemple : Alcohol & Drug Studies [En ligne]. Adresse par courrier électronique: alcohol@lmuacau.bitnet

Un message de liste de discussion

Auteur du message. Sujet du message [Discussion]. Nom du groupe [Type de support]. (année, jour mois). Adresse par courrier électronique (e-mail): listserv@adresse e-mail

Remarque : [Discussion] dans le cas ou la citation fait référence à une discussion entre plusieurs intervenants.

Exemple : Leslie, Deborah J. Public vs. technical services: a new attack [Discussion]. Library Cataloging and Authorities Group [En ligne]. (1994, 22 septembre). Adresse par courrier électronique: autocat@ubvm.bitnet

Un message de news

Auteur. Sujet [Discussion] [En ligne]. (année, jour mois). Adresse (e-mail): Groupe de nouvelles Usenet: nom du groupe

Exemple: Palo, G. The Taj Mahal is a Hindu temple [Discussion] [En ligne]. (1993, 7 janvier). Adresse: Groupe de nouvelles Usenet: soc.history

Un message de courrier électronique

Auteur. Sujet du message. (année, jour mois). [Courrier électronique (e-mail) à la personne qui reçoit le message], [En ligne]. Adresse par courrier électronique: adresse électronique (e-mail) de la personne qui reçoit le message

Exemple: Bourgault, Thérèse. Production d'étiquettes. (1995, 9 janvier). [Courrier électronique à Rosaire Caron], [En ligne]. Adresse par courrier électronique: rosaire.caron@bibl.ulaval.ca

Un document sur un site FTP

Auteur. Titre (édition) [Type de support]. date. Adresse par FTP: Répertoire: Fichier

Exemple: Clinton, Bill. Clinton/Gore on issues of concern to gays and lesbians [En ligne]. 1992. Adresse par FTP: nptn.org Répertoire: pub/campaign.92/clinton.dir Fichier: c71.txt

Toutes ces règles sont issues du document suivant :

Caron, Rosaire. "Comment citer un document électronique? Genres de documents électronique ". In Université Laval. Bibliothèque. Site de la Bibliothèque de l'Université Laval, [En ligne]. http://www.bibl.ulaval.ca/doelec/doelec29.html (Page consultée le 26 octobre 2001)

Outils

A consulter pour en savoir plus

AERIS - Cours - Références / En savoir plus

Recherche sur Internet cours

English
Français

Le Web invisible cours

English
Français

WebBlogs cours sur la recherche d'information

English
Français

Recherche documentaire cours

Français

Evaluation des sites Web cours

Français
English

Citer les références cours

Français
English

Autres ressources

AERIS - Licence d'utilisation de ce site - CreativeCommons

Paternité - Pas d'Utilisation Commerciale - Partage des Conditions Initiales à l'Identique 2.0 (Belgique)

Vous êtes libres :

Selon les conditions suivantes :

by Paternité. Vous devez citer le nom de l'auteur original.
nc Pas d'Utilisation Commerciale. Vous n'avez pas le droit d'utiliser cette création à des fins commerciales.
sa Partage des Conditions Initiales à l'Identique. Si vous modifiez, transformez ou adaptez cette création, vous n'avez le droit de distribuer la création qui en résulte que sous un contrat identique à celui-ci.

Ce qui précède n'affecte en rien vos droits en tant qu'utilisateur (exceptions au droit d'auteur : copies réservées à l'usage privé du copiste, courtes citations, parodie...)

Ceci est le Résumé Explicatif du Code Juridique (la version intégrale du contrat) <http://creativecommons.org/licenses/by-nc-sa/2.0/be/legalcode.fr>.


Ce document est publié sous licence "CreativeCommons", AERIS, http://aeris.fr.tc © Guillemette Lauters 1999-2006