Les deux principales aides à la recherche sont les répertoires et les outils de recherche.
Supposons que vous voulez organiser vos vacances dans le sud de la France l'été prochain et vous avez entendu parler de la ville médiévale fortifiée de Carcassonne; vous voulez en savoir davantage sur cette région et ses services touristiques.Les châteaux, mâchicoulis et créneaux vous fascinent. Vous rêvez de visiter donjons, pont-levis et oubliettes.
Voici un exemple de recherche que je vous invite à suivre, puis à réaliser par vous-même.
Choisissez AVI pour une plus belle image ou encore Sorensen pour une vidéo qui démarre plus vite sur un réseau |
Suivez le parcours fait sur Yahoo France.
Et vous y voilà! ...Onze liens; remarquez que tous ne correspondent pas à ce que nous cherchons.
Essayons maintenant un autre répertoire. Celui-ci est bien connu comme outil de recherche, mais il offre aussi un répertoire. Essayons d'y trouver Carcassonne.
Suivez le parcours sur AltaVistaComme on peut le voir, une des limites des répertoires est qu'il faut se plier à la façon d'organiser l'information de chacun... et chacun a sa façon de faire!
Les répertoires hiérarchisés sont les aides à la recherche les plus faciles à maîtriser, en bonne partie parce que des humains font patiemment le travail de classification des informations qu'on y trouve. Mais surtout, la raison du succès des répertoires, c'est le fait qu'on s'y retrouve facilement. L'organisation y est hiérarchique : du général au particulier et en fonction de thèmes. On y cherche tout comme dans la table de matières des livres ou dans la cascade de répertoires d'un disque dur d'un ordinateur.
Reprenons notre recherche entreprise avec les deux répertoires, mais avec un outil de recherche * cette fois.
Allons au site d'AltaVista(version recherche simple)
et entrons «Carcassonne» dans le champ de la requête. Cette fois-ci, on obtient plus de 700 documents ! Pas mal!
Essayez-le vous-même! Mais pourquoi est-ce qu'on obtient autant de documents de cette façon? Peut-être même qu'on en a trop!
Ici, on cherche dans un index, sorte de base de données de toutes les pages du WWW. Cet index a été créé par un automate qu'on appelle robot indexeur qui «visite» un peu comme vous les pages WWW de la planète et en rapporte le contenu textuel dans sa base de données. Lorsqu'on cherche, on cherche dans cette base de données: c'est l'index que le robot indexeur a constitué.
Quand on y regarde de plus près, on constate que dans cette liste de plus de 700 pages WWW, plusieurs sites n'ont pas ou ont peu à voir avec notre sujet de recherche, soit Carcassonne, comme région touristique. Par exemple, ceux qui offrent des services WWW dans la région de Carcassonne ou la quatrième rencontre d'un club d'astronomie à Carcassonne ou les photos d'une colonne dans une église de Carcassonne.
On n'a pas mentionné avec assez de précision ce qu'on cherchait.
Nous venons de trouver plus de 700 sites sur Carcassonne: il faudra pouvoir éliminer de cette liste ceux qui ne nous intéressent pas. Ce qu'on cherche sur Carcassonne, c'est le camping, les auberges de jeunesse, les activités, les festivals, les expositions, les musées, le tourisme, etc.
Grâce aux opérateurs booléens (AND, OR, AND NOT, etc.) nous pouvons demander les documents qui contiennent à la fois les mots «Carcassonne» ET «camping».
Sur la page de la recherche avancée:
tapons «Carcassonne AND camping».
On obtient 95 documents et plusieurs ne sont pas pertinents comme celui-ci:
http://kbyuwww.byu.edu/tv/listings-march.html
qui présentait l'horaire d'une station de télé américaine. Mais comment cela se fait-il?
En consultant cette page on constate qu'il y avait une émission le 28 mars 1996 sur Carcassonne:
10 pm Travels in Europe with Rick Steves: "The French Riviera and Carcassonne."
Puis plus loin une autre émission le dimanche matin :
7:30 am Shining Time Station: "Schemer Goes Camping."
On constate que l'outil de recherche NE FAIT PAS LES LIENS DE SENS que nous faisons implicitement entre les deux mots Carcassonne et Camping: IL SE CONTENTE DE TROUVER LES LETTRES qui composent ces deux mots dans la même page WWW: et ça peut être deux mots très éloignés, comme ici.
Il y a d'autres moyens de restreindre et d'éliminer un grand nombre de documents qui n'ont pas rapport avec notre sujet. L'opérateur à utiliser alors est NEAR.
Carcassonne NEAR Camping.
Cette expression permet de trouver des documents qui contiennent ces deux mots, mais suffisamment rapprochés pour qu'il y ait une plus grande probabilité de lien de sens entre les deux; les deux mots ne doivent pas être à plus de dix mots de distance. Cette fois-ci on trouve cinq documents et le premier qui apparaît risque de nous satisfaire.
http://www.mnet.fr/carcasun/carnaut.html
Faites le même genre de recherche sur Carcassonne avec les mots «festival», «exposition» et «tourisme». Que remarquez-vous?
Allez-y expérimentez!
Mieux encore: menez une recherche sur une ville qui vous intéresse, vous!
La compagnie d'ordinateurs Digital offre le service de son moteur de recherche AltaVista dans plusieurs langues et on peut chercher à partir de différents serveurs un peu partout sur la planète.
Choisissez AVI pour une plus belle image ou encore Sorensen pour une vidéo qui démarre plus vite sur un réseau |
Il y a au moins sept serveurs AltaVista sur la planète et des dizaines de sites AltaVista dans différentes langues. Tous les sites AltaVista ne sont pas strictement équivalents. Au moment de la rédaction de ce document, par exemple, la traduction en français de l'aide d'AltaVista n'était pas terminée sur le site AltaVista du Canada, mais elle l'était en France. De plus, le site AltaVista à Palo Alto USA offre des fonctionnalités qui ne sont pas encore disponibles sur les autres sites d'AltaVista dans le monde, mais ces ajouts ne sont pas nécessairement des avantages pour le chercheur débutant.
3/23