Comment effectuer une recherche sur la toile.

 

 

Il existe une énorme quantité d'informations sur Internet (plusieurs millions ou milliards de documents), et ces informations sont pour la  plupart renouvelées quotidiennement. Le moteur de recherche est un élément indispensable pour s'y retrouver!

 

Le moteur de recherche

 

Un moteur de recherche (Searchbot en anglais) est une machine spécifique (matérielle et logicielle) chargé d'indexer des pages web afin de permettre une recherche à l'aide de mots-clés dans un formulaire de recherche.

 

Fonctionnement d'un moteur de recherche

 

Des robots (logiciels), appelés spiders (en français araignées) sont chargés de parcourir la toile en suivant récursivement les liens des millions de pages Web et indexent le contenu dans de gigantesques bases de données afin de permettre leur interrogation.

 

Aucun moteur de recherche ne peut parcourir la totalité des pages en une journée (ce processus prend généralement plusieurs semaines), chaque moteur adopte donc sa propre stratégie, certains allant même jusqu'à calculer la fréquence de mise à jour des sites.

 

Utilisation d'un moteur de recherche

 

Lorsque l'utilisateur d'un moteur de recherche remplit le formulaire, il spécifie les mots qu'il cherche (éventuellement ceux qu'il ne souhaite pas) grâce aux opérateurs booléens "et", "ou", "non" ... (symbolisés par +, -,...), la requête est envoyée au moteur de recherche qui consulte ses bases de données pour chacun des mots puis affine la recherche en enlevant les pages ne convenant pas, puis retourne une liste de liens vers des pages, avec le début du texte de la page ou le texte spécifié par le créateur de la page grâce aux balises spécifiques, appelées méta-tags.

 

Ces réponses sont classées dans un ordre de pertinence, correspondant à des critères propres au moteur de recherche, tels que le pourcentage de mots correspondant à la recherche, leur indice de densité (le nombre d'occurence de chacun des mots clés dans la page), etc.

 

Rechercher sur Internet

 

Etant donné le nom de pages web présentes pour le Web, il est nécessaire d'utiliser un outil pour rechercher une page spécifique correspondant à des critères de recherche: le moteur de recherche.

 

Pour utiliser un moteur de recherche, il suffit de saisir des mots-clés dans un champ prévu à cet effet, de valider et d'attendre les réponses du moteur. Il est donc nécessaire dans un premier temps de déterminer le type de mots permettant de trouver au mieux l'information recherchée.

 

Le moteur cherche les pages contenant ces mots clés ou pointées par des sites à l'aide de liens hypertextes contenant ces mots-clés. Toutefois, la recherche peut être totalement différente selon que les mots clés utilisés sont séparés par des espaces, entourés par des guillemets, ou bien séparés avec un opérateur particulier. Il peut donc être nécessaire dans un second temps d'affiner sa recherche avec des mots-clés supplémentaires et des opérateurs spécifiques (le tableau ci-dessous récapitule les types d'opérateurs et le résultat que leur emploi engendre).

 

Si le moteur ne trouve aucun résultat et renvoie un message du type « Aucune réponse ne correspond à vos critères », il faut alors élargir la recherche avec d'autres mots clés en rapport avec le sujet de votre recherche, ou bien en enlever certains.

 

Dans le cas contraire, c'est-à-dire trop de réponses, il faut resserrer la recherche en ajoutant des contraintes, comme l'obligation de donner les réponses contenant uniquement tous les mots demandés ou bien en excluant des mots.

 

Les opérateurs de recherche

 

Type de recherche

Requête à formuler

Nom propre

Taper le nom du sujet

Phrase

Taper la phrase entre guillemets
"phrase à rechercher"

Contenant tous les noms

Utilisez le ET booléen ou le NEAR pour limiter la recherche:
+nom1 +nom2 +nom3

Contenant au moins un des noms

Utilisez le OU booléen
nom1
+ nom2 + nom3

Ne contenant pas un mot

Utilisez le NON booléen
nom1 + nom2
-nom3

Nom avec plusieurs
terminaisons possibles

Utilisez la notion de troncature: nom*
le moteur cherchera les pages contenant les mots:
nom, nommé, nomination, nombre, nomade ...

~ Majuscules ~

·                     Si vous tapez le mot en minuscules, le moteur
vous donnera les réponses en minuscules et en majuscules

·                     Si vous tapez le mot avec des majuscules, le moteur
vous donnera uniquement les mots en majuscules.

 

Un exemple de recherche

 

Imaginons que vous voulez chercher des pages web parlant des saule-pleureurs sur le moteur de recherche Altavista...

 

Si vous tapez: saule pleureur le moteur va vous renvoyer toutes les pages contenant le mot saule plus toutes les pages contenant le mot pleureur (plus bien évidemment celles contenant les deux mots mais qui seront noyées dans la masse de documents...)

 

Tapez maintenant: saule-pleureurs le moteur ne vous retourne à présent qu'un nombre limité de pages contenant le mot saule-pleureurs (au pluriel), vous excluez donc tous les mots au singulier (saule-pleureur)

 

En tapant: saule-pleureur* Vous avez maintenant les mots saule-pleureur et saule-pleureurs, mais PROBLÈME, il vous manque les pages écrivant saule-pleureur des façons suivantes:

 

·         saule pleureur

·         saules pleureurs

·         saule-pleureurs

·         saule - pleureur

·         saule/pleureur

·         ...

 

Il s'agit donc de trouver un moyen d'avoir toutes les terminologies possibles, ce moyen est le suivant: tapez:  +saule* +pleureur*  Vous aurez alors toutes les pages contenant au moins un mot commençant par chacune des racines saule et pleureur

 

CONCLUSION: La recherche optimale doit être faite en fonction de votre attente, elle est généralement différente de la recherche basique, mais permet de gagner un temps certain!

 

Récapitulatif

 

Opérateur Booléen

Résultat

+nom1 +nom2

Renvoie les documents contenant les 2 mots cherchés

nom1 + nom2
ou
nom1 nom2

Renvoie les documents contenant un des 2 mots cherchés (ou les 2)

+nom1 -nom2

Renvoie les documents ne contenant pas le mot qui suit l'opérateur -

nom*

Renvoie les documents contenant les mots proches du mot cherché

guillemets

Renvoie les documents contenant la phrase entière

Essentiel (+)

Le symbole "+" classifie un mot comme essentiel

Exclusion (-)

Le symbole "-" exclut un mot de la recherche

 

Les recherches sur les moteurs courants

 

Voici un tableau présentant les opérateurs pouvant être utilisés sur les moteurs les plus courants:

 

 

All the web

Altavista

Ecila

Excite

Google

Voila

Webcrawler

ET

+

+

ET ou &

+ ou AND

Par défaut ou +

+ ou ET ou AND

+ ou AND

OU

non

par défaut

OU

par défaut ou OR

non

par défaut ou OR ou OU

par défaut ou OR

PROCHE

non

NEAR ou ~

PROCHE ou ~

non

non

PROCHE ou NEAR

non

SAUF

-

AND NOT ou !

NON ou !

- ou AND NOT

-

- ou NOT ou SANS ou AND NOT

- ou NOT

PHRASE EXACTE

" "

" "

" "

" "

" "

" "

" "

TRONCATURE

non

*

non

non

non

non

non

ACCENTS PRIS EN COMPTE

oui

oui

indiff.

oui

oui

indiff.

oui

MAJUSCULES

indiff.

indiff.

indiff.

indiff.

indiff.

indiff.

indiff.

MOTS ORDONNES

indiff.

oui

indiff.

indiff.

oui

indiff.

indiff.

 

Source: Le Monde Interactif "Comment Ça Marche"(www.commentcamarche.net)