SERVICE DE
RECHERCHE
DOCUMENTAIRE
Service de recherche documentaire DSI
par Marc Duval, bibliothécaire

Classement
des automates de recherche.

Le classement selon les requêtes

Partie 9 : La non-correspondance



 Introduction

Les répertoires

 Les noms de domaines

Classement des sites de recherche
 La nature du web

Les automates

Les bases de données

 Actualités
 Le mot-clé

 Le langage de recherche
 Formulaire de recherche web
 Les brèves
 Le web universitaire
 Partie 1
 Les départements
 Le web universitaire
 Partie 2
 Les bibliothèques
 Le palmarès des villes :
 un exemple de recherche
 Accueil



 

  • Introduction
  • Le protocole de recherche
  • Les critères de classement
  • Le classement des automates de recherche

  • Tout comme le code d'erreur, la non-correspondance entre les termes de recherche et la référence dénote une mise à jour soit trop longue, soit déficiente.  Quatre tableaux sont présentés ici :   1- Tableau selon la non-correspondance, 2- Tableau  selon les termes absents, 3- Tableau  selon les pages d'actualités, 4- Tableau  indicatif  selon les mises à jour.
    Dans le premier tableau,  AltaVista Belgique est en première position parce qu'il a été mis en ligne au printemps de 2001.  A l'extrémité, AltaVista Canada reçoit la pire note.  Son entrée dans le giron de la maison-mère semble avoir été précipitée.  Hormis AltaVista Belgique, Excite Canada/USA a le pourcentage de non-correspondance le plus bas.
    Le deuxième tableau nous révèle un fait intéressant : les automates en rouge sont sensibles au spam, c'est-à-dire aux mots absents de la page, mais présents dans la page source soit dans les méta-données, soit camouflés dans la page même.
    Le troisième tableau nous montre le pourcentage des pages de sites d'actualités dans lesquelles un des termes est absent.  Avec ce tableau, nous pouvons pressentir la politique d'indexation des sociétés de recherche, notamment de Fast Search qui semble orienter ses efforts vers une distinction des types de documents.  Il est à noter que cette étude a été menée avant la politique d'ajout massif des nouvelles chez Google.

     
    1 - Tableau selon
    la non-correspondance
    Rang
    Automates
    %
    1 AltaVista
    Belgique
    0,63%
    2 Excite
    Canada/USA
    1,88%
    3 Lycos USA 2,50%
    4 AllTheWeb 2,71%
    5 Lycos Canada 3,75%
    6 Excite France 4,17%
    7 Lycos France 4,79%
    8 Google français 4,79%
    9 MSN 5,21%
    10 Northern Light 7,71%
    11 HotBot France 7,71%
    12 AltaVista
    France
    8,54%
    13 Voila 8,75%
    14 HotBot USA 8,96%
    15 AltaVista USA 10,42%
    16 AltaVista
    Canada
    28,33%
    480=100%
    2 - Tableau selon
    les termes absents
    Rang Automates %
    1 Excite
    Canada/USA
    0,00%
    2 AltaVista
    Belgique
    0,21%
    3 MSN 1,67%
    4 Lycos USA 2,08%
    5 Excite France 2,50%
    6 AllTheWeb 2,71%
    7 Lycos Canada 2,92%
    8 Google français 3,13%
    9 Lycos France 4,38%
    10 AltaVista
    France
    5,00%
    11 Northern Light 5,83%
    12 HotBot France 6,04%
    13 HotBot USA 6,67%
    14 AltaVista USA 6,88%
    15 Voila 7,71%
    16 AltaVista
    Canada
    24,17%
     
    3- Tableau selon
    les pages d'actualités
    Rang Automates %
    1 AllTheWeb  0,00%
    2 AltaVista
    Belgique
    0,42%
    3 Lycos France  0,42%
    4 Lycos USA  0,42%
    5 Lycos Canada  0,83%
    6 Voila  1,04%
    7 Google français  1,67%
    8 Excite France 1,67%
    9 HotBot France  1,67%
    10 Excite
    Canada/USA
    1,88%
    11 Northern Light  1,88%
    12 HotBot USA  2,29%
    13 AltaVista
    France 
    3,54%
    14 MSN  3,54%
    15 AltaVista USA  3,54%
    16 AltaVista
    Canada
    4,17%
     
    Tableau  selon la mise à jour
    Rang Automates Erreurs Non-corr
    Total 
    1 Excite Canada/USA 3,96% 1,88% 5,84%
    2 AltaVista Belgique  7,08% 0,63% 7,71%
    3 Lycos US  5,21% 2,50% 7,71%
    4 Excite France 3,75% 4,17% 7,92%
    5 AllTheWeb  6,04% 2,71% 8,75%
    6 MSN  3,75% 5,21% 8,96%
    7 Lycos Canada  5,42% 3,75% 9,17%
    8 Google français  5,42% 4,79% 10,21%
    9 HotBot France  3,54% 7,71% 11,25%
    10 Lycos France  6,67% 4,79% 11,46%
    11 Northern Light  5,00% 7,71% 12,71%
    12 AltaVista USA  3,33% 10,42% 13,75%
    13 HotBot USA 6,88% 8,96% 15,84%
    14 Voila  8,75% 8,75% 17,50%
    15 AltaVista France  14,38% 8,54% 22,92%
    16 AltaVista Canada  3,33% 28,33% 31,66%
    480 = 100
    Erreurs = Codes d'erreurs
    Non-corr = Non-correspondance
    Le tableau ci-contre est indicatif des périodes de mises à jour et de leur efficacité.  Excite est premier dans ce domaine.  L'avenir d'Excite semblant compromis aux dernières nouvelles, son absence pourrait être ressentie.  Les nouveaux automates de recherche tels que Teoma n'ont pas encore atteint la maturité d'Excite.
    Voila est encore à la traîne.  Une vérification de routine avec l'une des questions faite quelques jours avant la rédaction de ce texte a donné le même résultat, suggérant que Voila n'a pas fait de mise à jour depuis plusieurs mois.
    Pour l'instant, le pourcentage d'erreurs toléré par les sociétés de recherche dans les mises à jour apparaît être de 10%.
    *Les sites Excite Canada et Excite France ont disparu en décembre 2001.  Excite USA a retiré son formulaire avancé.
    ***
    page
    8a
    8b
    8c
    8d
    8e
    8f
    8g
    8h
    8i
    8j
    8k
    8l

    Classement des formulaires Conclusion
     
    Page
    1
    2
    3
    4
    5
    6
    7
    8
    Haut de la page

    Service de recherche documentaire DSI. 1280-4, boulevard de Montarville. Longueuil. Québec. Canada. J4B 8B4. Tél.: 450-655-3709 / Tlc.:450-655-8201 courriel: marcduval@dsi-info.ca
    Adresse de cette page : Marc Duval. (Page créée le 19 novembre 2001).  « Classement des sites de recherche ». [En ligne]. Longueuil. Québec, ©2001. http://www.dsi-info.ca/moteurs-de-recherche/classement-requetes8i.html
    Cette page a été éditée le 20 novembre 2001
    ©2001. Marc Duval.
    Mots clés : Bibliothèques (vedettes matières) : recherche sur Internet -- évaluation ;  recherche de l'information ; recherche documentaire ; ouvrages de références -- évaluation ; ouvrages de références -- classement ; gestion de l'information  / Nomade : recherche sur le Web / ODP : recherche sur le Net / Toile du Québec : gestion de l'information ;  Internet - Guides ; guides perfectionnement à la recherche / Voila : internet - recherche d'info sur le web / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation / Pages jaunes : renseignements-service Longueuil