La
recherche géographique est parfois utile pour circonscrire une
recherche dans un pays et pour faciliter la résurgence de pages
pertinentes. Pourtant, ce qui semble facile ne l'est pas.
Malgré les apparences, aucun des automates n'a mis en place les
outils permettant une recherche
efficace. La convivialité n'est certes pas au
rendez-vous.
Pour arriver à faire une recherche géographique,
l'internaute
doit être familier avec les arcanes de la recherche web.
La recherche géographique se trouve sous
quatre formes: par suffixes de domaines, par pays, par régions
et par interfaces. (Voir le Tableau
de la recherche géographique par automates de recherche).
La recherche par suffixe de domaines
Dès l'apparition du
web, les sites sont divisés par noms de domaines
génériques et de pays. Mais Internet est
dominé par les États-Unis et les noms de domaines
génériques (com (commerce), edu (établissement
scolaire des États-Unis), gov
(gourvenement des États-Unis), mil (institutions militaires des
États-Unis), net (réseau), org (organisme sans but
lucratif) lui sont essentiellement liés. Trois noms de
domaines sont exclusifs: edu, gov et mil. Les noms de domaines
«com», «net» et «org» sont
cédés à des entreprises (des
«registraires») qui les louent selon le régime de
l'enregistrement à périodes variables. Ces
entreprises commercent avec laxisme. Les «pointcoms»
sont destinés aux entreprises états-uniennes. Or,
ces «registraires» ne se préoccupent pas de ceux qui
enregistrent les «pointcoms». Commerces, individus,
associations...
autant des États-Unis que des autres pays ont adopté le
«pointcom». Ils croyaient que cela faciliterait la
mémorisation de leur nom ou encore s'imaginaient que ce domaine
donnait une image internationale, bien à tort.
Aujourd'hui, la recherche en souffre. Nous sommes
confrontés à la confusion sur les sites mêmes des
automates de recherche. La place de plus en plus importante des
domaines de
pays ne peut enrayer le désordre. La main-mise des
États-Unis sur la plupart des noms de domaine
(1) et l'arrivée confuse
des récents noms comme «.info» et «.biz»
ne sont pas là pour améliorer la situation
(2). Il est faux de croire que
la recherche par suffixes de pays est un moyen sûr de le
couvrir. Il convient plutôt de l'utiliser comme un outil de
sous-ensembles.
Les automates de recherche n'ont pas imaginé
un préfixe de recherche spécifique au pays. Le
préfixe utilisé est celui du site ou du domaine.
Notons qu'AltaVista est le seul à avoir une liste
complète des codes de pays.
Un autre obstacle vient
contrecarrer la recherche géographique: la
censure (3). La censure a
été mise en évidence par une étude
de l'Université Harvard (4) mettant en
cause les interfaces
françaises et allemandes de Google. L'étude a
montré
que 113 sites des deux pays avaient été censurés
en
tout ou en partie mais qu'ils étaient disponibles sur
«google.com».
À ce jour, aucune société de recherche ne
peut
nous assurer qu'elle a une politique claire de censure.
La recherche par pays
Il est étrange de constater qu'aucun site majeur n'a mis la
recherche par pays dans son formulaire de recherche. Pourtant,
Google aurait pu l'intégrer. Il a choisi de le
séparer de son formulaire pour le mettre dans sa page d'outils
linguistiques. Il faut aller sur le site de Yahoo! pour voir un
formulaire pourvu de cette option de recherche. Sur AlltheWeb,
deux pays ont le privilège d'être un critère de
recherche: le Canada et la Grande-Bretagne. Ces deux pays ont
été insérés dans la recherche par
régions.
La recherche par régions
Les régions des automates de recherche ne correspondent pas aux
quatre continents mais à des ensembles
géopolitiques. Chacun d'entre eux rassemble les pays
désignés par leur nom de domaine. Ils ne
comprennent donc pas les sites ayant des domaines
génériques.
Quatre automates ont la recherche par régions:
AlltheWeb, Inktomi (HotBot), MSN Search (Inktomi) et Teoma.
HotBot et MSN Search ont Inktomi comme automate. Pourtant, leur
liste des régions est différente.
Les régions communes sont: l'Afrique,
l'Amérique centrale, l'Amérique du Nord,
l'Amérique du Sud, l'Asie du Sud Est, l'Europe et le Moyen
Orient.
L'Asie et l'Océanie sont couvertes par
AlltheWeb, Inktomi (HotBot) et Teoma.
MSN s'est gardé en exclusivité
l'Australasie et la Méditerranée tandis que
Inktomi/HotBot a intégré les cinq domaines de têtes
(com, edu, gov, mil, net, org) avec l'Amérique du Nord.
Cette division de l'Amérique du Nord témoigne de leur
origine chez Inktomi. Elle assimile cette
«région» aux États-Unis en tant que zone
d'influence incluant le Mexique et le Canada. (Voir le tableau de la
liste des régions par automate de recherche).
La recherche par interfaces nationales
Les interfaces nationales sont apparues rapidement sur le web pour
pallier la confusion des «pointcoms» notamment.
AltaVista et Inktomi - à travers les portails et HotBot - sont
les précurseurs. Le but des interfaces nationales est de
couvrir un pays quel que soit le domaine de tête. AltaVista
Canada avait réussi cette gageure alors qu'il était
affilié à AltaVista. Son intégration
à la «maison-mère» en 2001 a dilué sa
particularité. La banque de données a
été fondue à celle d'AltaVista.
Google a repris l'idée de l'interface nationale
jusqu'à l'hypertrophier vers le territorial. Soixante-dix
pays et territoires ont leur interface. En faisant une place
à des îles comme l'île Pitcairn, il en a fait un
facteur de vanité. Cette interface n'est en rien
différente de celle de «google.com» si ce n'est le
changement de nom, ni n'apporte un avantage à la
recherche. Il en va ainsi de beaucoup d'autres interfaces.
MSN Search a vingt-huit interfaces nationales en
plus de quatre linguistiques. MSN Search avec Inktomi donne les
meilleurs résultats. Il y a peu de présence de
pages d'autres pays à moins qu'un mot n'en appelle. Par
exemple, la requête «"moteurs
de recherche"» donne des pages canadiennes sur MSN Canada.
En ajoutant «abondance»,
le site français apparaît dans la liste de pages
canadiennes.
Conclusion
La
recherche géographique est un outil de raffinement de
recherche. Elle divise un ensemble en
sous-ensembles. Quelle que soit
la forme sous laquelle elle apparaît, elle ne peut être
considérée comme une solution. Cependant, celle qui
donne un résultat
est celle de l'interface nationale. Bien que son efficacité soit
loin d'être convaincante, elle constitue un pis-aller mieux que
la
recherche par noms de domaine, par pays et par régions.
Inktomi
avec MSN est le meilleur automate pour la recherche par pays. Il
faut
attendre que les centres de données des services de recherche
reviennent
à la division physique des données par pays ou que les
sociétés de recherche trouvent un moyen pour mieux
délimiter les frontières. Maintenant que Yahoo! a
Inktomi dans son escarcelle, il deviendra un adversaire de taille pour
Google lorsqu'il sera opérationnelle.
L'internationalisation aidant, les sites amiraux ne
sont plus arrimés aux États-Unis. AltaVista et
Google ont inséré ce pays sans tambour ni trompette dans
leur liste. La présence des États-Unis dans cette
liste peut paraître banale si ce n'est que peu de sites ont le
code de pays «us». Elle est peut-être le
prélude à l'arrivée de la mention «pages
from the United States» sur «google.com».
A l'autre extrémité, la
«nationalisation» de la recherche veut pallier cette
faiblesse. Les sites de recherche français comme AOL avec
Exalead, Voila avec son index du web francophone, AntiSearch et Dir
témoignent de ce désir de «nationalisme».
|