|
Le
langage
|
Le champ de recherche Date ou La recherche par intervalles de dates |
![]() Cette création est mise à disposition sous un contrat Creative Commons. |
2005-06-06 |
|
Champs et sites de recherche
Les sites de recherche ont développé des préfixes
de recherche comme nous l'avons vu avec AltaVista. Le
but de ce chapitre est d'identifier chacun de ces champs, leur
utilisation et le préfixe correspondant utilisé
par chacun des sites de recherche.
1.12 Le champ Date
|
![]() |
Le même phénomène peut être constaté sur Ask Jeeves (environ 625 notices) et Yahoo!(environ 10 000 notices).
Bien qu'Exalead se fie sur la date de publication ou de création, il n'est pas exempte d'inéquation entre l'année de copyright et la période de temps couverte avec un écart entre les deux d'une quinzaine de notices avec cette requête similaire : irak "copyright 2002" -2003 -2004 -2005 date:"01/01/2005". Comparativement à Google, la taille de l'index est d'au moins 8 pour 1 mais le taux entre les notices est de 1000 pour 1. C'est pourquoi cela nous porte à penser qu'Exalead est apparemment plus efficace que Google.
La recherche par dates prend deux formes, soit la limitation sur un ou deux ans, soit sur une intervalle de dates. Parmi les quatre chefs de file, Ask Jeeves est le seul à cumuler les deux formes de recherche. AltaVista, Ask Jeeves/Teoma et Google/Hotbot cumulent les deux. Ni Google et ni Yahoo! n'ont ces deux formes. Pourtant, ils pourraient l'inclure comme ces deux formes le sont sur AltaVista (propriété de Yahoo!) et sur le site de HotBot pour Google. Cela signifie que l'un comme l'autre pourraient améliorer leur formulaire. Enfin, Gigablast n'a pas inclus la recherche par dates dans son formulaires ; ce qui le prive d'un avantage sur ces concurrents.
Du côté des préfixes, Gigablast, Ask Jeeves/Teoma et Exalead sont les seuls à les offrir, et Ask Jeeves/Teoma le seul à en avoir développé quatre: last:, afterdate:, beforedate: et betweendate:. Gigablast et Exalead ont privilégié la simplicité avec le préfixe date:. Google a bien le préfixe daterange: mais il verse dans l'obscurantisme en utilisant le calendrier Julien et non notre calendrier grégorien. Enfin, Yahoo! aurait pu intégrer les préfixes d'Inktomi after=, before= et within= d'Inktomi, mais il n'a pas crû bon de le faire.Puisque la recherche par dates n'est pas exacte chez la majorité des automates de recherche, quelle est son utilité ? La recherche par dates est utile pour trouver des nouvelles pages et des pages mises à jour. Pour qu'elle soit efficace, la requête doit être précise et générée moins de cent notices, soit le nombre maximal de notices affichées, au mieux moins de vingt cinq. Google a l'avantage d'offrir une alerte web pour les nouvelles pages.
AltaVista et Ask Jeeves ont la plus petite période de temps de tous les sites de recherche, soit la semaine. Les deux sont adéquats pour trouver de nouvelles pages et des pages mises à jour au courant de la semaine. La même requête avec la recherche internationale - AltaVista n'a pas de recherche par pays ou géographique - et par dates donnera un résultat et un classement des notices identiques pour AltaVista Canada, AltaVista France et AltaVista États-Unis. La période est facilement modifiable - comme la requête entière - parce que le formulaire est affiché au bas de la page du résultat de recherche. AltaVista couvre les années 1980 à aujourd'hui. La recherche par périodes permet la mise en veille avec l'URL de la requête.
![]() |
AlltheWeb n'a pas de recherche par périodes. La recherche par dates se fait par plages avec les commandes à sélectionner after (après) et before (avant). Il faut cocher ces deux cases et choisir ses dates pour la recherche d'intervalles. La recherche de nouvelles pages et de pages modifiée se fait en cochant la commande after et en sélectionnant la date appropriée. AlltheWeb couvre les années 1980 à aujourd'hui. Bien que plus souple, cette méthode ne permet pas de mettre en veille avec l'URL de la requête.
![]() |
Ask Jeeves et AltaVista ont la plus petite période de temps de tous les sites de recherche, soit la semaine. Les deux sont adéquats pour trouver de nouvelles pages et des pages mises à jour au courant de la semaine. Entre les deux, Ask Jeeves a l'avantage d'être le plus développé. Ask Jeeves couvre les années 1980 à aujourd'hui. La recherche par périodes permet sa mise en veille avec l'URL de la requête.
![]() |
L'opérateur (sic) date permet de restreindre une recherche suivant la date de dernière modification ou de création d'un document.» est-il écrit dans la page d'aide d'Exalead. Si l'on en croit cette note et à l'usage, Exalead apporte le plus de pertinence parmi les automates de recherche. Bien qu'Exalead ait cet avantage, il n'en retire pas les bénéfices en développant la recherche par dates. En choisissant seulement la recherche par postériorité, il se coupe de la possibilité de la recherche par périodes pour la mise en veille de la recherche et par intervalles de dates. Une alerte pourrait remédier à cette lacune.
[Formulaire de
recherche]
![]() |
![]() |
Le format de l'élément date n'est pas uniforme. L'organisme W3C propose d'utiliser la norme ISO 8601 (2). Le format de la date normalisé s'écrit AAAA-MM-JJ où AAAA est l'année dans le calendrier grégorien, MM le mois de l'année entre 01 (janvier) et 12 (décembre), et JJ est le jour du mois entre 01 et 31.
La balise date se rencontre sous deux format :
Format courant:La recherche par la métadonnée date: n'est valable que si l'auteur de la page web l'a insérée. Elle est un gage de fiabilité. Il demeure que Gigablast est l'automate de recherche le plus pertinent en cette matière.
Chez Google, la validation de la requête avec la recherche par dates amène l'affichage de la case de recherche par dates entre la case de recherche générale et le bouton de validation. La même requête avec la recherche internationale - Google n'a pas de recherche par pays ou géographique - et par dates donnera un résultat et un classement des notices identiques pour Google Canada et Google France, mais différent pour Google États-Unis qui privilégiera les notices en anglais. La recherche par périodes permet de mettre en veille avec l'URL de la requête. Là où Google se distingue est l'alerte web.
Google propose le préfixe de recherche daterange: dans sa page Google Web Apis. L'usage de ce préfixe est rébarbatif pour l'internaute moyen. Il est nécessaire d'avoir un convertisseur de dates du calendrier grégorien au calendrier julien tel que celui disponible sur le site de Cactus 2000. Le formulaire Google Ultimage Interface du site Fagan Finder offre la recherche par intervalles de dates.
[Formulaire de
recherche]
![]() |
![]() |
Google a des périodes de temps plus développées sur le site de recherche HotBot allant de la dernière semaine à deux ans et couvrant 1994 à l'année en cours. Par conséquent, Google/HotBot facilite plus la recherche historique que le site de Google.
![]() |
HotBot France utilise l'automate de recherche Inktomi. En fait, il s'agit de Yahoo! Recherche, un avatar d'Inktomi. Comme illustré ci-après, Yahoo/Inktomi n'a pas de recherche par périodes comme Yahoo! France. En contrepartie, HotBot France couvre les années 1980 à aujourd'hui.
Les préfixes de recherche d'Inktomi after=, before= et within= sont inopérants.
![]() |
MSN n'a pas de recherche par dates orthodoxe. Il utilise un système de classement afin de trouver les pages nouvellement indexées ou modifiées. L'internaute doit ouvrir le formulaire en sélectionnant affiner votre recherche, puis ouvrir la section Classement des résultats, enfin déplacer le curseur de Mises à jour récemment vers le haut.
![]() |
MSN a placé un lien de diffusion RSS à la fin de la page du résultat de recherche. Ce lien placé dans un lecteur RSS permet d'afficher toutes les nouveautés ou les pages modifiées. MSN propose cinq lecteurs : NewsGator (plug-in Outlook) ; RSS Bandit (pour Windows) ; Bloglines (sur le Web) ; Feedster (sur le Web) et NetNewsWire (pour Mac OS X).
Chez Yahoo!, la validation de la requête avec la recherche par dates amène l'affichage de la case de recherche par dates sous la case de recherche générale. La même requête avec la recherche par pays et par dates donnera un résultat et un classement des notices différents.
[Formulaire de
recherche]![]() |
![]() |
Les concepteurs des automates de
recherche ont suivi la voie
de la
facilité en donnant l'accès sans distinction
aux nouvelles pages et aux
pages modifiées
à leur clientèle. Leur défi n'est pas
d'ajouter des raccourcis et des
gestionnaires de recherche. Leur défi est
d'améliorer la pertinence,
plus particulièrement celle de la date de publication des
documents. L'utilisation des métadonnées est une piste
à suivre. Gigablast en est le précurseur
mais son application est imparfaite. Exalead
a choisi d'indexer pour la recherche la date de création et de
modification ; ce qui
est la meilleure méthode à ce jour. Un
second défi est d'indiquer clairement les nouveaux documents et
ceux modifés, et de les trier. Google et Yahoo!
le permettent dans leurs actualités. Certaines notices de Google
et de MSN Recherche sont datées. Gigablast
identifie clairement l'un comme l'autre, mais il n'y a pas de
tri. L'amélioration de la pertinence par dates et le
classement des notices dans leur catalogue web ne sont donc pas un
travail herculien pour les concepteurs. Il leur suffit d'un petit
effort.
Sites de recherche | Formulaire | Préfixes de recherche | Exemples | |
Par périodes |
Par
plages |
|||
AlltheWeb | Non disponible | Only find results updated []after []before [01][january][1980]... [01][january][2005] |
Aucun | [X] after [20][march][2003] [28][june][2004] |
Altavista | par délai/bloc de temps [N'importe quand Semaine 2 semaines Mois 4 mois 8 mois 1 an] |
par période [01][janvier][1980]... [01janvier][2005] |
Aucun | |
Ask Jeeves | Date page was modified [Anytime Last week Last 2 weeks Last month Last 3 months Last 6 months Last year Last 2 years] ; |
[][Before] [][After] [january][1][1980] [] Between [january][1][1980] and [january][1][2005] |
last:week, 2weeks, month,
3months, 6months,
year,
2years ; afterdate:yyyymmdd beforedate:yyyymmdd betweendate:yyyymmdd,yyyymmdd |
afterdate:20010911 |
AOL / Exalead | Non disponible | Non disponible | Non disponible | |
Exalead | Ne garder que les documents postérieurs à : [JJ/MM/AAAA] | Non disponible | date>=AAAA/MM/JJ date<=AAAA/MM/JJ |
date>=2001/09/11 |
Gigablast | Non disponible | Non disponible | date:AAAA | date:2001 |
Lister les pages Web mises à jour
pendant la période spécifiée : [Date indifferente les 3 derniers mois les six derniers mois 365 derniers jours] |
Non disponible | daterange:[date julienne]-[date julienne] | daterange: 2452719-2453185 [le terme est une seule chaîne.] |
|
Google (Hotbot) | [Anytime in the last week in the last 2 weeks in the last month in the last 3 months in the last 6 months in the last year in the last 2 years] |
[][Before / After] [Month][1][1994] |
daterange:[date julienne]-[date julienne] | daterange: 2452719-2453185 [le terme est une seule chaîne.] |
HotBot.fr | Non disponible | []après []avant [01][janvier][1980]... [01janvier][2005] |
Non disponible | |
MSN Recherche | Non disponible | Non disponible | Non disponible | |
Yahoo | Update: [anytime within the past 3 months within the past 6 months within the year] |
Non disponible | Non disponible |
Page précédente: Le
champ Hyperlien |
Retour
au début de la page |
Page
suivante: Les formats d'affichage |
|
|
|
![]() |