Amazon : Livres sur la recherche web


DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec. Canada

Contrat Creative Commons
Mise à disposition sous un contrat Creative Commons.

Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine

Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

Ancien site ( dernier message  [2005-05-24] MSN sur les traces de Google Maps)
[Atom] /
Description, analyse et commentaire sur les sites de recherche.

Google
 
Web www.dsi-info.ca
Actualités des sites de recherche avec http://www.wikio.fr/high-tech/internet/moteurs_de_recherche.

2009-08-07

 

Le révisionnisme de Yahoo ! selon Danny Sullivan


Le révisionnisme de Yahoo ! selon Danny Sullivan -- M. Danny Sullivan est une autorité dans les services de recherche web. Il a écrit le billet Revisionist History: Bartz Claims Yahoo Was Never A Search Engine dans lequel il argumente sur la nature de Yahoo ! comme « search engine ». Cette fois-ci, ce cher M. Sullivan me déçoit en confondant un répertoire et un « search engine ». Dès le début, Yahoo ! était un répertoire de liens soumis par des « webmestres » avant la lettre. Les hyperliens étaient classés selon une nomenclature par des indexeurs. Il avait un logiciel de recherche interne pour son répertoire et non un « search engine », c'est-à-dire un logiciel parcourant le web d'hyperliens en hyperliens à l'aide de « robots indexeurs » afin d'indexer des documents web. Yahoo! a utilisé les « search engines » AltaVista, Inktomi et Google en complément de son répertoire. Lorsque Google a pris son envol en solo et que la compagnie a prouvé la rentabilité d'un « search engine » en pleine bulle technologique, Yahoo! est entrée dans la course en achetant AltaVista et AlltheWeb (avec l'achat d'Overture) et en acquérant Inktomi. C'est à partir de cet instant que Yahoo! s'est identifiée à un « search engine » et a négligé son répertoire. S'il est vrai que le fondement de Yahoo! était la recherche et le classement d'hyperliens dans une base de données à laquelle l'internaute avait accès par un logiciel de recherche, il est faut de prétendre qu'il était un « search engine » composé d'une banque de données (c'est-à-dire de documents) alimentée par des « robots ». L'ambiguïté de cette expression a été transposée en français par le « moteur de recherche » utilisé autant pour désigner un logiciel de recherche traditionnel et un logiciel de recherche web. C'est la raison pour laquelle j'ai préféré faire la distinction entre un répertoire et un « automate de recherche ». Ce n'est peut-être pas vendeur, mais ça a l'avantage de ne pas tomber dans le panneau comme l'a fait allègrement M. Sullivan.
Le billet de M. Sullivan est parti de cette citation :

Yahoo Chief: ?We Have Never Been a Search Company?

Cher M. Sullivan, ne confondez pas non plus Search Company et Search Engine.
Donc, au début, Yahoo! était un répertoire que l'on classe parmi les outils de recherche ou de référence. Est-ce que Yahoo! était une compagnie de recherche web ? Oui, parce que les employés de Yahoo! indexaient les sites web qui lui étaient soumis et qui lui sont encore soumis pour son répertoire. Est-ce que Yahoo! était un search engine ? Non.
Que peut-on espérer de l'avenir de Yahoo ! le répertoire ? La réponse est loin d'être claire. Est-ce la pdg de Yahoo! nous signifie qu'elle va abandonner le répertoire ? Dans la nouvelle page d'accueil de Yahoo! US, le répertoire est encore présent. Dans celle de Yahoo! France, il n'y a plus de répertoire, ni dans Yahoo! Québec, d'ailleurs. Est-ce que le raccourci du répertoire de Yahoo! US dans Yahoo! Search sera abandonné avec l'arrivée de Bing ?

Libellés : , ,


2007-12-11

 

AskEraser supprime vos requêtes sur Ask


AskEraser supprime vos requêtes sur Ask -- IAC Search & Media vient de lancer sa fonction de suppression des requêtes AskEraser sur Ask États-Unis et Ask Royaume-Uni. Lorsque vous actionnez cette fonction, toute la personnalisation du site est effacée des serveurs de Ask, adresse IP, gestionnaire de recherche (pages consultées et sauvegardées), fichiers témoins, y compris l'habillage. Les informations personnelles ne sont pas effacées immédiatement. La suppression dépend des activités d'entretien des serveurs.
AskEraser est affichée sur la page du résultat de recherche. Elle peut être activée à tout moment.
Parce que AskEraser efface les informations personnelles sur ses serveurs, il est probable que cette fonction soit aussi active sur Ask France même si elle n'est pas officiellement présente. Une vérification rapide a validé cette hypothèse. Si vous voulez faire des recherches anonymement sur Ask France, commencez par mette un habillage qui servira à vérifier l'activation de AskEraser, allez sur Ask États-Unis ou sur Ask Royaume-Uni en utilisant les onglets, puis activez AskEraser. Retournez dans l'onglet de Ask France et rafraichissez la page. L'habillage devrait disparaitre ce qui confirmera que vous ferez des recherches anonymement durant votre session de recherche. AskEraser sera désactivée automatiquement quelques heures plus tard. Vous devrez le réactiver à chacune de vos sessions.

Source :
Ask Launches AskEraser, Ask's Official Blog, 11 décembre

Libellés : , , ,


2007-10-02

 

Ask.com pleinement en français?


Ask.com pleinement en français ? -- Ask.com est un site de recherche sous-estimé. Après avoir fait un début modeste en France, IAC Search & Media ouvre tranquillement les vannes pour donner à son site de recherche français (fr.ask.com) toute la puissance pour devenir un acteur majeur. Dans son ensemble et pour des recherches générales, il surpasse ses concurrents notamment avec ses réponses flash comme les fiches encyclopédiques pour les pays de l'Union européenne. Cette fonction est peu développée pour l'interface française. Si IAC veut imposer Ask dans l'Hexagone et même dans la francophonie, il lui faudra offrir les mêmes caractéristiques qu'Ask.com. Il faudrait aussi que son logiciel de recherche soit identique et que sa présentation multimédia soit aussi bien intégrée. Or, il souffre du même syndrome que Yahoo! Ask.com et Yahoo.com reconnaissent les mots accentués. Ils peuvent distinguer tâche et tache, cote et côte, acre et âcre, pate et pâte, thé et the, etc. Mais non les versions françaises même en ajoutant l'opérateur + (désigné par Google pour une recherche d'un mot exact) ou les guillemets anglais. Ask France a un léger avantage (!) sur Yahoo! France en distinguant Paris de Pâris. Ask et Yahoo! osent prétendre rattraper Google en n'offrant pas aux Français le même logiciel de recherche. SVP, ayez la courtoisie d'offrir le même produit de base.

Libellés : , ,


2007-01-12

 

Google n'a rien à craindre de l'Europe


Google n'a rien à craindre de l'Europe -- En 2006, la France s'élevait pour arrêter la marche victorieuse de la société Google. Le projet franco-allemand Quaero devait engendrer un automate de recherche rivalisant avec le Géant. La société Exalead devait profiter du projet pour améliorer son logiciel de recherche web, notamment dans le secteur prometteur de l'audiovisuel. Fin 2006, l'Allemagne se retire du projet pour faire cavalier seul. Elle privilégiera la recherche sémantique avec son projet Theseus.
Janvier 2007, un nouveau projet européen est annoncé. La société norvégienne revient dans le décor avec son projet de recherche audiovisuel PHAROS,(Platform for Search of Audiovisual Resources Across Online Spaces). L'Europe se disperse avec trois projets en cours : Quaero, Theseus et Pharos.
Une question est posée : est-il pertinent de créer un automate de recherche européen ? La réponse est oui. Elle est affirmative parce que les sociétés de recherche étasuniennes concentrent leurs innovations pour leur marché. Google France est bien pauvre face à Google États-Unis. Yahoo! France est aussi faible (sa pertinence est déficiente pour les mots accentués en comparaison à Yahoo! États-Unis), mais elle se démarque davantage avec ses raccourcis que Google France. Pourtant Google France est le site de recherche le plus utilisé dans l'Hexagone. Windows Live Search de MSN France est aussi une pâle copie de MSN USA, tout comme Ask France face à Ask.com.
Exalead saura-t-elle offrir de l'innovation à la hauteur de ses concurrents étasuniens ? La France ne manque pas d'initiatives. Que l'on pense à Kartoo et UJIKO, à Webzzle, à Fooxx. Mais aucune d'entre elles n'est adapté à la langue française afin d'améliorer la pertinence. Microsoft, Yahoo et Google sont occupées à étendre leurs services de recherche plus qu'à améliorer leur logiciel de recherche web. C'est le temps de franchir le Rubicon. La France osera-t-elle le faire résolument ?

Libellés : , , , , , , , , ,


2006-12-31

 

Wikiasari dites-vous ?


Wikiasari dites-vous ? -- M. Jimmy Wales, fondateur de la cyberencyclopédie Wikipédia, a l'ambition de concurrencer Google. Il projette de lancer en 2007 (le premier trimestre est mentionné) un site de recherche sur le modèle collaboratif de son encyclopédie Wikipédia. Plusieurs commentateurs avancent le nom Wikiasari.
En 2004 avait été lancé le projet de logiciel de recherche Wikiasari. Un an plus tard, il a été abandonné. Le projet de M. Wales est tout autre et ne reprendra pas le nom de Wikiasari.
Le nom de Wikisearch a été lancé aussi. Wikisearch est le nom du logiciel de recherche de la communauté Wikipedia en collaboration avec searchme.com. Le nom de Wikisearch ne sera pas celui du nouveau site de recherche.
Parmi les investisseurs dans le projet de l'automate de recherche, le cyberlibraire Amazon est cité. Amazon est un donateur de la fondation Wikimedia tout comme peuvent l'être Yahoo! et Google. Le don d'Amazon n'est pas directement relié au projet de l'automate de recherche.

Yahoo! et Google, entre autres services de recherche, intègrent partiellement l'encyclopédie Wikipédia dans leurs résultats de recherche. Wikipédia serait sans doute mieux servie si elle avait son propre automate de recherche autant pour mettre en valeur ses projets wiki (actualités, citations, dictionnaires, encyclopédies...) que pour indexer le web.

Le nouvel automate de recherche s'appuierait sur le logiciel Nutch, un projet d'Apache Lucene. Le groupe de travail francophone Fructh (Francopho Nutch) publie un carnet web à propos de Nutch. Pour en voir une application, allez sur le récent site de recherche Misterbot (Lire Misterbot adopte Nutch Moteur de recherche Open source ?)

D'autres ont essayé sans réussir. Ce n'est pas que Google soit plus pertinent que les autres. Ce qui leur manque c'est le capital de sympathie qu'à Google. M. Wales pense réussir son coup grâce à la notoriété de Wikipédia. Espérons que les pages plébiscitées par les contributeurs, quel que soit le système choisi, ne souffriront pas d'éditorialisme aigu et d'approximation approximative comme l'article wikipédique sur le Québec ! Le concours pour trouver le nom du nouveau site de recherche est ouvert. Souhaitons prospérité au nouveau venu.

Lire :
Misterbot adopte la technologie de recherche open source Nutch, VNunet France, 10 mars 2003
Qu'est ce que Nutch ?, Misterbot, sd. (comprend l'analyse comparative Nutch / Google en anglais - format pdf)

Libellés : , , , , , ,


2006-12-24

 

Nouvelle interface de recherche pour Ask


Nouvelle interface de recherche pour Ask -- Le service de recherche Ask teste une interface synoptique pour le résultat de recherche sur Ask X, le site de recherche expérimental. Cette interface est divisée en trois colonnes. La colonne de gauche est statique. Elle comprend la case de recherche, les termes reliés et les suggestions de recherche. Toutefois, le formulaire de recherche en est absent. Les colonnes du centre et de droite sont sur une même page défilante. La colonne centrale affiche les notices et celle de droite un aperçu du résultat de recherche pour les services de Ask.
Cette interface synoptique est particulièrement réussie pour les requêtes factuelles comme sur un pays. Par exemple, la requête Canada donne une courte fiche du pays fournie par le site de la CIA. La colonne de droite fournit la météo, l'heure courante et une carte de la capitale Ottawa, des photos et le début d'une entrée du dictionnaire American Heritage. La requête Jean Charest, premier ministre du Québec, offre photos, billets, entrée encyclopédique de Wikipedia. L'actualité s'ajoute le cas échéant soit en tête des notices soit dans la colonne de droite.
Chaque notice est mise en évidence au passage du curseur.
Bien que Ask soit destiné au marché étasunien, il est utile pour la plupart des requêtes factuelles en anglais... et internationales surtout s'il s'agit d'émoticons ;-) .

Libellés : , ,



Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.