Amazon : Livres sur la recherche web


DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec. Canada

Contrat Creative Commons
Mise à disposition sous un contrat Creative Commons.

Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine

Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

Ancien site ( dernier message  [2005-05-24] MSN sur les traces de Google Maps)
[Atom] /
Description, analyse et commentaire sur les sites de recherche.

Google
 
Web www.dsi-info.ca
Actualités des sites de recherche avec http://www.wikio.fr/high-tech/internet/moteurs_de_recherche.

2009-05-26

 

Le Bing Bang de Microsoft


Le Bing Bang de Microsoft -- Lors du premier lancement de son site de recherche, Microsoft n'avait pas fait grand bruit. A l'époque, je pensais que Microsoft aurait passé à l'offensive publicitaire. Il faut croire que Microsoft n'avait pas grande confiance dans ses algorithmes. Peu après, Microsoft lance Live Search sans tambour ni trompette, avec quelques escarmouches.
Depuis quelques jours, la rumeur du lancement d'un nouveau site de recherche s'amplifie. Tantôt, il est attendu pour le 28 mai, tantôt pour juin. Il aurait pour nom Bing. Microsoft a enregistré les noms de domaines bing.com, bing.net, bing.ca et bing.fr entre autres. Il semble bien que cette rumeur soit avérée. Elle est aussi appuyée par une autre rumeur sur son budget publicitaire de l'ordre de 100 millions de dollars US pour le marché étasunien. Cette fois-ci, Microsoft sortirait l'artillerie lourde.
En juin, nous allons voir des changements dans l'affichage du résultat de recherche pour chacun des grands sites de recherche web. Serait-ce que le temps de morosité dans la recherche soit révolue ? Aurons-nous droit à plus de pertinence plutôt que de la poudre aux yeux ?

Libellés : , ,


2009-05-20

 

Wolfram Alpha, un complément aux sites de recherche web


Wolfram Alpha, un complément aux sites de recherche web -- Le site de recherche Wolfram Alpha l'est-il vraiment ? A vrai dire, non. L'inventeur a rassemblé un corpus d'ouvrages de référence dans lequel son logiciel recherche et modélise une réponse et la présente sous une forme factuelle.

WA est un outil intéressant, didactique mais partiel. Par exemple, ses ouvrages de références en sport couvrent le baseball, le football, mais pas le hockey. En posant une requête qui n'est pas d'ordre mathématique, Wolfram Alpha donne la liste de ses sources de références du domaine sans indiquer dans quelle source a été puisée la réponse. Au fur et à mesure que croîtra WA, les sources de références vont se diversifier. Si Wolfram Alpha veut s'internationaliser, l'équipe devra trouver des ouvrages de référence dans chacune des langues qu'il veut investir. Elle peut utiliser aussi un traducteur automatisé compte tenu que les réponses que donne Wolfram Alpha sont schématisées.

Wolfram Alpha est aussi vu comme un « moteur de recherche sémantique ». Il ne m'apparait pas comme tel. Devant un mot, il le développe en catégorie grammaticale comme le fait un dictionnaire. C'est à l'utilisateur à choisir le champ sémantique... et encore. A la requête who is Bush, WA donne Assuming "bush" is a person Use as a surname or a city instead. S'il était sémantique, il ne présumerait pas que bush est une ville avec le pronom relatif Who.
La personne présumée est George W. Bush uniquement. George Bush père est oublié. De plus, George W. Bush est identifié chef d'état - il ne l'est plus, mais de quel état. C'est bien maigre.


Heureusement, les développeurs du site ont pensé à mettre Wikipedia en complément de sa recherche encyclopédique et les sites de recherche web Google, Yahoo et Live.

Bref, Wolfram Alpha est une banque de données de connaissance avec un logiciel de recherche destiné davantage au monde universitaire.

Libellés :


2009-05-17

 

Options de recherche sur les Google anglais


Options de recherche sur les Google anglais -- Annoncées depuis une semaine, les nouvelles options de recherche sont apparues sur les sites en anglais de Google.

Qu'observons-nous?

Dans un premier bloc, il y a la recherche de vidéos, ce qui n'est pas nouveau, avec la recherche de forums (recherche dans l'URL) et de revues (recherche dans le texte - ce qui risque d'amener n'importe quel site avec ce mot).

Dans le deuxième bloc, Google sort la recherche par dates de son formulaire de recherche.

Dans le troisième bloc, nous entrons dans les nouveautés avec l'affichage d'images provenant de la page indexée. Ce n'est pas la page indexée telle que le donne Ask ou Exalead.


Dans le quatrième bloc, Google nous apporte une vraie nouveauté avec sa roue de fortune cartographiant la recherche à la manière plus sobre de Kartoo. Ce noeud dont la requête est Quebec (notez l'absence d'accent) rayonne vers des requêtes qui seront ajoutées à la requête initiale en les sélectionnant. Cette carte est à gauche du résultat de recherche.


Enfin, Google Inc. sort de son Google Experimental sa ligne chronologique. Ce qui est intéressant pour les recherches historiques.


Bien que ce ne soit pas révolutionnaire, ces nouveautés démarquent Google de ces proches concurrents que sont Live Search, Yahoo! et Ask. Est-ce que ces nouveautés seront suffisantes pour garder les internautes dans le giron de Google alors que plusieurs sites de recherche intéressants pointent à l'horizon ?

Libellés :


2009-05-01

 

Yauba, un site de recherche à essayer


Il y a une décennie, deux jeunes étudiants ont eu l'idée d'un logiciel de recherche web travaillant sur le modèle des index de citations. L'application des références de notoriété aux hyperliens allait révolutionner la recherche Web ; c'était Google. Puis sont apparus d'autres sites de recherche prometteurs comme Lexxe . La plupart ont été décevants comme Cuil. Aujourd'hui, est venu de l'Inde avec la collaboration de la Massachusetts Institute of Technology, de l'Université de Harvard et l'Université de Californie à Berkeley, Yauba.

Yauba est un automate de recherche basé sur l'intelligence artificielle. Il se présente comme étant le premier moteur de recherche qui respecte votre vie privée. Non seulement il enlève toute trace sur Internet et sur votre ordinateur, il permet aussi de naviguer anonymement.

Selon les premiers tests, il est aussi bon que Google, Yahoo! et Live Search. Mais, il a des atouts. En plus des suggestions de recherche, il donne des réponses pour affiner la recherche. Par exemple, à la requête lévesque, voici ce qu'il affiche :
A vous de choisir, la personne qui est le sujet de votre recherche.
Il donne aussi une liste de mots qui ont rapport à la requête mais qui ne la contient pas. Si vous cliquez sur un mot, il ne s'ajoute pas à la requête. Le logiciel trie les données de telle sorte que vous pouvez avoir une nouvelle présentation à chaque sélection d'un mot sans que la requête initiale soit modifiée. Ces mots peuvent aussi servir à affiner la requête par exclusion. La liste des mots n'est pas encore au point parce qu'elle ne retranche pas des déterminants comme les adjectifs démonstratifs.

La recherche dans internet peut être global ou dans l'un des onze canaux : Nouvelles en temps réel; infos traditionnelles ; nouvelles sur le web ; les blogs ; les réponses ; les images ; les vidéos ; les pdf ; les documents Word ; les documents PowerPoint et les réseaux sociaux.

La recherche peut être affinée différemment selon le canal. Par exemple, pour les informations, elle peut être affinée par mots, par date de parution ; par journaliste/agence et par domaine.

Yauba semble accepté les préfixes de recherche par exemple intitle: . Mais cela demeure un domaine à tester.

Sans hésiter, je l'ai mis dans ma liste des sites de recherche. Désormais, il fera partie des incontournables.

Libellés :



Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.