RessourcesMoteurRechercheWeb
Le site K-praxis est un portail consacré à la
gestion de l’information structurée ou non. Cette semaine il propose un article
consacré à ce qu’il considère comme étant une nouveauté dans la recherche
d’informations et qu’il nomme "prospective search".
Il s’agit d’utiliser des moteurs proposant une
information identifiée dans le temps et de créer des alertes sur les
résultats d’une requête afin d’être prévenu des nouvelles urls
indexées.
information identifiée dans le temps et de créer des alertes sur les
résultats d’une requête afin d’être prévenu des nouvelles urls
indexées.
J’en vois certains sourire d’avance. En effet c’est
ce que fait nombre de veilleurs depuis des années en utilisant des moyens certes
plus artisanaux mais tout aussi efficaces:
ce que fait nombre de veilleurs depuis des années en utilisant des moyens certes
plus artisanaux mais tout aussi efficaces:
- Prenez un logiciel ou un service de surveillance de
page web (au hasard Trackengine, Wysigot, …) - Lancez une requête dans un moteur ou un métamoteur
de recherche permettant le tri par date - Effectuez le tri du plus récent au plus
ancien - Capturez cette url dans votre logiciel (à
condition que ce soit une requête de type "get")
Et voilà, vous venez de créer un système qui vous
alertera dès qu’une nouvelle page apparaîtra dans votre requête. Vous faisiez de la "prospective search" sans le savoir.
alertera dès qu’une nouvelle page apparaîtra dans votre requête. Vous faisiez de la "prospective search" sans le savoir.
K-Praxis oppose ce type de recherche à la recherche
classique dans la base existante d’un moteur qu’il nomme
"retrospective search".
classique dans la base existante d’un moteur qu’il nomme
"retrospective search".
La seule donnée intéressante de cet article c’est
qu’il donne quelques noms (certes déjà connus) de moteurs spécifiquement
orientés vers ce type de recherche (Pubsub, Feedster, Technorati, Blogpulse et Bloglines).
qu’il donne quelques noms (certes déjà connus) de moteurs spécifiquement
orientés vers ce type de recherche (Pubsub, Feedster, Technorati, Blogpulse et Bloglines).
Il faut aussi cependant reconnaîre que ces moteurs
présentent des informations dont la datation est beaucoup plus fiable que celle
des moteurs généralistes (voir ce précédent post) car issues de fils rss
encapsulant entre autres la date de mise en ligne.
présentent des informations dont la datation est beaucoup plus fiable que celle
des moteurs généralistes (voir ce précédent post) car issues de fils rss
encapsulant entre autres la date de mise en ligne.
A part ça la méthode en elle-même est rodée depuis
longtemps.
longtemps.