OutilsVeille – OutilsRss – OutilsMoteurRechercheNews
Dans un article de Veille Magazine paru en novembre 2003 j’insistai sur l’intérêt que présentaient les blogs et le format Rss qui leur était généralement associé dans un processus de veille sur internet. Depuis, le Rss (ou d’autres formats assimilés), s’est largement répandu pour être notamment proposé par de nombreux journaux et magazines en ligne, ou encore par les portails d’information mettant à disposition leurs articles, comme Google News ou Topix.
Ces derniers collectent des milliers de sources qu’ils rendent accessibles via quelques mots-clés. Autant dire qu’ils mettent l’information à portée de main d’un veilleur. Pourtant il est possible d’aller beaucoup plus loin en tirant profit du format OPML. Créé par Dave Winer il permet de fondre dans un même fichier plusieurs fils Rss et de les monitorer dans un agrégateur classique. J’ai repéré au moins trois services interrogeant plusieurs moteurs de news et agrégeant leurs résultats dans un fichier OPML unique:
- Kebberfegg (voir ce précédent billet) vous permet de générer des fichiers OPML à partir d’une cinquantaine de moteurs de news (attention il semble avoir des problèmes à fonctionner avec Firefox 1.5)
- Monitor This permet de surveiller via OPML 22 moteurs de news ou de blogs.
- Blauerbote est un nouveau portail de gestion de fils rss de conception allemande bourré de fonctionnalités. En fait il y en a presque trop et cela rend l’offre difficile à lire. Il rend néanmoins possible (entre autres choses) la création de fichiers OPML provenant de multiples moteurs classés par catégories ainsi que par pays.
Mode d’emploi pour tirer parti au mieux de ces services:
- tapez un ou plusieurs mots-clés dans l’un d’eux
- faites au plus simple car, comme sur des métamoteurs classiques, le booléen ne fonctionne pas ou mal
- plusieurs mots les uns à la suite des autres sont généralement interprétés comme « mot1 + mot2 » ce qui signifie que les deux mots seront présents dans les articles qui vous seront proposés.
- le filtrage se fera plus loin comme nous le verrons
- récupérez le fichier OPML généré sur votre disque dur. Pour cela:
- copiez la page de code proposée dans votre navigateur après le lancement de la requête
- collez-la dans le bloc-notes de Windows
- changez l’extension du fichier de .txt en .opml
- intégrez le fichier OPML dans votre agrégateur
- allez dans votre agrégateur rss
- trouvez l’option vous permettant d’importer des fichiers OPML (en général dans le menu « Fichier »)
- Effectuer l’opération
Le problème est que bien entendu avec une requête large vous risquez de vous retrouver confronté à une quantité phénoménale d’informations. La solution réside dans les agrégateurs Rss un peu évolués de type Feeddemon qui vous permettent de filtrer le contenu de vos résultats par de nouveaux mots-clés (pour un comparatif d’agrégateurs voire ce billet de Vtech).
Ainsi on peut imaginer que, dans un premier temps, vous lanciez une veille très large via les 3 services mentionnés ci-dessus afin de récolter le maximum d’informations, puis que dans un deuxième temps vous créiez autant de filtres que nécessaire au niveau de votre agrégateur. Exemple d’une veille sur le secteur automobile:
- Créez un fichier OPML avec le mot-clé « automobile » puis un second avec le mot-clé « automotive » pour les sources US
- Dans votre agrégateur créez par exemple:
- des filtres par noms de marque
- des filtres par noms d’équipementiers
- des filtres matières premières : « aluminium », « caoutchouc », « oil »,…
- sans oublier « survey », « étude », « concept », « design », « sécurité », « innovant »,…
- Il ne vous reste ensuite qu’à lire et traiter ces informations qui ont le mérite d’être classées selon vos mots-clés mais aussi triés par date dans votre agrégateur. Reconnaissez que c’est un sacré progrès par rapport aux services ou aux logiciels de surveillance de pages webs classiques.
Voilà ce n’est pas très compliqué et vous venez de mettre en place pour trois fois rien (et même gratuitement si vous utilisez les bons outils) un système de veille qui vous permet de surveiller des milliers de sources d’informations, qu’il s’agisse de sites de news classiques ou de blogs.