RessourcesVeille – OutilsVeille
Dire que Google Reader permet de faire de la veille multilingue grâce à ses fonctions de traduction automatique c’est une chose, le démontrer c’est mieux. Il ne s’agit en effet pas seulement de récupérer un flux rss dans une langue étrangère et de cliquer sur le bon bouton. Ca c’est la dernière étape :-)
Je vous invite donc à un petit exercice pratique et j’ai choisi à cet effet un thème de veille volontairement complexe et d’actualité : Que dit la presse russe des positions françaises durant et après le sommet UE – Russie?
Sujet compliqué car :
1 : j’ai fait un peu de russe mais c’est tellement loin que je décrypte à peine 50% de l’alphabet cyrillique (et que je comprends à peu près 1% de ces 50% …)
2 : c’est une langue à déclinaison qui pourrait poser pas mal de problèmes lorsqu’il s’agira de surveiller un mot-clé puisqu’on le retrouvera avec un nombre incalculable de terminaisons. Enfin si calculable mais bon… je n’ai pas vraiment le temps de me replonger dans la grammaire russe actuellement. Ceci nous apprend toutefois une première chose essentielle : lorsque l’on veut faire de la veille dans un langue précise il faut s’intéresser un minimum à sa construction grammaticale : si vous choisissez un mot dans une forme qui n’est jamais utilisée, sinon par les dictionnaires, vous pourriez ne pas avoir de résultat. Heureusement Google News, grâce lui soit rendu, a pensé à tout et propose dans ses résultats les variantes d’un même mot (pluriel/singulier, masculin/féminin, et donc les déclinaisons. Cette possibilité relativement récente et très gênante lorsque l’on recherche un mot précis s’avère ici d’une grande utilité.
Précision : il est évident que cet article ne prétend pas faire le tour de la question. Dans un processus de veille réel, pour une entreprise par exemple, il s’agirait d’une simple phase de démarrage. Sachant que les mots-clés choisis ici seront ensuite optimisés en fonction des résultats obtenus. La veille c’est forcément itératif et personne ne peut prétendre arriver d’emblée avec un système parfait.
1 – Première étape : choisir ses mots-clés.
Il s’agit ici de choisir les mots-clés que vous allez lancer dans les moteurs. Je ne détaillerai toutefois pas cette étape puisqu’elle n’est pas spécifique à la veille multilingue. En deux mots il s’agira par exemple de trouver les synonymes d’un mot-clé ou encore de le préciser par un second mot (ex : intelligence + économique), ou au contraire d’en étendre la portée par des concepts associés (ex : les termes « veille » ou « lobbying » sont très souvent associés à l’expression « intelligence économique »).
Notre exemple : dans notre cas nous nous contenterons du mots-clé « français« . Nous partons en effet du principe qu’on pourra le retrouver dans des expressions telles que « le président français » ou « les français pensent que ». Le conseil le plus important lorsqu’on fait de la veille sur internet c’est de toujours chercher à se mettre dans la peau de la personne susceptible d’avoir écrit l’article qui nous intéresse afin d’imaginer les mots-clé qu’elle aurait pu utiliser. C’est pas très scientifique ça me direz-vous? Non. La veille c’est 80% d’instinct (je vous renvoie à ma thèse préférée sur le sujet : Explorateurs-chasseurs-cueilleurs du web) et 20% de savoirs-faire.
2 – Deuxième étape : traduire ses mots-clés
Traduire les mots-clés choisis est à première vue facile. Les services de traduction automatique sont en effet légion sur le web. Toutefois le fait qu’ils ne proposent souvent qu’une seule traduction pour un mot est un piège qu’il nous faudra contourner. Nous savons tous en effet qu’un même mot peut avoir de nombreux sens dans une langue : un mousse, une mousse (bière), de la mousse (végétale ou autre). Comment faire le bon choix?
Simple, il va falloir, en plus du traducteur automatique, trouver un dictionnaire de cette langue proposant des définitions traduites dans une autre que vous comprenez, ceci afin de valider le sens de votre traduction.
Euh non, pas si simple en fait mais bon j’ai un peu farfouillé 🙂
Services de traduction automatique (pratiques mais insuffisants) :
- Google Translate
- Babylon translator
- Promt/ Reverso traduction
- Systran box
- Fagan translation wizard (agrégateur de services de traduction automatique) : excellent sur le principe mais pas toujours à jour.
- Foreignword (agrégateur de services de traduction automatique) : même remarque avec une interface moins bien pensée.
Dictionnaires de définitions bilingues (très bien mais on y trouve pas toujours les langues dont on a besoin), à privilégier toutefois quand c’est possible :
- Freelang : série de dictionnaires français – étranger (et inversement) en ligne mais que l’on peut aussi télécharger.
- Logosdictionary : le meilleur selon moi.
- PanImages : service de recherche qui traduit directement vos mots-clés après désambiguïsation. Lance votre requête traduite dans Google Images et Flickr. Excellent aussi.
- Reference translate : uniquement pour l’anglais.
Plugins Firefox :
- Foxlingo : indispensable barre d’outils, le couteau suisse de la traduction en ligne.
- Quick translation : indispensable barre d’outils, le couteau suisse de la traduction en ligne (ah tiens je l’ai déjà dit)
Sites de ressources sur la traduction :
- Foreignword
- Page de l’Université d’Austin, régulièrement mise à jour
Autre solution pour valider le sens d’un mot étranger : ce que j’appelle la validation visuelle, vous allez voir c’est simple : mettons que vous vouliez mener une veille sur le mot « éléphant » dans la presse chinoise (quoi y a pas d’éléphants en Chine et alors? M’étonnerait bien qu’il y en ait pas quelques-uns qui traversent la frontière avec l’Inde de temps à autres), donc je disais :
- Vous traduisez le mot « éléphant » dans Google translate et obtenez ceci : 大象
- Afin d’être sûr que cet idéogramme ne désigne pas les éléphants de mer ou ceux du parti communiste chinois, vous aller le copier-coller dans Google Images version chinoise. Vous tatonnez un peu pour trouver le bouton « Rechercher »et finissez par obtenir une page de résultats pleine de beaux éléphants (cf. ci-dessous), pas de mer et pas communiste (quoique j’avoue ne pas bien connaître le système politique des éléphants). Voilà, vous êtes maintenant sûr que votre mot est le bon. Evidemment cette méthode fonctionne bien pour les animaux, objets et personnes célèbres, mais beaucoup moins pour les concepts, essayez avec « phénoménologie » pour voir (le pire c’est qu’il y a quand même 12400 résultats, ou comment apprendre la philosophie par l’image :-).
Notre exemple : le mot français a été traduit et désambiguïsé avec Logos Dictionnary. Le résultat : « французский » qui doit se lire à peu près « françuski ».
Mais ce n’est pas tout. Il va nous falloir préciser un contexte si l’on ne veut pas obtenir tous les articles en russe qui citent le mot « français » (ex: « ce grand écrivain français », « cet incroyable footballeur français », « ce goût typiquement français pour les bonnes choses », « ce fabuleux esprit français que tous les peuples du monde leur envient » ou même « les ravages causés par les éléphants français dans les plaines beauceronnes », etc).
J’ai choisi tout simplement le mot « Nice », ville où se tient ce sommet.
Logos Dictionnary ne proposant pas de traduction je me suis retourné vers Google Translate qui m’a donné « Ницца« , c’est-à-dire « Nissa ». Je suis ensuite allé taper ce mot dans PanImages. Pas de problème, les milliardaires russes sont bien sur les photos.
3 – Troisième étape : lancer sa requête et la mettre sous surveillance
Nous voici maintenant armés de deux mots-clés validés. Il ne reste plus qu’à aller interroger les moteurs qui agrègent la presse russe. Encore faut-il en trouver!
Faisons simple pour l’instant :
- Google News en russe (forcément) : a priori 400 sources de presse indexées
- Il est bien sûr possible d’interroger directement des titres de la presse russe en ligne mais les choses se compliquent puisqu’il faut qu’ils proposent un fil Rss correspondant à votre requête. S’il n’y en a pas on peut toujours utiliser un service de type Feedbeater, qui va alors créer un fil rss de toutes pièces, pas parfait mais plusieurs tests ont donné des résultats corrects.
- Voici tout de même deux services qui vous permettront d’identifier des titres de presse ligne classés par pays.
Après avoir lancé votre requête Французский Ницца dans Google News en russe vous obtenez évidemment les articles dans lesquels se trouvent ces deux mots et vous pouvez utiliser les fonctionnalités avancées pour affiner encore les résultats.
Il va falloir maintenant intégrer le flux RSS de cette requête dans votre Google Reader mais avant cela une dernière chose : par défaut les résultats sont classée par pertinence. Afin de toujours voir apparaître les derniers publiés dans votre agrégateur il est indispensable de les classer par date.
Maintenant seulement vous pouvez intégrer le flux RSS dans Google Reader.
4 – Quatrième étape : traduction des flux RSS
En fait c’est la partie la plus simple puisqu’il ne reste plus qu’une chose à faire : cocher la fonctionnalité « Traduire dans ma langue » pour passer de çà :
à çà :
Résultats de l’expérience :
Evidemment la traduction est loin d’être parfaite mais j’ai lu 3 articles en entier et franchement je pense pouvoir dire que j’en ai saisi la teneur, surtout après avoir lu quelques articles en français sur le sujet afin de mieux comprendre le contexte, et puis entre ça et rien le choix est vite fait.
Un exemple d’article traduit :
Pas mal non?
Est-ce que les articles découverts traitent bien du sujet qui m’intéresse? Oui plutôt, même s’il faut encore faire le tri. Il sera nécessaire d’ajouter des mots-clés pour cerner plus précisément le sujet et également retirer le mot-clé « Nice » rapidement si l’on veut continuer à suivre cette thématique, car le sommet n’a duré en fin de compte qu’une journée et le mot n’apparaîtra bientôt qu’épisodiquement. Si toutefois on souhaite le conserver pour une raison particulière il suffit de garder cette requète telle quelle et d’en créer une seconde l’excluant. Itératif vous disais-je.
Amusez-vous bien :-)
PS : plusieurs lecteurs d’OF m’ont dit avoir bien apprécié le document PDF mis en ligne pour La veille et Twitter. Je réitère donc l’expérience avec ce long billet méthodologique.
Pratiquer la veille multilingue en 4 étapes et 15 outils linguistiques
Si vous avez aimé ce billet vous pouvez :
Le promouvoir :
En parler sur Twitter :