Ballajack en a parlé avant moi mais, toujours très interessé par la possibilité de mettre en place des veilles sur les sources vidéo, je me devais de décortiquer ce nouveau service que la société française Leankr a lancé très récemment. Un service qui pourra s’avérer d’une grande utilité pour mener une veille télévisuelle. Telescoop.tv est en effet un service qui agrège les contenus de très nombreuses chaînes de télévision, en indexe le contenu textuel (speech to text) et propose un moteur de recherche pour trouver les émissions traitant vos thèmes d’intérêt. Une cinquantaine d’émissions dont les journaux nationaux sont ainsi disponibles avec une antériorité de 15 jours.
Mise en oeuvre
L’interface d’accueil est simple et facile à utiliser :
Taper une requête peut faire apparaître une suggestion de mot-clé sous forme d’entité nommée. Lorsque vos mots-clés ne correspondent pas à l’une d’elle la requête se fait en plein-texte.
Vous pouvez utiliser le ET booléen :
Le OU dans sa version française ou anglaise (OR) ne fonctionne pas. Le SAUF (ou – ou NOT) non plus, pas plus que la recherche dans les titres malheureusement. A moins que je n’ai pas tenté les bons opérateurs mais je n’ai pas trouvé d’aide détaillée à ce sujet.
Enfin pour rechercher une expression les guillemets fonctionnent.
La page de résultats se présente ainsi :
Les résultats sont classés par pertinence, ce qui n’est pas très pratique d’autant qu’il n’y a pas de moyen de les reclasser par ordre antechronologique.
Des options de filtrage (voir ci-dessus) permettent de sélectionner :
- les émissions dans lesquelles le mot-clé a été cité
- les vidéos disponibles en replay, que l’on pourra lancer dans la foulée
- par thématiques (ici Actualités, magazine, sport)
- par chaînes de diffusion ou émissions (redondance)
Pour chaque résultat on voit :
- le nombre d’occurence du mot-clé dans l’émission
- un extrait du texte dans lequel le mot-clé est cité afin d’en repérer le contexte.
- trois captures d’écran de l’émission correspondant aux moments où le mot-clé est cité
- une ligne de temps qui permet de voir à quelle moment de l’émission le mot-clé est cité
- un petit triangle gris à droite qui permet de lancer le replay de l’émission (s’il il existe) et vous renvoie alors vers le site original de la chaîne TV.
En cliquant sur un résultat on accède à une page qui affiche les passages de l’émission dans lesquels le mot-clé a été prononcé ainsi que des copies d’écran de ces passages et des liens vers les autres entités nommées dans cette même émission.
C’est plutôt très bien réalisé, même si l’on regrette de ne pouvoir récupérer l’intégralité du texte de l’émission comme le permettait le défunt (car plus mis à jour) Voxalead (assez honteux d’ailleurs quand on pense que ce moteur avait initialement été financé en partie sur des fonds publics).
Mettre Telescoop.tv sous surveillance
Telescoop n’a pas oublié les problématiques de veille et propose de nombreux flux RSS sur une page dédiée. Vous pourrez y trouver :
- un flux RSS agrégé des personnalités qui font l’actualité
- un flux RSS pour chaque personnalité qui fait l’actualité
- un flux RSS pour les émissions surveillées
En regardant la structure des flux proposés il est assez facile d’en déduire les possibilités pour d’autres entités nommées et c’est précisément ce que Serge Courier (à suivre sur @secou et @RssCircus) a fait dans un de ces posts scoop.it que je vous invite à lire. Il en ressort que la formule magique à insérer dans votre agrégateur pour suivre une personnalité dans l’actu TV est la suivante :
http://telescoop.tv/rss/[type d’entité nommé]/[code de l’entité nommée]/[nom de l’entité nommée].rss
Par exemple :
http://telescoop.tv/rss/people/1686/claudia-cardinale.rss
La logique voudrait que l’on fasse de même avec la classe d’entités des lieux, par exemple :
http://telescoop.tv/rss/place/73/marseille.rss ou encore
http://telescoop.tv/rss/place/288/genève.rss
Mais malheureusement cela ne fonctionne pas pour l’instant. Idem avec la classe d’entités nommée « product » :
http://telescoop.tv/rss/product/B00391Q4X4/barbie-girl.rss ne produit pas flux RSS.
On notera au passage qu’il ne semble pas (encore?) exister de classes d’entités nommées pour les entreprises et les organisations non gouvernementales. Par ailleurs on rencontre certaines incohérences dans le système. Ainsi Paris ne semble pas être traitée comme une entité « lieu », en tout cas elle n’apparaît pas dans les suggestions.
Idem pour la France, la Russie mais pas pour la Suisse ou le Pérou. Pas sûr de comprendre la logique ici, ou alors quelques erreurs à mettre au compte de la jeunesse de ce service? Bizarre.
Donc pour surveiller les mots-clés qui ne sont pas des entités ou les entités qui ne génèrent pas de flux RSS il faut d’abord lancer une requête dans Telescoop. J’ai ensuite tenté d’utiliser Fivefilters Feed Creator puis FetchRss sur l’URL de la requête mais sans succès. J’ai été plus chanceux avec Feedity (version gratuite) qui n’a eu aucun problème à générer un flux RSS pour chaque nouveau résultat, c’est à dire dans mon exemple, pour chaque émission, qui citera le mot-clé « Paris ». Résultat positif également avec ChangeDetection évoqué la semaine dernière.
Il est donc possible de surveiller les nouveaux résultats de Telescoop.tv, quels qu’ils soient, sous forme de flux RSS. Reste à savoir ce qui remontera dans le flux du fait du classement par pertinence des résultats de recherche. A suivre donc.
Conclusion
Telescoop.tv est une très bonne nouvelle pour les chargés de veille car il vient se positionner à la place du seul service qui proposait une interface gratuite d’accès à ce type de contenus et qui a été abandonné il y 3 ans par Dassault Système dans sa version web. Il se retrouve donc de fait le seul outil sur ce positionnement sur le marché français, ce qui est un avantage pour lui mais un risque pour les utilisateurs puisqu’on ne sait pas si et combien de temps il en sera ainsi (et là je parle de la gratuité).
Les points faibles de ce service ont été cités au fur et à mesure de l’article :
- possibilités de requêtes très limitées du fait de l’intégration a minima d’opérateurs booléens
- logique de création (et donc d’utilisation) des entités nommées peu claire
- difficultés à surveiller des mots-clés au format RSS à la différence de ce que proposait Voxalead (voir ce billet de 2012).
Ceci étant dit l’outil est jeune et va forcément évoluer qualitativement dans les mois qui viennent, donc a priori pas d’inquiétudes. Et puis en attendant mieux on peut déjà surveiller les résultats au format RSS à condition d’utiliser les bons outils alors bienvenu et félicitations à ce nouvel acteur.