ScanR est un moteur qui vient d’être lancé par le Ministère de l’éducation et qui indexe les contenus de plus de 15000 acteurs de la recherche implantés en France. Il permet de mener des recherches avec plusieurs objectifs ( comme indiqué ici) :
- Quel laboratoire travaille sur quelle thématique?
- Quels entreprises travaillent avec les laboratoires d’une région?
- Quels acteurs de la recherche et de l’innovation sont proches de chez moi?
- Dans quels laboratoires mener une thèse
- Trouver des jeux de données (datasets) des grands établissements publics
La page de résultats
Pour concrétiser cela tentons un test avec l’expression « intelligence économique ». Nous obtenons 272 résultats sous forme d’une liste traditionnelle. Les résultats sont détaillés et normalisés (issus donc d’une base de données) comme on peut le voir ci-dessous.
Un clic sur un résultat amène à une fiche beaucoup plus détaillée encore indiquant par exemple :
- Informations générales :
- le nom du responsable
- l’emplacement géographique précis via OpenStreetMap
- l’adresse du site web
- un nuage de tags tiré de l’analyse des mots-clés du site, des productions et des projets de l’organisme
- l’ensemble de thématiques abordées
- l’historique de la structure
- la tutelle dont elle dépend
- Graphiques des relations avec d’autres organismes publics et / ou privés (permet par exemple de repérer les publications en commun)
- Projets en cours
- Publications par années
- Brevets détectés
- Entreprises essaimées
On peut choisir à la place du mode « Liste » le mode « Vue synthétique » (en haut à droite des résultats). Ceci permet de faire apparaître une page qui agrège les résultats sous plusieurs formes graphiques particulièrement intéressantes. On y trouve :
- Le positionnement géographiques des structures liées aux mots-clés choisis. Cette carte est cliquable et permet d’accéder aux résultats.
- Le top des regroupements des structures par villes
- Le type de structures : privées ou publiques
- Les domaines scientifiques auxquelles sont rattachées les structures remontées par les résultats
- Les tutelles auxquelles sont rattachées les structures remontées par les résultats
- Les entreprises et opérateurs de l’Etat par code NAF et par type
Un gros regret tout de même, les éléments des graphiques (barres, parts de camembert) ne sont pas cliquables et ne permettent donc pas de faire apparaître les résultats filtrés.
Autre sujet d’étonnement, je n’ai pas trouvé comment filtrer les jeux de données évoqués plus haut. Est-ce qu’il s’agit simplement de la page « Exploiter », qui liste les jeux de données en licence ouverte utilisés comme sources par ScanR? Auquel cas le moteur ne permettrait pas réellement d’identifier des datasets. MàJ 11/07/2016 Mauvaise compréhension de ma part, les données sont tout simplement celles qui sont mise en valeurs dans les résultats et proviennent des différentes sources listées sur la page « Exploiter ». J’ai cru à tort qu’il s’agissait de rechercher des datasets comme le permet par exemple Knoema.
Filtrer les résultats de recherche
Le filtrage des résultats est possible (asuf pour les datasets donc) mais en utilisant, de manière plus traditionnelle, la barre d’outil située sous la barre de recherche. On y retrouve des critères de filtrage déjà vus plus haut et que l’on va pouvoir croiser pour obtenir exactement ce que l’on souhaite :
- Types d’entités :
- Toutes les structures
- Privées
- Publiques
- Tutelles :
- Liste cliquable qui permet par exemple de ne sélectionner que les structures dont dépendant de l’INRA ou du CNRS
- Thématiques :
- Choix « manuel » d’un domaine de recherche
- Choix d’un domaine de recherche dans une liste normalisée (ERC) avec auto complétion
- Géographie : filtrage par villes ou départements
- Projets : filtrage par nom de projet ou appel à projet
Il est ainsi très facile de ne faire apparaître que les structures publiques travaillant sur l’intelligence économique (puisque c’est ma requête), sous la tutelle de l’INRIA et dans le département du Nord (un regroupement par région pourrait également s’avérer utile). Comme on le voit sur la copie d’écran ci-dessous, les filtres croisés sont bien visible et l’on sait donc ce que l’on a sous les yeux.
Les opérateurs de recherche
Je n’ai trouvé nul part de liste des opérateurs fonctionnant dans ScanR. Voici donc après tests ce qui semble fonctionner :
- ET – Exemple : « intelligence économique » « veille stratégique » (comportement un peu erratique me semble t-il)
- OU – Exemple : « intelligence économique » OR « veille stratégique »
- NOT – Exemple : veille -stratégique
Conclusion
C’est un bel outil qui nous est fourni par le Ministère de l »Education nationale, tant sur le fond que sur la forme et j’insiste sur ce dernier point tant il est généralement oublié par les acteurs institutionnels.
De nombreux acteurs privés, publiques ou individuels pourront être intéressés par le type de contenus qu’il permet d’identifier. Bien sûr, en tant que consultant en intelligence économique je ne peux m’empêcher de penser à ce qu’il révèle de nos structures de recherche et d’innovation. Toujours ce même dilemne entre le partage d’informations dans un but d’enrichissement collectif et la nécessaire protections des actifs d’un pays…
J’ai émis quelques regrets au long de l’article mais le service vient d’être lancé et peut donc (doit donc!) encore évoluer. Espérons d’ailleurs qu’un budget a été prévu pour permettre l’évolution de ce projet sur la longue durée. Ce serait dommage qu’il s’agisse d’un « one shot ». Mais pour l’instant profitons d’un existant bien pensé et bien réalisé
Merci Christophe pour ce petit test, je vais de ce pas le passer à la moulinette sur mes sujets!
Bonjour Grégory. N’hésite pas à nous faire un retour si tu as le temps.