OutilsCartographieD_Information – OutilsTextMining
Il y avait longtemps que je n’avais pas jeté un
oeil dans la rubrique "Knowledge workers/Ressources" de mon logiciel de capture de
pages web (l’excellent plug-in Scrapbook). J’aurai dû me méfier car en
quelques semaines c’est pas moins de dix articles, tous en anglais, qui m’attendaient sagement classés en ordre antéchronologique. Assomé par cette découverte j’ai donc décidé de ressortir de mes
cartons le logiciel UMAP de la société Trivium. Inclus désormais dans la suite
See-K, il avait fait, à juste titre, les beaux jours de l’après Rapport Martre.
Concrètement il vous permet de tirer une
cartographie dynamique d’une masse de documents non-structurés et de
"travailler" cet ensemble afin d’en faire sortir du sens.
cartographie dynamique d’une masse de documents non-structurés et de
"travailler" cet ensemble afin d’en faire sortir du sens.
S’il nécessite un peu d’investissement en temps et
en matière grise (le fichier d’aide est assez succinct), vous êtes ensuite
largement récompensés par les résultats obtenus.
en matière grise (le fichier d’aide est assez succinct), vous êtes ensuite
largement récompensés par les résultats obtenus.
La première carte (voir ci-dessous) m’indique donc
que les deux continents crées à partir de mes articles reflètent clairement deux
thématiques différentes. En me reportant au doc pointé par le logiciel je
m’aperçois effectivement qu’un article traite uniquement de "competitive
intelligence" et je décide donc de le retirer de la carte. Un de moins à lire
(pour le moment).
que les deux continents crées à partir de mes articles reflètent clairement deux
thématiques différentes. En me reportant au doc pointé par le logiciel je
m’aperçois effectivement qu’un article traite uniquement de "competitive
intelligence" et je décide donc de le retirer de la carte. Un de moins à lire
(pour le moment).
En sélectionnant les thèmes "chauds" (en rouge) de ma nouvelle carte je découvre sans surprise que
les sujets traités principalement par ces documents sont "time", "information",
"work", "people", "search". Je découvre aussi que 5 document traitent de tous
ces thèmes à la fois. Ca fait encore pas mal mais en ajoutant le thème
"knowledge worker" il ne reste plus que deux documents.
les sujets traités principalement par ces documents sont "time", "information",
"work", "people", "search". Je découvre aussi que 5 document traitent de tous
ces thèmes à la fois. Ca fait encore pas mal mais en ajoutant le thème
"knowledge worker" il ne reste plus que deux documents.
En explorant un peu l’ilôt du haut je découvre un
texte développant l’idée intéressante que tout travailleur, quel qu’il soit, est un travailleur de
l’information, avec notamment un long développement sur le métier
d’infirmière.
texte développant l’idée intéressante que tout travailleur, quel qu’il soit, est un travailleur de
l’information, avec notamment un long développement sur le métier
d’infirmière.
La branche de droite me révèle un article sur le KM
en Finlande conçu comme moyen de développement de toute une nation. Celle de gauche est un leurre, trop de texte hors-sujet sur la
page html capturée (ça arrive). Enfin la péninsule en bas de la carte m’indique
un article plus orienté sur la manière dont les entreprises réorganisent le
travail en ce début de 21ème siècle.
en Finlande conçu comme moyen de développement de toute une nation. Celle de gauche est un leurre, trop de texte hors-sujet sur la
page html capturée (ça arrive). Enfin la péninsule en bas de la carte m’indique
un article plus orienté sur la manière dont les entreprises réorganisent le
travail en ce début de 21ème siècle.
Au final, et même en utilisant les manips les
plus basiques de UMAP, je n’ai pas perdu mon temps. J’ai maintenant une bonne
idée de ce qui se trouve dans ce corpus de textes et je sais quels documents
proposent des infos un peu originales. Je vais pouvoir organiser ma lecture en
fonction de mes objectifs et peut-être même ne pas tout lire finalement.
plus basiques de UMAP, je n’ai pas perdu mon temps. J’ai maintenant une bonne
idée de ce qui se trouve dans ce corpus de textes et je sais quels documents
proposent des infos un peu originales. Je vais pouvoir organiser ma lecture en
fonction de mes objectifs et peut-être même ne pas tout lire finalement.
Merci Umap.
M. Trivium, quand est-ce que vous relancez ce
logiciel tellement utile par les temps qui courrent.
logiciel tellement utile par les temps qui courrent.