Décortiquage de Quick Search, le nouveau moteur proposé par Talkwalker

Déjà 5 ans que je teste régulièrement les services de la société Talkwalker. Ils m’ont proposé de réitérer l’opération avec Quick Search, leur dernière production et c’est avec plaisir que je m’y attèle.

Quick search est présenté comme un moteur de recherche capable d’indexer les contenus de plusieurs réseaux et médias sociaux mais aussi certains contenus web comme des actualités, des forums, des journaux et des communiqués de presse. Attention, il ne s’agit pas d’un moteur de recherche « pur web » à la Google mais bien d’un outil qui cible certains types de pages ou de services où les contenus sont relativement structurés. Notez également que la recherche s’effectue sur un historique de 13 mois.

La page d’accueil

Lorsqu’on se connecte à la plateforme on arrive directement sur la fenêtre du moteur de recherche agrémentée des principales tendances (Hashtags, marques et thèmes) :

La nature ayant horreur du vide nous tapons un mot-clé ou plutôt ici une expression, ce sera « Falcon heavy ». Il est cependant possible de faire des requêtes plus complexes en utilisant les opérateurs booléens et très nombreux autres opérateurs de ciblage proposés et en ouvrant le champ de recherche avancée prévu à cet effet.

Voici la page de résultats :

Elle est composée de 4 indicateurs et 2 graphiques :

Le nombre de mentions sur les services surveillées
Le nombre d’auteurs ayant cité le mot-clé
L’analyse de sentiment
L’engagement
Un histogramme de fréquence de citations dans le temps
La courbe d’analyse du sentiment dans le temps

Ces éléments peuvent être personnalisés en cliquant sur l’icône « … » disponible pour chacun.

Il est également possible, pour chaque résultat, d’en exporter les sets de données dans de nombreux formats.

Sept types de filtres différents et cumulatifs permettent d’exploiter les résultats :

Par type de sources, qui sont très nombreuses comme on peut le constater ci-dessous :
Par pays/régions
Par langues (et il y en a beaucoup!)
Par types d’appareils
Par sentiment (positif, neutre, négatif)
Par tranche d’âge/genre/situations professionnelles et familliales (filtres cumulatifs)
Par périodes et dates

Ces filtres sont cumulatifs, ce qui permet d’isoler des échantillons de population très fins et offre des possibilités intéressantes pour les marketeurs et autres analystes de marchés.

J’ai par exemple choisi de filtrer ci-dessous les posts des scientifiques, ayant entre 35 et 44 ans.

Est-ce que çà fonctionne? Oui et non. Tout dépend comme toujours des données entrées par les individus dans leur profil (#gigo). Si je clique dans l’histogramme, je trouve de nombreux profils correspondant à mes choix mais pas tous. C’est clairement le cas ici pour David Brin qui est effectivement un scientifique de haut niveau (même s’il est également un célèbre écrivain de science-fiction), mais qui n’est clairement pas dans la tranche d’âge demandée puisqu’il a 68 ans.

Ce tableau permet de repérer les influenceurs sur une thématique.

Il propose plusieurs indicateurs :

Nombre de publications
Portée
Portée par mention
Engagement
Engagement par mention

Un clic sur un profil permet d’obtenir une « fiche » détaillée sur laquelle on trouve :

son résumé/CV sur le média social sur lequel il est actif (s’il a été créé s’entend)
ses posts les plus engageants sur les mots-clés choisis
ses mentions les plus récentes
les sentiments générés par ses tweets
les performances de ses posts
les mots-clés (entités nommées) utilisés dans ses posts

Rechercher des textes à l’intérieur d’images

Un des points forts du moteur, déjà présent sur Talkwalker Analytics, est aussi sa capacité à détecter des textes inclus dans des photos et l’on pense bien sûr à des marques.

Il faut pour cela utiliser l’opérateur de ciblage « image: » suivi du mot-clé recherché. Voici par exemple les résultats pour la recherche image:spacex

Impressionnant!

~~Petite suggestion en passant, un affichage en mur d’images à la Google Images, c’est à dire permettant une exploration et un filtrage rapide des résultats serait ici un vrai plus.~~

Une option très intéressante permet d’afficher les images sous la forme d’un mur « à la Google » qui simplifie nettement l’exploitation des images.

Explorer les options d’affichage (barre d’onglets de gauche)

Affichage par défaut

Revenons à la page de résultats initial. Les graphiques sont évidemment cliquables, permettant ainsi de naviguer dans les messages et contenus qui font émerger pics et creux. En cliquant sur le pic de la journée de lancement du premier histogramme on fait apparaître les contenus qui sont derrière.

Ceux-ci sont classés en fonction de leurs performances, ce qui permet d’aller à l’essentiel, même si je regrette qu’il n’y a pas une option pour les classer simplement par ordre antéchronologique, mais peut-être l’ai-je raté.

Un cartouche en face de chaque résultat indique l’ensemble des métriques qui lui sont associées.

Le bouton en forme d’onde est très intéressant puisqu’il amène à une carte de viralité du post indiquant qui l’a repris, sur quel support et permet bien sûr d’y accéder via un lien cliquable.

A côté de ce bouton s’en trouve un second (« … ») qui permet de partager facilement le contenu.

Nuage de tags

Le second bouton en partant du haut permet d’afficher le nuage de tags des tendances constitué par l’ensemble des résultats.

Il est parfaitement possible de travailler par groupes de mots ou expressions en utilisant les options adéquates.

Plusieurs onglets en haut du nuage de tags permettent d’afficher des contenus spécifiques :

Thèmes principaux : lorsqu’on affiche les détails d’un mot-clé apparaît une page spécifique proposant un histogramme de fréquence de celui-ci, les mots-clés qui lui sont le plus souvent associés (cooccurences) et certains des contenus qui l’incluent (pourquoi pas tous?). Cette possibilité de cliquer sur un élément du nuage pour obtenir des détails est également disponible pour l’ensemble des contenus cités ci-après.
Hashtags : nuage de hashtags (si, si!)
Emojis : nuage reprenant les emojis les plus utilisés dans les posts.
Personnalités : noms de personnes les plus fréquents
Marques/Entreprises : noms de marques et entreprises les plus cités
Évènements : noms d’évènements les plus cités

En haut, à droite de chacune de ces vues, il est possible de changer le mode de visualisation des contenus, pour par exemple visualiser les mots-clés sous forme d’histogrammes plutôt que de bulles.

Influenceurs : onglet que nous avons détaillé ci-dessus

Démographie

On peut ici accéder à une vision détaillée de la population composant l’échantillon (avec les précautions d’usage évoquées plus haut).

On y trouve :

une statistique hommes/femmes
la répartition par tranche d’âge
la répartition par langues
la répartition par centres d’intérêt
la répartition par profession

Chaque élément de ces graphiques est cliquable et permet d’accéder directement aux publications de la population choisie.

Localisation

Affiche la répartition géographique des posts.

Là encore, les éléments (bulles et camembert) sont cliquables et renvoient vers les contenus.

Onglets résultats

Cet onglet permet d’accéder directement aux résultats initiaux, c’est à dire aux posts.

Il est facile de les sauvegarder en utilisant sur le logo de dossier « Save for later ».

Pour chacune des pages de résultats présentées dans ces onglets il est possible de générer très facilement un rapport en PDF ou PPT en allant en haut à droite. On peut également sauvegarder une vue entière, c’est à dire une page en utilisant le bouton d’enregistrement à côté (disquette). On la retrouvera ensuite dans ses favoris.

La question (récurrente) de l’analyse de sentiment.

Je reviens sur l’analyse de sentiment car depuis que ça existe (une bonne dizaine d’années je crois) j’aime vérifier régulièrement où l’on en est.

A partir de l’onglet résultats je clique sur le drapeau rouge afin de filtrer uniquement les résultats à connotation négative et je resserre sur les posts du jour du lancement et du lendemain (6 & 7 février 2018).

Détaillons un peu ce que l’on trouve dans les 10 premiers résultats :

Article de Livescience en anglais relatif aux critiques émise par les partisans de la terre plate (je n’arrive pas à croire ce que je suis en train d’écrire) à l’encontre de ce lancement dont les images ont été évidemment truquées. L’article est critique à propos de ces personnes et relaient leurs critiques mais il ne l’est pas à propos du lanceur ou du lancement lui-même.
Video Youtube d’1h45 sur… les trucages de la vidéo de Falcon Heavy. Là aussi, ce qui est négatif c’est l’appréciation des Youtubeurs à propos de la vidéo en question mais pas à propos du lancement.
Video Youtube qui reconstitue en image de synthèse le lancement de Falcon heavy et l’atterrissage de la Tesla sur Mars. Sympa et pas négatif du tout puisqu’on à 3000 pouces en l’air contre 112 baissés.
Article d’un site de presse américain en espagnol qui après lecture me semble très positif.
Vidéo Youtube du centre de presse de SpaceX dont la présentation en direct de l’atterrissage des lanceurs n’a pas fonctionné. Beaucoup de dislikes évidemment.
Article du New York Times qui cite le lancement du Falcon heavy mais traite avant tout des diffucultés de financement de la Tesla Model 3 et n’est donc pas négatif pour SpaceX
Article d’un journal indonésien qui, d’après la traduction automatique, semble très positif
Article du site de vulgarisation scientifique Livescience qui évoque l’impression de fausseté des images de la Tesla dans l’espace et qui interviewe un chimiste pour comprendre à quoi cela est dû. Certains mots-clés utilisés dans l’article, comme « fake », ont probablement amené l’algoritme à traiter l’article comme négatif.
Article en français du Huffington Post dans lequel je n’ai vu de connotations négatives
Article en hongrois qui décrit minutes par minutes le lancement. Très factuel donc et, d’après la traduction automatique (pas facile le hongrois!) sans connotations négatives.

Ce n’est évidemment qu’une petite partie des très nombreuses publications marquées comme négatives mais cela montre que la capacité à analyser la tonalité des posts oudes articles (plus difficiles encore car plus longs), n’est pas parfaite, d’autant plus lorsqu’il faut traiter de nombreuses langues. Attention, le problème n’est pas lié à Quick search, il est récurrent sur l’ensemble des outils d’éditeurs que j’ai pu tester. Détecter les non-dits, l’ironie, le second degré est encore très loin des possibilités des algoritmes. Bien sûr cela peut fonctionner sur des signaux simples (smiley, mots-clés,…) mais ça reste tout de même très dépendant d’un contexte que le traitement automatique du langage ne prend pas en compte dans ce cas là. Il s’agit probablement d’un chantier ou l’intelligence artificielle aura une vraie pertinence à terme.

Comparer des mots-clés (marques, produits, technologies,…)

Quick search permet de comparer très facilement des mots-clés. Il suffit pour cela de les taper dans la seconde fenêtre.

Pour continuer sur le même thème prenons pour exemple SpaceX et comparons-le à d’autres programmes de lancement.

Où l’on voit, sans surprise, que SpaceX remporte la mise face à Arianespace et Soyouz, tant en terme de mentions, qu’en terme d’engagement sur les 13 derniers mois.

Une fonctionnalité très simple à mettre en oeuvre et redoutable dans le cadre d’un suivi lié à la veille concurrentielle, image ou produits.

Conclusion

Quick search est l’évolution très réussie de Talkwalker Now (voir mon précédent test détaillé ici). Il couvre beaucoup plus de types de sources sur une période beaucoup plus étendue (13 mois au lieu d’un mois). Son interface a été repensée et simplifiée, ce qui en fait un outil très facile à prendre en main. J’apprécie particulièrement son côté « couteau suisse » qui le rend utilisable tant pour une veille image que pour de la veille concurrentielle ou du positionnement marketing. Un regret tout de même, le fait de ne pas pouvoir recevoir d’alertes (email ou flux RSS) en créant de règles spécifiques. Bien sûr la fonctionnalité alourdit un peu l’ensemble mais elle est souvent très appréciée des veilleurs.

Une très belle réussite donc pour ce nouveau service vendu par l’éditeur à 500 euros/mois par utilisateur, sans limitations de recherches et en incluant l’accès à l’ensemble des archives.

Une version gratuite et limitée de Quick Search peut être testée ici.

Spread the love