Depuis le lancement de ChatGPT en décembre dernier, on pouvait dire très clairement qu’il n’était pas un outil de recherche pour la raison évidente que les contenus « ingurgités » s’arrêtaient en septembre 2021. Les choses évoluant très vite en ce domaine, ce n’est déjà plus tout à fait le cas. Comme vous le savez si vous me lisez, il existait déjà quelques possibilités pour exploiter les modèles de langage en ce sens via des solutions alternatives.
WebChatGPT
WebchatGPT est une extension qui existe pour Chrome, Edge et Firefox. Une fois installée, elle permet d’interroger le web directement dans l’interface habituelle de ChatGPT. L’extension va alors aller chercher des résultats sur Yahoo! Search et proposer une synthèse des résultats tout en indiquant ses sources.
On peut lui demander de rechercher dans un site unique ou même de remonter le contenu d’une page spécifique.
Pratique et bien réalisé.
Perplexity.ai
J’avais déjà évoqué Perplexity.ai, un service basé sur GPT 3.5 qui a beaucoup évolué depuis et dont je vous propose de faire à nouveau le tour. Cet excellent service propose de lancer des recherches dans différents « espaces » du web :
- Academic : publications scientifiques
- Wolfram Alpha : service de réponse et traitement automatisé de données
- Youtube : recherche et découverte de vidéos
- Reddit : recherche de discussions dans les innombrables forums de ce service
- News : recherche d’actualités
- Wikipedia
- All : un peu de tout cela
Là encore, une synthèse de résultats vous est proposée avec les sources associées ainsi que des questions complémentaires qui s’avèrent souvent pertinentes.
Ce service a par ailleurs la bonne idée d’évoluer en permanence par l’ajout de nouvelles fonctionnalités. Dernière en date, le Copilot, qui va creuser la question principale en la segmentant en autant de sous-questions que possible auxquelles elle répondra en cascade, sur le modèle d’AutoGPT ou de BabyAGI. Cette fonctionnalité n’est disponible qu’après identification dans Perplexity.
Ainsi, à la question « Quelles sont les différences entre la veille stratégique et l’intelligence économique? » posée dans les sources académiques, Perplexity en mode Copilot, propose la réponse suivante :
A noter que le temps de traitement est plus long puisque l’IA doit répondre à plusieurs questions. Par ailleurs, après un premier niveau de traitement elle peut vous demander de préciser vos attentes.
On a beau se dire que tout cela est fait sans intelligence aucune, le résultat n’en est pas moins impressionnant. Seule question, combien de temps ce service restera t-il gratuit ?
Bing Chat (Microsoft)
Comme on le sait, Bing a embarqué depuis plusieurs mois déjà une version de ChatGPT permettant de répondre à des requêtes en mode conversationnel et en indiquant les sources en ligne auxquelles il s’alimente. On va retrouver ces résultats dans une fenêtre à droite des résultats habituels. Il est également possible de rentrer en discussion avec le chatbot en basculant en mode conversation.
Il est indispensable d’être connecté à son compte Microsoft pour pouvoir disposer de cette fonctionnalité.
Bard (Google)
Google semble enfin sortir de sa torpeur et propose depuis ce mois-ci un chatbot très similaire à celui de Bing qui n’est pas encore disponible pour la France mais que l’on peut facilement tester en passant par un VPN (voir ses récentes évolutions ici).
Les résultats sont proposés sous la forme d’une synthèse qui, par défaut, n’indique pas les sources utilisées, ce qui en fait pour l’instant un service moins intéressant que ses concurrents pour les professionnels de l’information. Il vous propose directement plusieurs versions de sa réponse afin de vous laisser le choix.
A noter que Bard n’est pas interrogeable en français pour le moment et qu’il est encore en mode expérimental.
ChatGPT4 Pro
La version payante de ChatGPT propose désormais d’accéder au web pour remonter des résultats et les synthétiser. Avant de poser sa question, il faut utiliser le menu déroulant et choisir ChatGPT4/Web browsing.
Une fois la question posée, ChatGPT va naviguer de sources en sources en utilisant les résultats de Bing afin de vous proposer une synthèse répondant à votre requête.
Cependant, lors des tests, les résultats ont été décevants. Malgré sa capacité à trouver des articles potentiellement pertinents, ChatGPT a rencontré des difficultés pour finaliser le processus de synthèse, se retrouvant finalement en anomalie.
Des problèmes de serveur en sont probablement la cause et on s’attend à ce qu’ils soient résolus rapidement. C’est d’autant plus frustrant que le début était prometteur.
MàJ du 29/05/2023
You
You est un moteur de recherche web qui s’est lancé en novembre dernier en intégrant, dès ses débuts une IA conversationnelle baptisée YouChat, basée sur GPT3.5.
Les résultats sont du niveau de ce que l’on peut attendre de ChatGPT mais permettent de travailler à partir de contenus récents comme on peut le constater ici.
Comme on peut le constater, ce qui était à peu près impossible il y a encore quelques semaines ne l’est plus et il est évident que l’éventail des possibilités ira grandissant.
Alphawatch produit également des réponses à des questions assez générales et cite qes sources.
Merci Christophe.
Je note WebChatGPT. Je viens de le tester. TB idée et des paramètres intelligents. Par exemple, le prompt spécial par défaut (un peu à la AutoGPT) qui est derrière WebChatGPT peut être modifié par l’option « +Nouveau prompt ».
Mais il y a des « petits » problèmes quand même. Par exemple, si on le restreint à un site avec /site: la version gratuite de ChatGPT étant limitée à nov. 2021, il ne peut pas pleinement profiter du contenu à jour, juste de l’extrait ramené par le navigateur web de WebChatGPT. Ce qui signifie que la réponse reste pleine de généralités dont pas mal de bullshit communicationnel.
Je lui pose la question suivante : /site:precisement.org Qu’est-ce que l’open data des données juridiques ? Il me répond une phrase extraite de mon site et repart sur trois paragraphes supplémentaires de bêtises comme par exemple : « Il est important de noter que les données juridiques rendues disponibles dans le cadre de l’open data doivent respecter certaines conditions. Elles doivent être accessibles au public, sans restrictions de copyright ou de brevet, » (pas de copyright en droit français et les brevets n’ont rien à voir avec le schmilblick)
Si je pose à nouveau la même question sans restreindre WebChatGPT à mon site, il va sur deux blogs (ceux de Predictice et Jurispredis) et la réponse extraite du blog de Predictice est AMHA très « meh », ce qui gâche le début de la réponse.
Pour les améliorations futures, la plus importante est le fine-tuning sur des contenus sélectionnés, de haute qualité (donc d’éditeur ou de grande entreprise, donc pas d’accès libre ou alors payant) et *à jour*.
Ce dernier point pose quand même là aussi un « petit » problème du fait du coût du ré-entraînement.
Question posée à Perplexity.ai version Copilot : Qu’est-ce que l’open data des données juridiques ?
Réponse : L’open data des données juridiques est la mise à disposition du public de l’ensemble des décisions des juridictions de l’ordre judiciaire, à titre gratuit, dans un format électronique. Cela permet de rendre la jurisprudence plus accessible et transparente pour tous. […]
Mon avis : euh … La première phrase est *fausse* car l’open data des données juridiques inclut par définition les textes officiels et non pas seulement les décisions de justice (les IA génératives de texte ne raisonnent pas, nième rappel). Et la2 e phrase est fausse également car si la JP est rendue plus accessible, elle n’est pas pour autant rendue plus transparente quand on doit faire face 3,8 millions de décisions par an et surtout pas pour tous car le grand public non juriste ne comprend rien au vocabulaire juridico-judiciaire, assez hermétique, et n’y comprendra rien de plus — qu’on publie 300 000 décisions par an ou 3,8 millions …
J’en reviens à ce qu’écrivais en fin de mon premier com’ sous ce billet : GIGO => tant qu’on n’a pas du contenu de qualité et à jour et qu’on ne fine-tune pas le LLM chatbot dessus et qu’on ne le bride pas, il est vain d’espérer éviter des « hallucinations » graves de la part de ces « bouzins ».
=> Back to Google + Bing + Yandex.