GarganText: la cartographie des connaissances pour tous.

Les Tuto@Mate ont reçu le 5 février 2021 Alexandre Delanoë pour présenter GarganText (qu’il développe). GarganText est un logiciel libre (AGPL) qui peut être utilisé pour réaliser un état de l’art soit à partir d’une simple équation de recherche soit à partir de fichiers.

La version de production (https://gargantext.org) a rendu service pendant près de 6 ans. La nouvelle version réécrite durant ces 3 dernières années est désormais prête pour la communauté d’utilisateurs et sera présentée au cours de ce Tuto@Mate. Si l’on retrouve l’esprit de l’ancienne version, c’est bien un changement majeur: nous avons désormais un espace de travail collaboratif et décentralisé.

En combinant une interface collaborative, synchrone ou asynchrone, et un protocole décentralisé, l’expérience de cartographie de connaissances s’améliore en conservant les fondamentaux suivants:

  • GarganText est agnostique au regard des connexions aux bases de données et toutes les langues (connues ou inconnues) peuvent être intégrées aux instances.

  • Une interface simple et puissante de généricité propose alors des méthodes d’analyse et de visualisation issues des recherches sur les systèmes complexes, du traitement automatique des langues et de l’intelligence artificielle (de la petite donnée aux données massives).

  • Le client s’exécute dans un navigateur web (Firefox ou Chromium). Il peut se connecter à de multiples instances en parallèle et propose une nouvelle ergonomie pour cartographier et enrichir collectivement les masses de données textuelles.

La présentation suit le plan suivant:

  1. Accéder à des ressources partagées: découvrir, lire et enrichir (Niveau Débutant)

  2. Réaliser des analyses: exécuter, partager ou publier (Niveau avancé)

  3. Faire communauté avec les cités de données souveraines: installer, connecter, coder (Niveau expert)

En discussion, nous préciserons pourquoi il a été nécessaire et pour le moment suffisant de changer de paradigme informatique et mathématique pour mener à bien ce projet : la nouvelle version comporte plusieurs dizaines de milliers de lignes de codes, complètement réécrites en Haskell. Haskell est un langage de programmation purement fonctionnel, statiquement typé et imprégné de la théorie des catégories.

Ressources:

Ce Tuto@Mate est animé par Alexandre Delanoë.

Alexandre Delanoë est sociologue, ingénieur de recherche au CNRS/ISCPIF (Institut des Systèmes Complexes de Paris Île de France), développeur et chef du projet GarganText. Site Web: https://alexandre.delanoe.org

David Chavalarias est directeur de recherche CNRS au CAMS et Directeur de l’Institut des Systèmes Complexes de Paris Île-de-France. Ses recherches portent sur la reconstruction de dynamiques des connaissances à partir des archives textuelles numérisées. Site web : http://chavalarias.org

La séance s’est tenue en visioconférence sur la plateforme Big Blue Button de l’EHESS (que nous remercions de son soutien).