Nos tutelles

CNRS

Rechercher




Accueil > Les groupes

Données web

publié le , mis à jour le

A mesure que l’Internet prend une place de plus en plus importante dans les sociétés industrialisées, le volume de données transitant par ce média augmente de manière considérable, obligeant les disciplines des Sciences Humaines et Sociales (SHS) à miser sur de nouvelles méthodes de recueil et d’analyse pour répondre au mieux aux nouveaux défis qui leur sont posés. Réseaux sociaux, bases de données, blogs, sites web font maintenant partie intégrante des terrains d’enquête des projets de recherche des disciplines SHS comme la sociologie, les sciences politiques, la psychologie, le droit, ou l’économie.

Le groupe de travail "Données web" du réseau MATE-SHS, qui réunit des ingénieurs et des chercheurs spécialistes des méthodes d’enquête en SHS, vise dans un premier temps à structurer et rendre compte de l’ensemble des expériences de ses membres quant à la confrontation avec ce nouveau type de données. Ses expériences peuvent être classées en trois groupes.

  1. Recueil de données (présentes sur le web ou collectées via le web) Mise en place de forums en ligne auprès de panélistes (après échantillonnage) pour exploiter les données de conversations et analyser les interactions de groupes et l’effet de stimulations écrites ou visuelles ; montage d’enquêtes en ligne avec des logiciels/plateformes comme LimeSurvey, SphinxOnLine ou développement d’outils informatiques dédiés ; développement de nouveaux outils informatiques d’aspiration de tweets, de profils LinkedIn ou de forums de discussions ; méthodes d’observation des pratiques de navigations ; dépendance envers les hébergeurs des données en ligne ;
  2. Traitement des données Analyse de contenu de sites web aspirés ; particularisme des statistiques sur les données massives (Big Data) ; objectivisation et limites des résultats ; analyses qualitatives et quantitatives de données numériques ou recueillies numériquement ;
  3. Aspects juridiques des deux précédents items Anonymisation des données ; cadre légal de l’aspiration de données en ligne ; rapports à la CNIL ; déontologie.

Une plateforme de contributions sur ces thèmes est en train d’être créée, rassemblant l’ensemble de ces expériences sous la forme de courtes fiches techniques détaillant notamment les problèmes rencontrés et la manière dont ils ont été résolus. Cette plateforme aura pour but d’expliciter et de transférer les connaissances qu’ont les ingénieurs et chercheurs en SHS des données numériques, de favoriser les échanges, les rencontres et les travaux sur ces nouveaux enjeux, ainsi que de permettre à notre communauté de recherche de recouper, capitaliser, valoriser et optimiser les pratiques existantes.

Contact : frederic.vergnaud@mines-paristech.fr