Analyse des questions ouvertes d’un questionnaire par Bénédicte Garnier (INED) et France Guérin-Pace (INED)

Le jeudi 19 octobre 2017 de 15h00 à 16h30, les Tuto@Mate ont accueilli Bénédicte Garnier qui a présenté ses travaux menés avec France Guérin-Pace (Ined) sur le thème :
Analyse des questions ouvertes d’un questionnaire à partir des méthodes de la statistique textuelle à partir de leur ouvrage Appliquer les méthodes de la statistique textuelle.

Analyser les réponses à une question ouverte est une pratique courante en sciences sociales qui peut être facilitée par l’usage des méthodes de la statistique textuelle.

Ces outils permettent de traiter les réponses à une question ouverte comme des variables quantitatives et de les analyser au moyen des méthodes classiques d’analyse des données. Au-delà de la lecture du vocabulaire et du comptage par des calculs de lexicométrie, l’analyse des cooccurrences de mots dans les réponses permet d’identifier des thématiques et de les rattacher à des caractéristiques des répondants. Concrètement, on effectue une analyse factorielle sur un tableau lexical agrégé croisant les mots du corpus avec des caractéristiques individuelles. L’interprétation des proximités entre mots du corpus et caractéristiques laisse émerger des groupes de représentations qui s’attachent à des sous-populations que l’on cherche à identifier. Un ensemble d’aides à l’interprétation (vocabulaire spécifique, contextes d’utilisation des mots ou concordances) facilite cette « fouille de textes » mais ne dispense pas d’allers retours avec le corpus et d’une connaissance de la thématique abordée.

Nous avons commencé à utiliser ces méthodes pour analyser des corpus de réponses à une question ouverte. Aujourd’hui nous les appliquons à des corpus de nature très variée : mots associés, mots-clé, titres d’articles scientifiques, flux RSS, trajectoires, etc. Nous mobilisons plusieurs logiciels (Spad, Alceste) ou des logiciels d’accès libre (IraMuTeQ, le package tm de R, le plugIn de Rcommander R.TeMiS).
Nous présenterons des applications de ces méthodes à deux corpus.