La distinction variables à expliquer / variables explicatives dans les analyses factorielles

Par Nicolas Robette, le vendredi 5 avril 2024 de 14 à 16h.

On utilise souvent les modèles de régression pour « expliquer » une variable par un ensemble d’autres variables potentiellement « explicatives ». Dans le même temps, on présente généralement les analyses factorielles (ACP, ACM, etc.) comme des techniques descriptives, plaçant toutes les variables sur le même plan. Pourtant, les possibilités offertes par les analyses factorielles sont bien plus larges et incluent la distinction entre différents types de variables. Une approche répandue consiste ainsi à projeter des variables dites « supplémentaires » sur l’espace factoriel construit à partir des variables « actives ». Le lien avec les régressions est alors direct : on sait que projeter une variable supplémentaire revient à faire une régression linéaire simple des coordonnées factorielles en fonction de la variable supplémentaire.

Mais il existe aussi des variantes des ACP et ACM pour construire un espace des variables actives qui soit indépendant d’une ou plusieurs variables « de contrôle » (ACM conditionnelle, variables instrumentales orthogonales) ; ou pour construire l’espace des variables actives qui « explique » le mieux une ou plusieurs autres variables (par exemple, l’espace des opinions politiques qui est le plus associé aux différences d’âge) : analyses discriminantes, variables instrumentales, PLS1 et PLS2, etc. Certaines de ces techniques d’analyses factorielles « sous contraintes » sont déjà bien connues dans d’autres disciplines, comme en écologie ou en chimiométrie. Elles restent cependant encore largement ignorées en sciences sociales : ce sont elles qui seront introduites dans cette présentation.

Nicolas Robette est enseignant-chercheur en sociologie et démographie à l’Université de Versailles Saint-Quentin-en-Yvelines et chercheur au laboratoire Printemps. Il a développé le package GDAtools pour l’analyse factorielle des données avec le logiciel R.

Les slides sont téléchargeables ici

Un Tuto avec des exemples d’une grande partie de ce qui a été présenté de manière théorique dans le Tuto@Mate est visible en suivant ce lien

La séance s’est tenue sur la plateforme Big Blue Button de l’EHESS que nous remercions pour son soutien.