Petit guide de l’analyse factorielle : faites parler vos données de sondage les plus complexes

Combinez vos données pour mesurer les concepts difficiles à quantifier

Quelle mesure isolée permet-elle de déterminer si vous êtes en bonne santé ? Votre tension artérielle ? Votre apport calorique ? Votre poids ?
Prises séparément, ces données ne sont pratiquement d'aucune aide pour décrire votre état de santé général, mais une fois combinées, elles offrent une vision globale bien plus parlante que leur simple somme.

Cet exemple illustre tout l’intérêt de l’analyse factorielle, une technique statistique des plus utiles pour simplifier et analyser d’importants volumes de données aux variables multiples.

L’analyse factorielle permet de déterminer si des variables (ou dans le cas de sondages, des questions) sont en corrélation entre elles ou avec une autre variable ou un autre concept. Les statisticiens parlent alors de facteurs communs.

Vous pouvez définir les relations qui existent entre des ensembles de variables en regroupant celles qui sont en forte corrélation, et ainsi dégager des facteurs communs. C’est la base de l’analyse factorielle, souvent utilisée dans les domaines de la psychologie, de la santé et des sciences politiques.

Prenons l'exemple des sondages pour le secteur de la santé, qui incluent souvent les questions suivantes :

  • Quelle est votre taille ?
  • Quel est votre poids ?
  • Est-ce que vous fumez ?
  • À quelle fréquence pratiquez-vous une activité physique ?
  • Souffrez-vous d’hypertension ?
  • Avez-vous déjà fait un infarctus ?

Prises individuellement, les réponses à ces questions sont trop spécifiques pour en dire long sur votre état de santé général. Mais analysées ensemble, elles peuvent fournir une mesure plus globale de votre état, et c’est précisément ce facteur commun qui intéresse les chargés d’études.

Si on vous posait une seule question vague sur votre santé, en vous demandant par exemple de décrire votre état général comme excellent, bon, moyen ou mauvais, vous auriez certainement du mal à répondre.

Car tout dépend à qui vous vous comparez. Êtes-vous en meilleure forme que votre voisine de 80 ans ? Que votre ado qui court tous les jours ou presque ? Difficile de savoir où l’on se situe par rapport aux autres et il y a de grandes chances que vos participants utilisent différents points de comparaison pour décrire leur état de santé.

C’est pourquoi les chargés d’études posent généralement une série de questions en relation avec la santé et effectuent une analyse factorielle pour dégager un score de santé normalisé.

Quand utiliser l’analyse factorielle ?

L'analyse factorielle s'avère particulièrement intéressante dans les cas suivants :

  • Pour avancer une hypothèse sur la relation entre variables. C’est ce que les chargés d’études appellent l’analyse factorielle exploratoire.
  • Pour vérifier une hypothèse sur la relation entre variables. C’est ce que les statisticiens appellent l’analyse factorielle confirmatoire.
  • Pour tester l’efficacité d’un sondage à mesurer ce qu’il est censé mesurer. C’est ce que l’on appelle couramment la validité de construction.

Remarque : l’analyse factorielle est une technique avancée qui requiert l’utilisation d’un progiciel statistique ; avant de vous lancer, assurez-vous de maîtriser suffisamment l’un de ces progiciels.

Comment calibrer votre sondage pour une analyse factorielle ?

1. Sollicitez un grand nombre de participants.

L’analyse factorielle repose sur un volume important de données. Même si vous utilisez une calculatrice de taille d'échantillon, le nombre exact de participants requis pour effectuer une analyse factorielle dépendra de divers éléments tels que la taille de la population et les questions posées. Mais quoi qu'il en soit, plus vous avez de réponses complètes, mieux c'est !

2. Posez beaucoup de questions spécifiques plutôt que quelques questions générales.

L’analyse factorielle permet de résumer des concepts généraux difficilement mesurables en utilisant une série de questions plus faciles à mesurer. L’idée est de réunir de nombreux points de données et de les fusionner en informations utiles.

3. Utilisez des options de réponse identiques ou similaires.

Pour une analyse factorielle pertinente, vous avez besoin de données quantitatives et donc d'options de réponse à vos questions réparties sur une échelle. Peu importe que vous utilisiez une échelle numérique (p. ex., de 0 à 10), une échelle binaire (p. ex., Oui ou Non) ou une échelle de Likert (p. ex., tout à fait d’accord/d’accord/neutre/pas d’accord/pas du tout d’accord) tant que vos choix de réponses suivent un certain ordre d'une manière ou d'une autre.

4. Travaillez avec un progiciel statistique avec lequel vous êtes à l'aise.

L’outil d’analyse de SurveyMonkey vous offre de nombreuses options d'analyse (diagrammes, graphiques et statistiques agrégées), ce qui permet à la majorité de nos utilisateurs d'effectuer la collecte et l’analyse de leurs données sans aide extérieure, mais l’analyse factorielle est une technique d’analyse plus avancée.

Si vous avez l’habitude de travailler avec des progiciels statistiques comme R, SAS, SPSS ou Stata, il vous suffit d'exporter vos données de sondage depuis SurveyMonkey pour les télécharger au format pris en charge par votre progiciel.

Si les sondeurs occasionnels n’ont pas nécessairement besoin d’avoir accès au niveau de détails que permet l’analyse factorielle (et n’ont d’ailleurs pas forcément l'outil adapté), celle-ci s’avère très utile pour les chargés d’études et les statisticiens. Elle permet de condenser des points de données multiples en blocs digestes. Vous pouvez ainsi mesurer des concepts qui seraient autrement difficilement quantifiables et identifier les relations qui existent entre vos données.

Réveillez votre curiosité avec SurveyMonkey