Comment analyser les données d’un sondage

Vous avez recueilli les résultats de votre sondage et défini un plan d’analyse des données. Il est temps à présent de passer à l’analyse proprement dite.

Inscription Pro Inscription Gratuite

Analyser les données d’un sondage en toute simplicité

Vous avez reçu les résultats de vos sondages en ligne. Maintenant que vous avez recueilli les résultats de votre sondage et défini un plan d’analyse des données, il est temps de passer à l’analyse proprement dite. Voici comment nos spécialistes interprètent les données quantitatives (par opposition à l’interprétation des données qualitatives), de l’étude des réponses en se concentrant sur les questions les plus importantes et les objectifs du sondage, jusqu’au calcul des statistiques et à la rédaction des conclusions.

Découvrez comment SurveyMonkey analyse les résultats en toute simplicité

Les quatre étapes ci-après vous aideront à analyser les données de manière plus efficace :

  1. Étude des questions principales
  2. Recoupement et filtrage des résultats
  3. Calcul des statistiques
  4. Conclusions à tirer

Étude des questions principales

Commençons par nous pencher sur l’analyse des réponses à vos questions principales. Avez-vous posé des questions empiriques ? Avez-vous envisagé un échantillonnage aléatoire ? N’oubliez pas que vous avez en principe élaboré vos questions principales lorsque vous avez défini l’objectif de votre sondage.

Par exemple, si vous avez organisé une conférence éducative et fourni aux participants un sondage d’évaluation post-événementiel, l’une de vos questions principales pourrait être formulée de la manière suivante : « D’une manière générale, comment les participants ont-ils évalué la conférence ? ». Considérez à présent les réponses recueillies pour une question particulière qui relève de cette question principale :

Pensez-vous participer à cette conférence l’an prochain ?
Choix de réponses
Oui 71 % 852
Non 18 % 216
Ne sait pas 11 % 132
Total 1200

Notez que, dans les réponses, vous voyez certains pourcentages (71 %, 18 %) et certains nombres bruts (852, 216).

Ces pourcentages représentent simplement les participants ayant donné une réponse particulière. En d’autres termes, ces pourcentages représentent le nombre de participants qui ont donné chacun une réponse, par rapport au nombre de personnes qui ont répondu à la question. Ainsi, 71 % des participants au sondage (soit 852 personnes sur les 1200 interrogées) envisagent de revenir l’année prochaine.

Ce tableau indique également que 18 % des participants n’envisagent pas de revenir et que 11 % ne savent pas.

Recoupement et filtrage des résultats

Rappelez-vous que lorsque vous avez défini l’objectif de votre sondage et élaboré votre plan d’analyse des données, vous avez réfléchi aux sous-groupes que vous vouliez analyser et comparer. Le moment est venu de récolter le fruit de ces réflexions. Supposons par exemple que vous souhaitiez voir ce qu’ont répondu les enseignants, les étudiants et les administrateurs à la question concernant la conférence de l’année prochaine. Vous devez pour cela examiner les taux de réponse à l’aide de recoupements, ce qui vous permettra de voir les réponses obtenues sur la conférence par sous-groupe :

Oui Non Ne sait pas Total
Enseignants 80 %
320
7 %
28
13 %
52
400
Administrateurs 46 %
184
40 %
160
14 %
56
400
Étudiants 86 %
344
8 %
32
6 %
24
400
Total participants 852 216 132 1200

Ce tableau vous montre qu’une grande majorité des élèves (86 %) et des professeurs (80 %) ont prévu de revenir l’année prochaine, tandis que parmi les administrateurs, moins de la moitié (46 %) pensent assister à la conférence l’an prochain ! Nous espérons que les réponses à d’autres questions dans ce sondage vous aideront à comprendre les raisons de ce résultat et à identifier les points à améliorer concernant les administrateurs afin d’inciter plus d’entre eux à revenir chaque année.

Les filtres sont un autre outil très utile pour modéliser les données. Lorsque vous appliquez un filtre, vous vous concentrez sur un sous-groupe en particulier et faites abstraction des autres. Au lieu de comparer les sous-groupes entre eux, vous étudiez uniquement les réponses d’un sous-groupe à la question. Vous pourriez par exemple vous concentrer uniquement sur les femmes, en effectuant un nouveau recoupement des données en fonction de la catégorie des participantes et en comparant les réponses des administratrices, des enseignantes et des étudiantes. Gardez toutefois à l’esprit la chose suivante lorsque vous décomposez vos résultats : à chaque fois que vous appliquez un filtre ou que vous recoupez les données, la taille de votre échantillon diminue. Pour vous assurer que vos résultats sont statistiquement significatifs, il peut s’avérer utile d’utiliser une calculatrice de taille de l’échantillon.

Étalonnages, tendances et comparaisons

Supposons que l’une des questions principales de votre sondage de commentaires sur la conférence soit : « D’une manière générale, êtes-vous satisfait de la conférence ? ». Les résultats que vous avez obtenus montrent que 75 % des participants sont satisfaits, ce qui est très concluant ! Mais n’aimeriez-vous pas avoir un peu de contexte ? Des points de comparaison ? Savoir si c’est mieux ou moins bien que l’année dernière ? Et si l’on compare à d’autres conférences ?

Supposons que vous ayez posé cette question lors de votre sondage d’évaluation de la conférence après la conférence de l’an dernier. Vous pourriez alors effectuer une comparaison de tendances. Les sondeurs d’opinion professionnels ne sont guère réputés pour leur sens de l’humour mais l’une de leurs phrases favorites est « La tendance est votre amie ».

Si le taux de satisfaction de la conférence de l’an dernier s’élevait à 60 %, cela signifie que la satisfaction de votre auditoire a augmenté de 15 points de pourcentage ! A quoi peut-on attribuer cette augmentation ? Nous espérons que les réponses à d’autres questions dans votre sondage fourniront quelques éléments.

Si vous ne disposez pas de données concernant les conférences des années précédentes, faites de la conférence de cette année le point de référence à partir duquel vous commencerez à recueillir des commentaires. C’est ce que l’on appelle le benchmarking (ou étude comparative). Vous fixez un point de référence (ou ligne de base) et au fil du temps, vous étudiez si cette référence évolue et dans quelle mesure. Vous pouvez comparer la satisfaction des participants, mais pas seulement. Vous serez ainsi en mesure de suivre, année après année, l’opinion des participants sur votre conférence. C’est ce que l’on appelle une analyse de données longitudinale.

Vous pouvez même suivre les données des différents sous-groupes. Supposons par exemple que le taux de satisfaction des étudiants et des enseignants augmente d’année en année, mais pas celui des administrateurs. Vous voudrez peut-être étudier les réponses des administrateurs à différentes questions pour avoir une idée plus précise des raisons pour lesquelles ils sont moins satisfaits que les autres participants.

Traitement des données

Vous connaissez le nombre de personnes qui ont déclaré qu’elles allaient revenir, mais comment savez-vous si votre sondage a permis d’obtenir des réponses fiables et exploitables en toute confiance pour éclairer vos futures décisions ? Vous devez faire attention à la qualité de vos données pour comprendre les composants de la signification statistique.

Dans l’usage courant, le mot « significatif » est synonyme d’important ou sérieux. En statistiques et dans les analyses de sondage, il est synonyme de « représentatif » (avec un sens de précision). Et c’est là qu’intervient l’inévitable « plus ou moins ». Cela signifie, en particulier, que les résultats du sondage sont exacts dans un certain niveau de confiance et qu’ils ne dépendent pas du hasard. Il n’est pas conseillé de tirer des conclusions à partir de résultats inexacts (c’est-à-dire qui ne sont pas statistiquement significatifs). Le premier facteur à considérer pour évaluer la signification statistique est la représentativité de votre échantillon, c’est-à-dire dans quelle mesure le groupe de personnes qui a participé à votre sondage « ressemble » à la population totale des personnes sur laquelle porte votre étude.

Il y aurait un problème si 90 % des participants à la conférence ayant répondu au sondage étaient des hommes, mais que seul 15 % de l’ensemble de votre auditoire était de sexe masculin. Plus vous en savez sur la population qui vous intéresse, plus vous pourrez considérer que ces statistiques sont fiables. Concernant le sexe des participants dans cet exemple, on peut considérer que tout va bien si seulement 15 % des personnes interrogées sont des hommes.

Si votre échantillon de sondage est une sélection aléatoire d’une population connue, le calcul de la signification statistique est simple. Un élément important dans cet exemple est la taille de l’échantillon. Supposons que 50 des 1000 personnes ayant assisté à votre conférence ont répondu au sondage. Cinquante (50) représente un petit échantillon et se traduit par une marge d’erreur élevée. En bref, vos résultats ne seront pas très fiables.

Supposons que vous ayez demandé aux participants au sondage à combien des 10 sessions proposées ils ont assisté pendant la conférence, et que vous ayez obtenu les résultats suivants :

1 2 3 4 5 6 7 8 9 10 Total Évaluation moyenne
Nb de participants 10 %
100
0 %
0
0 %
0
5 %
50 
10 %
100
26 %
260
24 %
240
19 %
190
5 %
50 
1 %
10
1 000 6,1

Vous voudrez sans doute analyser la moyenne. Vous vous rappelez sans doute qu’il existe trois types de moyenne : moyenne arithmétique, médiane et mode.

Dans le tableau ci-dessus, le nombre moyen de sessions auxquelles les participants ont assisté est de 6,1. Il s’agit ici de la moyenne, une notion qui vous est probablement très familière. Pour déterminer la moyenne, vous multipliez le nombre de sessions par le nombre de participants, faites la somme des données puis vous divisez le résultat par le nombre de chiffres que vous avez ajoutés. Dans cet exemple, 10 personnes affirment qu’elles ont assisté à une session, 50 personnes à quatre sessions, 100 personnes à cinq sessions, etc. Vous multipliez donc toutes ces paires entre elles, vous les additionnez et vous les divisez par le nombre total de personnes.

La médiane est un autre type de moyenne. La médiane est la valeur du milieu, la barre des 50 %. Dans le tableau ci-dessus, nous repérons le nombre de sessions dans lesquelles 500 personnes étaient à gauche du nombre et 500 personnes à droite. La médiane est, dans cas, six sessions. Cela peut vous aider à éliminer l’influence des valeurs aberrantes qui risquent de compromettre vos données.

Le dernier type de moyenne est le modèle. Le modèle est la réponse la plus fréquente. Dans ce cas la réponse est 6. 260 participants au sondage ont assisté à 6 sessions, soit plus que n’importe quel autre nombre de sessions.

Les médianes et autres types de moyennes peuvent également être utilisées lorsque les résultats sont basés sur des échelles de Likert.

Formulation des conclusions

Si vous devez rendre compte des résultats du sondage, pensez à ce que révèlent vos données.

Supposons que votre conférence ait obtenu une évaluation médiocre dans l’ensemble. Vous essayez d’en découvrir les raisons. Les données montrent que les participants ont attribué de très bonnes notes à presque tous les aspects de votre conférence (le contenu des sessions et des cours, les activités sociales et l’hôtel), mais qu’ils n’ont pas du tout apprécié la ville choisie pour la conférence (la conférence a peut-être eu lieu à Chicago au mois de janvier et les participants ont trouvé qu’il faisait trop froid pour sortir !). En bref : excellente conférence dans l’ensemble mais mauvais choix du lieu. Miami ou San Diego conviendrait peut-être mieux à une conférence en hiver.

L’un des aspects à prendre en considération dans une analyse et un rapport de données est la causalité par rapport à la corrélation.

Analysez votre prochain sondage avec SurveyMonkey

Commencez gratuitement

Annexe

Qu’est-ce que la collecte des données d’un sondage ?

La collecte de données peut se faire à partir de sondages : cela consiste à recueillir des informations fournies par un groupe de personnes particulier. Outre les sondages, il existe d’autres moyens de collecter des données tels que les entretiens, les groupes de discussion, etc. Les données recueillies à l’aide de sondages peuvent être utilisées pour booster l’engagement des employés, mieux comprendre le comportement des consommateurs ou encore améliorer l’expérience client.

Retour

Qu’est-ce que l’analyse longitudinale ?

Une analyse de données longitudinale (généralement appelée « analyse de tendances ») consiste essentiellement à suivre la façon dont les réponses à des questions particulières évoluent au fil du temps. Après avoir défini un point de référence, vous pouvez déterminer si les chiffres évoluent et dans quelle mesure. Supposons que le taux de satisfaction concernant votre conférence était de 50 % il y a trois ans, de 55 % il y a deux ans, de 65 % l’an dernier et de 75 % cette année. Félicitations pour cette belle progression ! L’étude longitudinale de vos résultats montre une solide tendance à la hausse.

Retour

Quelle est la différence entre corrélation et causalité ?

La causalité signifie qu’un facteur en entraîne un autre, et on parle de corrélation lorsque deux variables évoluent ensemble, mais sans influencer ou induire l’autre. Par exemple, boire un chocolat chaud et porter des mitaines sont deux variables corrélées. Elles tendent à monter ou descendre ensemble. Cependant, l’une ne provoque pas l’autre. En fait, elles sont toutes deux causées par un troisième facteur, le froid. Le froid influe à la fois sur la consommation de chocolat chaud et la probabilité de porter des mitaines. Le froid est la variable indépendante, et la consommation de chocolat chaud et la probabilité de porter des mitaines sont les variables dépendantes. Dans le cas de notre sondage sur les commentaires à propos de la conférence, le froid a probablement influencé le fait que les participants n’ont pas apprécié la ville de la conférence et la conférence en général. Enfin, pour examiner de plus près la relation entre les variables dans votre sondage, vous devriez peut-être effectuer une analyse de régression.

Retour

Qu’est-ce qu’une analyse de régression ?

L’analyse de régression est une méthode avancée de visualisation et d’analyse des données qui permet d’étudier la relation entre deux ou plusieurs variables. Il existe plusieurs types d’analyse de régression et le type choisi par un expert en sondage dépendra des variables qu’il étudie. Ce que tous les types d’analyse de régression ont en commun, c’est qu’ils étudient l’influence d’une ou plusieurs variables indépendantes sur une variable dépendante. Durant l’analyse de nos données de sondage, nous voudrons peut-être connaître les facteurs qui ont eu le plus d’impact sur la satisfaction des participants à la conférence. S’agit-il du nombre de séances ? Du principal conférencier ? Des activités sociales ? Du lieu ? À l’aide d’une analyse de régression, un expert en sondage peut déterminer si et dans quelle mesure la satisfaction liée à ces différents aspects de la conférence contribuent à la satisfaction générale.

Cela nous donne alors une idée plus précise des aspects de la conférence qu’il convient de modifier la prochaine fois. Supposons, par exemple, que vous ayez versé des honoraires importants à un conférencier de renom pour qu’il assure l’ouverture de votre conférence. Les participants ont attribué de bonnes notes à ce conférencier et à la conférence. Vous pourriez donc en déduire que le fait d’avoir fait appel à un conférencier de qualité (et onéreux) est la clé du succès de la conférence. Une analyse de régression pourra vous aider à vérifier cette hypothèse. Elle vous indiquera peut-être que la popularité de l’orateur était l’un des principaux facteurs qui ont contribué à la satisfaction des participants. Si c’est le cas, vous ferez appel à un autre conférencier de qualité l’année prochaine. En revanche, supposons que l’analyse de régression montre que, bien que les participants aient apprécié le conférencier, ils n’ont pas été satisfaits de la conférence dans son ensemble. Dans ce cas, vous devriez songer à investir votre argent ailleurs pour votre prochaine conférence. Si vous prenez le temps d’analyser soigneusement la solidité des données de votre sondage, vous pourrez vous appuyer sur les réponses pour prendre des décisions éclairées.