Analyse des données

Comment analyser les données comme un spécialiste des sondages ?

Créez un sondage dès aujourd'hui

Maintenant que vous avez recueilli les résultats de votre sondage et défini un plan d’analyse des données, il est temps de passer à leur analyse proprement dite. Voici comment nos spécialistes interprètent les données quantitatives (par opposition à l’interprétation des données qualitatives), de l’étude des réponses en se concentrant sur les questions les plus fréquemment posées et les objectifs du sondage, jusqu’au calcul des statistiques et à la rédaction des conclusions.

Les quatre étapes ci-après vous aideront à analyser les données de manière plus efficace :

  1. Examinez vos questions les plus fréquemment posées.
  2. Recoupez et filtrez les résultats.
  3. Calculez les statistiques.
  4. Tirez les conclusions.

Étude des questions principales

Commençons par nous pencher sur l’analyse des réponses à vos questions principales. Souvenez-vous que vous avez élaboré vos questions principales lorsque vous avez défini l’objectif de votre sondage.

Par exemple, si vous avez organisé une conférence éducative et fourni aux participants un sondage d’évaluation post-événementiel, l’une de vos questions principales pourrait être formulée de la manière suivante : D’une manière générale, comment les participants ont-ils évalué la conférence ? Considérez à présent les réponses recueillies pour une question particulière qui relève de cette question principale :

Screen Shot 2014-03-05 at 10.46.26 AM

Remarquez que dans les réponses, vous avez à la fois des pourcentages (71 %, 18 %) et des nombres (852, 216).

Ces pourcentages représentent simplement les participants ayant donné une réponse particulière. En d’autres termes, ces pourcentages représentent le nombre de participants qui ont donné chacun une réponse, par rapport au nombre de personnes qui ont répondu à la question. Ainsi, 71 % des participants au sondage (soit 852 personnes sur les 1200 interrogées) envisagent de revenir l’année prochaine.

Ce tableau indique également que 18 % des participants n’envisagent pas de revenir, et que 11 % ne savent pas.

Les nombres représentent le nombre de participants qui ont répondu à la question. Ainsi, 852 d’entre eux ont répondu qu’ils assisteraient de nouveau à la conférence l’année prochaine ! Si vous partez de l’hypothèse que la plupart des participants qui ont répondu « Oui » et qu’une partie de ceux qui ont répondu « Je ne sais pas » reviendront l’an prochain, vous pouvez élaborer un modèle prévisionnel pour estimer le nombre de personnes* qui assisteront à la conférence l’année prochaine. *Cette estimation sera d’autant plus fiable si vous avez un taux de participation très élevé, ce qui signifie que la plupart des participants à la conférence ont reçu votre sondage et y ont répondu.

Recoupement et filtrage des résultats

Souvenez-vous que lorsque vous avez défini l’objectif de votre sondage et élaboré votre plan d’analyse des données, vous avez réfléchi aux sous-groupes que vous vouliez analyser et comparer. Le moment est venu de récolter le fruit de ces réflexions. Supposons par exemple que vous souhaitiez voir ce qu’ont répondu les enseignants, les étudiants et les administrateurs à la question concernant la conférence de l’année prochaine. Pour cela, vous devez effectuer un recoupement (ou comparaison) des réponses obtenues par sous-groupes à la question concernant la conférence :

Screen Shot 2014-03-05 at 10.54.10 AM

D’après ce tableau, vous pouvez constater qu’une large majorité des étudiants (86 %) et des enseignants (80 %) envisagent de revenir l’an prochain. En revanche, les administrateurs ne sont pas du même avis, puisque moins de la moitié (46 %) envisagent de revenir ! Nous espérons que les réponses à d’autres questions dans ce sondage vous aideront à comprendre les raisons de ce résultat et à améliorer le contenu de votre conférence pour inciter plus d’administrateurs à y participer chaque année.

Les filtres sont quant à eux des outils très utiles pour analyser les données. Lorsque vous appliquez un filtre, vous vous concentrez sur un sous-groupe en particulier et faites abstraction des autres. Au lieu de comparer les sous-groupes entre eux, vous étudiez uniquement les réponses d’un sous-groupe à la question. Vous pourriez par exemple vous concentrer uniquement sur les femmes, en effectuant un nouveau recoupement des données en fonction de la catégorie des participantes et en comparant les réponses des administratrices, des enseignantes et des étudiantes. Gardez toutefois à l’esprit la chose suivante lorsque vous décomposez vos résultats : à chaque fois que vous appliquez un filtre ou que vous recoupez les données, la taille de votre échantillon diminue. Pour vous assurer que vos résultats sont statistiquement significatifs, il peut s’avérer utile d’utiliser une calculatrice de taille de l’échantillon.

Étalonnages, tendances et comparaisons

Supposons que l’une des questions principales de votre sondage d’évaluation sur la conférence soit : « D’une manière générale, êtes-vous satisfait de la conférence ? » Les résultats que vous avez obtenus montrent que 75 % des participants sont satisfaits de la conférence, ce qui est très concluant ! Mais n’aimeriez-vous pas avoir un peu de contexte ? Des points de comparaison ? Savoir si c’est mieux ou moins bien que l’année dernière ? Et si l’on compare à d’autres conférences ?

Supposons que vous ayez posé cette question dans le sondage d’évaluation qui avait suivi votre conférence de l’année dernière. Vous pourriez alors effectuer une comparaison de tendances. Les sondeurs d’opinion professionnels ne sont guère réputés pour leur sens de l’humour mais l’une de leurs phrases favorites est « La tendance est votre amie ».

Si le taux de satisfaction de la conférence de l’an dernier s’élevait à 60 %, cela signifie que la satisfaction de votre auditoire a augmenté de 15 points de pourcentage ! A quoi peut-on attribuer cette augmentation ? Nous espérons que les réponses à d’autres questions dans votre sondage fourniront quelques éléments de réponse.

Si vous ne disposez pas de données concernant les conférences des années précédentes, faites de la conférence de cette année le point de référence à partir duquel vous commencerez à recueillir des commentaires. C’est ce que l’on appelle le benchmarking (ou étude comparative). Vous fixez un point de référence (ou ligne de base) et au fil du temps, vous étudiez si cette référence évolue et dans quelle mesure. Vous pouvez comparer la satisfaction des participants, mais pas seulement. Vous serez ainsi en mesure de suivre, année après année, l’opinion des participants sur votre conférence. C’est ce que l’on appelle une analyse de données longitudinale. En savoir plus sur la façon dont les

points de référence SurveyMonkey peuvent mettre en contexte les résultats de vos sondages.

Qu’est-ce que l’analyse longitudinale ?

Une analyse de données longitudinale (généralement appelée « analyse de tendances ») consiste essentiellement à suivre la façon dont les réponses à des questions particulières évoluent au fil du temps. Après avoir défini un point de référence, vous pouvez déterminer si les nombres évoluent et dans quelle mesure.  Supposons que le taux de satisfaction concernant votre conférence était de 50 % il y a trois ans, de 55 % il y a deux ans, de 65 % l’an dernier et de 75 % cette année. Félicitations pour cette belle progression ! L’étude longitudinale de vos résultats montre une solide tendance à la hausse.

Vous pouvez même suivre les données des différents sous-groupes. Supposons par exemple que le taux de satisfaction des étudiants et des enseignants augmente d’année en année, mais pas celui des administrateurs.Vous voudrez peut-être étudier les réponses des administrateurs à différentes questions pour avoir une idée plus précise des raisons pour lesquelles ils sont moins satisfaits que les autres participants.

Traitement des données

Vous connaissez le nombre de personnes qui ont déclaré qu’elles allaient revenir, mais comment savez-vous si votre sondage a permis d’obtenir des réponses fiables et exploitables en toute confiance pour éclairer vos futures décisions ? Vous devez faire attention à la qualité de vos données pour comprendre les composants de la signification statistique.

Dans les conversations quotidiennes, le mot « significatif » est synonyme d’important ou sérieux. Dans les statistiques et les analyses de sondage, significatif est synonyme de « représentatif » (avec un sens de précision). Et c’est là qu’intervient l’inévitable « plus ou moins » dans le travail de sondage. Il signifie, en particulier, que les résultats du sondage sont exacts au sein d’un certain niveau de confiance et qu’ils ne dépendent pas du hasard. Il n’est pas conseillé de tirer des conclusions en vous fiant à des résultats inexacts (c’est-à-dire des résultats qui ne sont pas statistiquement significatifs). Le premier facteur à considérer dans toute évaluation de la signification statistique est la représentativité de votre échantillon, c’est-à-dire dans quelle mesure le groupe de personnes qui ont participé à votre sondage « ressemble » à la population totale des personnes, vous permettant de tirer des conclusions.

Vous avez un problème si 90 % des conférenciers qui ont répondu au sondage étaient des hommes, mais que 15 % seulement de tous les participants à la conférence étaient de sexe masculin. Plus vous en savez sur la population qui vous intéresse, plus vous serez confiant quand votre sondage renverra ces statistiques. Concernant le sexe des participants, le fait que 15 % seulement des personnes interrogées soient des hommes ne vous inquiète pas dans ce cas de figure.

Si votre échantillon de sondage est une sélection aléatoire d’une population connue, le calcul de la signification statistique est simple. Le facteur important dans cet exemple est la taille de l’échantillon. Supposons que 50 des 1000 personnes qui ont assisté à votre conférence ont participé au sondage.Cinquante (50) représente un petit échantillon et se traduit par une grande marge d’erreur. En bref, vos résultats ne seront pas très fiables.

Supposons que vous ayez demandé à vos participants d’indiquer le nombre de sessions auxquelles ils ont pris part sur les 10 sessions de la conférence. Vos résultats ressemblent à la figure suivante :

Screen Shot 2014-03-05 at 11.02.19 AM

Vous devriez envisager d’analyser la moyenne. Vous vous souvenez qu’il existe trois types de moyenne : moyenne, médiane et modèle.

Dans le tableau ci-dessus, le nombre moyen de sessions auxquelles les conférenciers ont assisté est de 6,3. Dans cet exemple, il s’agit du genre de moyenne qui vous est probablement le plus familier. Pour déterminer la moyenne, vous ajoutez les données et les divisez par le nombre de chiffres que vous avez ajoutés. Dans cet exemple, 10 personnes affirment qu’elles ont assisté à une session, 50 personnes à quatre sessions, 100 personnes à cinq sessions, etc. Vous multipliez donc toutes ces paires entre elles, vous les additionnez et vous les divisez par le nombre total de personnes.

La médiane est une autre sorte de moyenne. La médiane est la valeur du milieu, la barre des 50 %. Dans le tableau ci-dessus, nous repérons le nombre de sessions dans lesquelles 500 personnes étaient à gauche du nombre et 500 personnes à droite. La médiane est, dans ce cas, 7 sessions. Cela peut vous aider à éliminer l’influence des valeurs aberrantes qui risquent de compromettre vos données.

Le dernier type de moyenne est le modèle. Le modèle est la réponse la plus fréquente. Dans ce cas la réponse est 6. 260 participants au sondage ont assisté à 6 sessions, soit plus que n’importe quel autre nombre de sessions.

Les médianes et autres types de moyennes peuvent également être utilisées si vos résultats sont basés sur les échelles de Likert.

Formulation des conclusions

Si vous devez rendre compte des résultats du sondage, pensez à ce que révèlent vos données.

Supposons que votre conférence ait obtenu une évaluation médiocre dans l’ensemble.Vous essayez d’en découvrir les raisons. Les données montrent que les participants ont attribué de très bonnes notes à presque tous les aspects de votre conférence, notamment les sessions et les cours, les activités sociales et l’hôtel, mais qu’ils n’ont pas du tout apprécié la ville choisie pour la conférence. (La conférence a peut-être eu lieu à Chicago au mois de janvier et les participants ont trouvé qu’il faisait trop froid pour sortir !). En bref : excellente conférence dans l’ensemble mais mauvais choix du lieu. Miami ou San Diego conviendrait peut-être mieux à une conférence en hiver.

L’un des aspects à prendre en considération dans une analyse et un rapport de données est la causalité par rapport à la corrélation.

Quelle est la différence entre corrélation et causalité ?

La causalité signifie qu’un facteur en entraîne un autre, et on parle de corrélation lorsque deux variables vont ensemble, mais que l’une n’a pas d’influence sur l’autre ou ne provoque pas l’autre.

Par exemple, boire un chocolat chaud et porter des mitaines sont deux variables corrélées. Elles ont tendance à monter ou descendre ensemble. Cependant, l’une ne provoque pas l’autre. En fait, elles sont toutes deux causées par un troisième facteur, le froid. Le froid influe à la fois sur la consommation de chocolat chaud et la probabilité de porter des mitaines. Le froid est la variable indépendante, et la consommation de chocolat chaud et la probabilité de porter des mitaines sont les variables dépendantes. Dans le cas de notre sondage sur les commentaires à propos de la conférence, le froid a probablement influencé le fait que les participants n’ont pas apprécié la ville de la conférence et la conférence en général. Enfin, pour examiner de plus près la relation entre les variables dans votre sondage, vous devriez peut-être effectuer une analyse de régression.

Qu’est-ce qu’une analyse de régression ?

L’analyse de régression est une méthode d’analyse de données avancée qui permet d’étudier la relation entre deux ou plusieurs variables. Il existe plusieurs types d’analyse de régression et le type choisi par un expert en sondage dépendra des variables qu’il étudie. Ce que tous les types d’analyse de régression ont en commun, c’est qu’ils étudient l’influence d’une ou plusieurs variables indépendantes sur une variable dépendante. Durant l’analyse de nos données de sondage, nous voudrons peut-être connaître les facteurs qui ont eu le plus d’impact sur la satisfaction des participants à la conférence. S’agit-il du nombre de séances ? Du principal conférencier ? Des activités sociales ? Du lieu ? À l’aide d’une analyse de régression, un expert en sondage peut déterminer si et dans quelle mesure la satisfaction liée à ces différents aspects de la conférence contribuent à la satisfaction générale. Cela nous donne alors une idée plus précise des aspects de la conférence qu’il convient de modifier la prochaine fois. Supposons, par exemple, que vous ayez versé des honoraires importants pour obtenir un conférencier de renom pour la séance d’ouverture de votre conférence. Les participants ont attribué de bonnes notes à ce conférencier et à la conférence. Vous pourriez donc en déduire que le fait d’avoir fait appel à un conférencier de qualité (et onéreux) est la clé du succès de la conférence. Une analyse de régression pourra vous aider à vérifier cette hypothèse. Elle vous indiquera peut-être que la popularité de l’orateur était l’un des des principaux facteurs qui ont contribué à la satisfaction des participants. Si c’est le cas, vous serez tenté de faire appel à un autre conférencier de qualité l’année prochaine. Par contre, supposons que l’analyse de régression montre que, bien que les participants aient apprécié le conférencier, ils n’ont pas été satisfaits de la conférence dans son ensemble. Dans ce cas, vous devriez songer à investir votre argent ailleurs pour votre prochaine conférence. Si vous prenez le temps d’analyser soigneusement la solidité des données de votre sondage, vous pourrez vous appuyer sur les réponses pour prendre des décisions éclairées.Retour aux sondages 101

3 conseils pour améliorer le taux de réponse de votre sondage

Voici quelques idées pour vous assurer que les personnes prenant part à vos sondages répondront à vos questions.

1. Soyez bref

Si votre sondage est court et agréable, il sera d'autant plus probable qu'un grand nombre de personnes y répondront.

2. Offrez des incitations

Une petite réduction ou une participation à un tirage au sort peuvent vous aider à obtenir davantage de réponses.

3. Achetez un public ciblé

Avec SurveyMonkey Audience, vous pouvez acheter l'accès à un public répondant à des critères démographiques spécifiques pour votre sondage. Vous pourrez ainsi obtenir des réponses ciblées de la part d'un groupe bien précis.

Voici pourquoi des millions de personnes font confiance à SurveyMonkey

Sondages illimités

Envoyez autant de sondages et de quizzes que vous voulez, même avec des abonnements gratuits.

Réponses rapides

Créez et envoyez facilement des sondages professionnels. Obtenez rapidement des résultats fiables.

Approuvés par des experts

Accédez à des questions et modèles prédéfinis, approuvés par nos spécialistes des sondages.

Résultats en temps réel

Consultez les résultats en déplacement sur tout type d'appareil. Identifiez les tendances au fur et à mesure de l'arrivée des données.

Idées neuves

Les sondages vous donnent plus que de simples réponses. Obtenez des commentaires et de nouvelles perspectives.

Données actionnables

Extrayez des informations de vos données et partagez-les avec votre équipe.