Quels sont les redressements opérés par les sondeurs ? - PollsPosition

Quels sont les redressements opérés par les sondeurs ?

Une brève explication

Par Alexandre Andorra

Le 16/03/2017

Fréquemment, les sondeurs doivent redresser leurs échantillons pour éviter que certaines populations soient sur/sous-représentées. Mais en quoi cela consiste-t-il ? Pourquoi les instituts recourent-ils à ces méthodes ?

Qu’est-ce que le redressement statistique ?

Redresser un échantillon revient à le modifier pour garantir sa représentativité. Le redressement est utile pour corriger la sur/sous-représentation de certaines catégories (jeunes, électeurs du Front National, actifs citadins, etc.) au sein de l’échantillon final. Cette sur/sous-représentation vient en partie du fait que certaines populations sont plus difficiles à atteindre, soit parce qu’elles répondent moins en moyenne aux sondeurs (les jeunes par exemple), soit parce qu’elles ne peuvent pas leur répondre (les foyers sans internet ne peuvent pas renseigner un questionnaire en ligne). D’où l’importance pour les instituts d’avoir une méthode de collecte diversifiée (téléphone, internet, big data…) pour tirer le meilleur de chaque outil et ainsi atteindre différents publics.

Une autre difficulté vient des « shy voters » : par désirabilité sociale, certains répondants peuvent camoufler ou modifier leur opinion sur des sujets ou candidats controversés quand ils répondent au téléphone. Il ne faut pas non plus exagérer cet effet. Pour prendre l’exemple de la présidentielle américaine 2016, certains électeurs de Trump étaient probablement « timides » dans les comtés du Bronx ou de Los Angeles – remportés par Clinton par 79 et 49 points respectivement – mais il y a peu de chances que ceux vivant dans le comté de Raleigh (Virginie occidentale) – remporté par Trump de 52 points – l’aient été. De plus, les Trump shy voters peuvent aussi être compensés par des Clinton shy voters. Conclusion : cet effet existe, mais il ne faut pas non plus voir des shy voters partout. Enfin, les électeurs d’un candidat peuvent être plus enclins à répondre aux sondeurs quand ce dernier vient d’avoir un cycle médiatique positif, ce qui introduit un autre biais dans les réponses.

Comment le redressement est-il opéré ?

Le redressement peut s’opérer en comptant plusieurs fois des sujets sous-représentés ou en comptant moins d’une fois les sujets sur-représentés. En voici un exemple fictif partiel pour vous faire une idée :

Structure de l’échantillon Brut (%) Redressé (%)
Sexe
Homme 49.1 48.0
Femme 50.9 52.0
Âge
18-24 9.0 11.0
25-34 14.0 15.5
65 et + 24.5 22.1
Profession
Travailleur indépendant 4.1 4.6
Profession intermédiaire 14.7 14.4
Ouvrier 13.5 12.2
Taille d’unité urbaine
Communes rurales 23.5 24.4
Communes urbaines de province 61.8 60.6
Agglomération parisienne 14.5 15.0
Région
Centre-Val de Loire 4.0 4.2
Auvergne-Rhône-Alpes 12.5 12.1

Sur le même modèle, les électorats des deux tours de l’élection présidentielle précédentes sont reconstitués, ainsi que ceux d’autres élections récentes (les régionales de 2015 par exemple).

Le redressement tend à diminuer la précision du sondage

En creux, le redressement indique que les groupes devant être redressés reposent sur des tailles d’échantillons particulièrement faibles. S’il sert précisément à corriger cette faiblesse, il ne peut remplacer parfaitement un échantillon naturellement plus fourni. D’où l’intérêt pour le sondeur d’avoir une méthode de collecte de données fiable et diversifiée pour réduire au maximum le besoin de redressement en premier lieu.

Malgré ces précautions, le redressement reste essentiel pour éviter la sur/sous-représentation résiduelle de certaines populations. Mais il a un coût : celui d’augmenter l’erreur d’échantillonnage – ce qu’on appelle le design effect. On comprend donc l’importance d’intégrer cet effet dans la marge d’erreur d’échantillonnage, et de communiquer son intégration. Si une étude n’inclut pas cet effet dans l’erreur qu’elle rapporte, elle s’attribue plus de précision qu’elle n’en a réellement.

Aux États-Unis, les instituts membres de l’initiative de transparence de l’American Association for Public Opinion Research ont l’obligation de préciser les redressements effectués, et la prise en compte ou non du design effect par la marge d’erreur communiquée. En France, les redressements opérés par les sondeurs sont consultables sur le site de la commission des sondages. A notre connaissance, les notices communiquées par les sondeurs détaillent les redressements effectués et les marges d’erreur, mais ne précisent pas si ces dernières incluent le design effect. C’est une zone de progression.

Enfin, comme nous le rappelons ici, l’erreur d’échantillonnage n’est pas la seule source d’erreur dans les sondages. En particulier, les estimations faites sur la base des électeurs certains d’aller voter reposent en partie sur des hypothèses et des modèles, et sont en cela une potentielle source d’erreur supplémentaire.

Alexandre Andorra est co-fondateur de PollsPosition.