Prévisible mais incertaine, cette élection est paradoxale - PollsPosition

Prévisible mais incertaine, cette élection est paradoxale

Dernière mise à jour des européennes

Par Alexandre Andorra

Le 24/05/2019

Nos analyses - où vous voulez, quand vous voulez Abonnez-vous au Podcast

On y est. La dernière semaine de campagne s'est écoulée, et nous nous apprêtons à rentrer dans l'embargo médiatique. Ces élections, les premières du quinquennat Macron, détermineront les rapports de force actuels, sur les plan national et européen - une grosse performance en France vous donne plus de poids dans votre groupe au niveau européen.

Elles marquent aussi le début d'un marathon électoral, puisqu'il y aura au moins une élection par an jusqu'en 2022 - municipales 2020, départementales et régionales 2021, présidentielle et législatives 2022. Ce dimanche signalera donc - de manière bruyante certes, car chaque élection a ses particularités - les forces et faiblesses de chaque parti pour les échéances à venir.

A deux jours du vote, que nous dit le modèle sur ces rapports de force ? Quels sont les écarts les plus probables ? Où se situent les incertitudes ? Embarquons pour un dernier tour dans les entrailles du modèle.

A quoi chaque parti peut-il s'attendre?

Je sais que ce n'est pas très sexy, mais j'ose tout de même: à plus ou moins à la même chose que depuis début mars. Les rapports de force ont finalement très peu évolué depuis 3 mois: LREM et RN sont toujours les grands favoris; LR est toujours seul dans son couloir, nettement derrière LREM mais clairement devant LFI et EELV; ces derniers sont encore au coude-à-coude, tandis que le PS et DLF se battent pour obtenir au moins quelques sièges.

Il y a bien eu quelques mouvements, les plus importants étant pour le RN (+3,5 points de soutien médian en 3 mois, de 21% à 24,5%) et DLF (-2 points, de 6% à 4%). Mais les autres partis n'ont presque pas bougé. Pas de quoi bouleverser la hiérarchie donc.

Le soutien populaire obtenu 5 fois sur 6

Les lignes solides représentent le pourcentage médian de voix obtenu. Les zones translucides représentent l'intervalle où le pourcentage réel a 5 chances sur 6 de tomber (83% de chances). Un intervalle entre 20% et 25% avec une médiane à 22,5% par exemple, signifie que le parti en question a 5 chances sur 6 d'obtenir entre 20% et 25% des voix exprimées, et que la distribution est centrée à 22,5%.
Pourquoi 5 chances sur 6 ? Voyez-le comme la probabilité d'obtenir n'importe quel chiffre sauf le 6 quand vous lancez un dé classique. Survolez le graphe avec votre souris pour voir les détails. Vous pouvez masquer/afficher un parti en cliquant sur son nom dans la légende.

Et toute cette excitation autour de sondages qui donnaient le RN en tête? Le lecteur attentif que vous êtes ne s'était pas fait avoir: comme on le signalait la dernière fois , les deux partis sont au coude-à-coude depuis des mois, donc il n'y a rien d'étonnant à voir la hiérarchie fluctuer en fonction des sondages - d'où l'intérêt d'agréger lesdits sondages.

Une autre façon de le dire est qu'avancer que "les sondages donnent le RN vainqueur" correspond au mieux à un abus de langage. Une description plus pertinente avancera que "certains sondages (environ 2/3 puisque le modèle donne 2 chances sur 3 au RN de finir premier) donnent le RN vainqueur". Les autres donnent soit LREM 1er, soit une égalité.

Quand les sondages sont aussi proches, dites-vous bien que tout peut arriver. Certes, le RN est repassé premier favori pour la première fois depuis décembre, mais le modèle indique bien que c'est très léger - seulement 2 chances sur 3 de finir premier, pendant que LREM a 1 chance sur 5. De même, pendant longtemps, LREM avait environ 3 chances sur 5 - un bien faible favori.

La probabilité d'obtenir le plus de sièges

A ce niveau-là donc, la position finale des deux favoris ne sera pas très informative. Plus intéressant sera l'écart qui les sépare. Selon le modèle et les données disponibles, RN et LREM sont à 2 points, avec une médiane respectivement à 22,5% et 24,5%. Difficile de les départager sur le nombre de sièges également: le scénario médian est de 22 sièges pour la majorité et 24 pour le RN, avec 5 chances sur 6 d'obtenir 19 à 25 sièges pour l'un, et 21 à 27 pour l'autre.

Le plus probable est donc que le RN finisse avec 2 sièges de plus qu'En Marche - comme on le voit dans la distribution ci-dessous, ce scénario a 1 chance sur 7 (13%) de se produire. Mais l'incertitude est forte, puisqu'il y a 5 chances 6 que le résultat tombe entre +2 pour LREM et +5 pour RN.

Distribution de l'écart entre RN et LREM

Quels sont les points d'attention ?

1. Quelle erreur des sondages ?

Evidemment, de notre côté, ce que nous allons regarder, c'est l'erreur des sondeurs. Les instituts français sont globalement précis et leurs erreurs varient peu selon le type d'élection:

Erreur absolue moyenne de l'ensemble des instituts de sondage, par type d'élection
Type d'élection Extrême-gauche Gauche Verts Centre Droite Extrême-droite Tous partis
Européennes 0.6 2.7 1.4 1.4 0.8 1.2 1.4
Législatives 1.0 0.8 0.7 1.8 1.6 2.2 1.4
Présidentielles 1.3 1.7 0.7 1.3 2.1 2.7 1.6
Régionales 1.4 2.7 1.1 0.6 2.1 1.3 1.5
Toutes élections 1.1 2.0 1.0 1.3 1.7 1.8 1.5

L'erreur absolue mesure la distance entre ce qu'indique la moyenne pondérée des sondeurs et les résultats de l'élection. Calculs PollsPosition sur près de 800 sondages au cours de 15 élections. Voir notre méthode pour plus de détails.

Ils ont néanmoins tendance à mal évaluer la gauche pendant les élections européennes. En l'occurrence, cela pourrait aider le PS : son niveau étant déjà très bas, il y a plus de chances qu'une erreur des sondages le sous-évalue plutôt qu'elle le sur-évalue. Cela pourrait aussi être une bonne nouvelle pour le reste de la gauche, si cela annonçait un électorat plus à gauche que prévu par les sondages. Mais l'inverse est vrai aussi, comme nos simulations le laissaient penser il y a trois semaines : selon le modèle, il serait surprenant de voir les partis de gauche sur-performer si l'un d'entre eux sous-performe. Une telle sous-performance annoncerait probablement un électorat qui penche vers la droite et le centre, ou un électorat de gauche démobilisé.

On voit aussi dans le tableau que l'extrême-gauche compte parmi les partis les mieux évalués par les sondeurs, quel que soit le type d'élection. Encore une façon de remettre en cause la sous-évaluation intentionnelle que les sondeurs feraient subir à LFI. D'une manière générale, si vous arrivez constamment à trouver une façon d'incriminer les sondages qui favorise votre parti, c'est probablement que le hooligan politique qui est en vous a pris le dessus. Encore une fois, jusqu'à preuve du contraire, les sondeurs ne présentent pas de biais systématique envers un quelconque parti.

Sauf envers l'extrême-droite. Sur les 800 sondages et 15 élections de notre base de données, ils ont surestimé l'ex-FN de 2 points en moyenne – cette tendance étant fortement influencée par les cinq dernières élections. C'est probablement dû à une conjonction de facteurs : un électorat peut-être plus dur à sonder que les autres; des comportements moutonniers - quand les instituts les plus proéminents influencent les autres - plus prononcés en fin de campagne; de mauvaises incitations données par les médias et le grand public - les instituts sont critiqués sans nuance quand ils sous-évaluent l'extrême-droite, mais ils sont inutilement ignorés quand ils la surévaluent.

Tout cela est à garder en tête, alors que les sondages indiquent un RN en progression sur les deux dernières semaines après une campagne très stable sur l'ensemble de 2019. Pour raisonner en bayésien, je serai plus surpris si les sondages sous-évaluent le RN que s'ils le surévaluent.

2. L'abstention et les partis sans siège

Nous avons traité l'abstention en détails dans notre précédente analyse donc nous ne ferons ici qu'un bref rappel. L'abstention devrait être forte - aux alentours des 60%. L'une des valeurs ajoutées de notre modèle sur les sondages est qu'il tient compte des incertitudes historiques - et donc, notamment, de l'abstention. C'est très utile, mais ce n'est pas magique : si les incertitudes de cette élection pulvérisent les incertitudes précédentes, le modèle ne pourra pas y faire grand chose.

Que ce cygne noir vienne de l'abstention me laisse en revanche sceptique : historiquement, elle est rarement très éloignée d’une élection à l’autre – elle a beaucoup plus de chances de passer de 60 à 55 que de 60 à 20 par exemple. De ce fait, j'ai tendance à penser que le discours général se focalise trop sur l'abstention, oubliant par là-même d'autres variables d'intérêt.

Enfin, les élections européennes sont soumises à un effet de seuil : il vous faut minimum 5% des voix pour obtenir des sièges. Le scrutin étant proportionnel, 5% des voix représentent 4 sièges. Cela veut dire que vous obtenez soit au moins 4 sièges, soit 0 siège.

Avec respectivement 5,2% et 4% des voix en moyenne dans notre modèle , le PS et DLF sont les plus susceptibles de ne pas avoir de siège - 4 chances sur 9 (46%) pour le PS, et 2 chances sur 3 (67%) pour DLF.

3. La popularité de Macron

Nous le signalions dans notre première analyse , c'est une variable très corrélée avec les intentions de vote pour En Marche - quand l'un monte, l'autre aussi. Où en est donc la popularité d'Emmanuel Macron ? Selon notre agrégateur , l'approbation est stable depuis début avril (28,5%), tandis que la désapprobation a très légèrement baissé sur la même période (68,5%).

Cela ne vous surprend probablement pas, puisqu'on a dit plus haut que les intentions pour la liste Renaissance étaient elles aussi stables sur cette période. La question est bien sûr de savoir si la popularité suit ou précède les intentions de vote. Mais en l'occurrence, aucun des deux indicateurs ne bougent, donc cette question devient moins pressante.

Pensons de manière probabiliste.

A la fois prévisible et incertaine, cette élection a un côté paradoxal. Prévisible, elle l'est parce que les intentions de vote sont stables depuis des mois et dessinent des rapports de force clairs: un duel de favoris, un poursuivant, un duel en-dessous des 10%, et une queue de peloton qui se bat pour avoir au moins quelques sièges. Ces quatre strates n'ont pas bougé de la campagne, dessinant ce qui ressemble fort à des silos et à une élection jouée d'avance. Et pourtant, l'incertitude est bien là. Dans la troisième strate, LFI et EELV sont au coude-à-coude, pendant que tout est possible dans la première strate entre le RN et LREM.

En cela, cette élection représente une belle opportunité de pratiquer la pensée probabiliste: quand les données ne contiennent pas assez d'information pour aider les modèles à discriminer entre les différents scénarios, il nous reste à intégrer l'incertitude dans nos raisonnements.

Nul doute cependant que les interprétations déterministes des résultats seront légion lundi matin - "il était évident que", "tout le monde savait que". Si vous voulez éviter ce piège - et être honnête avec vous-même - je vous conseille de parier avec vous-même: quel est le scénario le plus probable selon vous? Qu'est-ce qui vous surprendrait le plus? Où finira chaque parti?

Au fond, le traitement statistique des données vient nous rappeler ce que la vie politique nous fait souvent oublier: la réalité est toujours plus compliquée que les slogans. En cela, il aide à progresser de la certitude ignorante à l’incertitude réfléchie.

******

Retrouvez toutes nos prévisions sur la page dédiée aux européennes , ou en audio en vous abonnant à notre podcast .

Alexandre Andorra est co-fondateur de PollsPosition.