Entrée en campagne

Entrée en campagne... Je parle de la mienne évidemment, il n'aura échappé à personne que d'autres ont déjà commencé...
Depuis longtemps d'ailleurs pour certains d'entre eux. Certains quotidiens ont rappelé par exemple cette semaine que François Hollande s'est déclaré le 31 mars 2011, soit il y a un an précisément. Quant au président en exercice, on peut aisément soutenir, comme nous l'avons fait avec Jacques de Maillard dans un article publié sur le site Le Cercle-Les Echos, qu'il est en campagne depuis... 2007, tant son exercice du pouvoir est marqué par l'intériorisation de la temporalité électorale et par le souci de ménager les clientèles. Cette longévité de la campagne, marquée par plusieurs séquences (l'affaire du Sofitel, les primaires citoyennes, la "drôle de campagne" du début 2012, etc.), ainsi que la dilution du temps politique sur le temps de l'action publique, apparaissent même comme des caractéristiques de l'actuelle compétition qu'il faudrait par la suite pouvoir analyser, notamment pour voir dans quelle mesure elles sont réellement nouvelles.
Autre aspect en apparence marquant sans être original, la profusion des sondages avec les idées conventionnelles qui en rythment la réception et l'usage ("croisement des courbes", "troisième homme", etc.). En préparant une séance d'un cours dispensé actuellement sur la campagne dans le cadre de l'Université Inter-âges à Paris II (sans nul doute déjà l'une de mes plus belles expériences d'enseignement), je me suis penché à nouveau sur ces "fameux" sondages, qui pèsent sur la vie démocratique depuis leur invention dans les années 1930 et qui semblent prendre toujours plus de place dans le débat public. Il est peut-être utile de rappeler quelques éléments généraux. Les sondages reposent fondamentalement sur des données parcellaires visant à caractériser les évolutions de l'opinion publique à partir de la théorie des probabilités. Ils reposent tout à la fois sur la définition des éléments recherchés, sur le choix d'un échantillon et sur des techniques statistiques d'exploitation. Je ne vais pas revenir ici sur la première série de problèmes, qui renvoie en définitive à la question même de l'objectivation d'une "opinion publique" (dans un article célèbre de Questions de sociologie, Bourdieu affirme qu'une telle opinion "n'existe pas", même si son argumentation est beaucoup plus fine et moins systématiquement critique qu'on ne le dit parfois). Si l'on estime que les intentions de vote sont maintenant des données routinisées, il est plus judicieux en effet de s’intéresser aux deux autres éléments, les échantillons et l'exploitation ou l'utilisation des résultats.
La question des échantillons est à la fois cruciale et mal connue. Elle est pourtant présente dès les premiers sondages qui fondent leur légitimité initiale en grande partie sur la possibilité d'extrapoler des attitudes et intentions à partir d'un échantillon représentatif d'une population donnée (généralement à l'échelle d'une nation). Ce qui fait notamment le succès de Gallup dans les années 1930, l'anecdote est connue, c'est d'abord la justesse de prévisions fondées sur une enquête réalisée auprès de 5000 citoyens américains, puisqu'il donne Roosevelt gagnant du scrutin en 1936 contre Alfred Landon, alors qu'un questionnaire exploité par le Literary Digest sur la base de plus de 2 millions de réponses donne le résultat inverse. D'après les statisticiens, la façon la plus "correcte" de "choisir" l'échantillon serait de procéder de façon aléatoire au sein d'une population donnée, ce qui évite tout biais a priori dans la production des données et permet une exploitation statistique conforme. Or, le plus souvent, les sondages publiés dans les médias se font selon la méthode des quotas, les personnes interrogées étant "sélectionnées" sur la base d'un faisceau de caractéristiques sociologiques qui assurent la représentativité finale de l'échantillon. En outre, la marge d'erreur est d'autant plus grande que l'échantillon est petit. Un professeur de statistiques à Sciences Po (il y a longtemps maintenant, j'étais alors étudiant...) nous avait démontré que pour une population comme celle de la France, la marge d'erreur devenait selon lui satisfaisante, soit +/- 1% par rapport aux données recueillies, à partir de 10.000 personnes interrogées. Pourtant, la plupart des sondages réalisés se font sur un maximum de 1.000 personnes, ce qui explique que la marge d'erreur soit établie à +/- 3% le plus souvent par les instituts eux-mêmes. La raison est généralement pratique et financière : les sondages réalisés à partir de petits échantillons, parfois présélectionnés, sont plus rapides à effectuer, moins coûteux à réaliser et plus faciles à exploiter.
Ces distorsions déterminent toutefois des problèmes dans la production des données brutes et justifient des corrections ultérieures. Le fait de "corriger" des données statistiques n'est pas en soi critiquable : les fameuses données "corrigées des variations saisonnières" (CVS) servent par exemple à atténuer sur un laps de temps déterminé les effets de cycle pour les phénomènes sensibles à des périodes particulières (c'est le cas en matière d'emploi par exemple). Ce qui est gênant avec les sondages publiés, c'est d'abord l'absence de transparence sur les techniques de redressement des données brutes utilisées par les instituts. On ne sait en effet à peu près rien des corrections appliquées pour tenir compte en particulier de la tendance de certains à surestimer ou sous-évaluer des candidats ou des partis (ce fut notamment le cas pendant longtemps des électeurs du Front national, peu enclins à faire état de leurs préférences et qui passaient ainsi "sous le radar" des sondages). Autre problème, celui qui tient à l'exploitation des sondages. Les phénomènes de "swing", c'est-à-dire les variations plus ou moins brutales de l'opinion, paraissent souvent bien curieux aux observateurs, alors même qu'ils ne reflètent généralement que des changements chez un petit nombre d'individus sans "redressement" suffisamment précis et pertinent. Enfin, un aspect parfois oublié tient au fait que les sondages reposent encore une fois sur des probabilités : ce ne sont pas des prévisions et ils sont sensibles à des facteurs ou des événements inconnus et non anticipés qui peuvent altérer les équations établies pour l'exploitation des données. C'est ce que montrent très bien par exemple, dans un autre domaine, les personnes qui travaillent sur les questions de sûreté nucléaire : les chiffres sont bas et rassurants, jusqu'au moment où... un accident survient et conduit à modifier les données et les modèles utilisés.
Alors, quoi ? Faut-il ne pas lire et/ou ne pas tenir compte des sondages ?  A l'évidence, non, pour deux raisons : d'abord, parce qu'ils sont devenus un élément de la vie politique qu'il faut maîtriser, recadrer, nuancer, critiquer, bazarder ; ensuite, parce que les sondages se "trompent" finalement assez peu, les primaires citoyennes l'ont encore montré récemment. La plupart des "surprises" connues restent généralement associées à des résultats qui étaient "dans la marge d'erreur" des sondages alors publiés. L'une des plus saisissantes reste la présence non prévue de Jean-Marie Le Pen au second tour de l'élection présidentielle de 2002, même si on a pu montrer avec le recul que les derniers sondages indiquaient ce rapprochement et que les chiffres publiés étaient bien dans la marge d'erreur.
Bon, doit bien en avoir un qui traîne quelque part...

Commentaires

Fr. a dit…
En définitive, le plus dur à entendre au sujet des sondages, ce sont peut-être les critiques sans queue ni tête… Je ne m'en remets pas.

La méthode des “quotas” a par ailleurs ses propres travers, mais une étude récente montre aussi que, si l'échantillon est bien fichu, on peut obtenir des résultats tout à fait crédibles (par rapport à ce que l'on sait objectivement grâce aux votes précédents).
Yves Surel a dit…
Merci pour ces liens, même si le premier est réellement déprimant (pourquoi et comment considérer après ça la science politique autrement que comme une conversation de café du commerce ?). Ce qui nourrit un doute ou une incrédulité inédite à l'égard des sondages, ce sont peut-être deux éléments : le fait que la campagne "n'accroche pas" ; le différentiel de second tour qui paraît énorme, même si, à bien y regarder, seules les élections de 1974 et de 1981 furent serrées au second tour. Bon, on verra bien, comme diraient les copines de Dominique Reynié...

Posts les plus consultés de ce blog

Epistémologie de comptoir

De science certaine...