Pour illustrer les concepts expliqués au cours de l'article, nous utiliserons l'exemple de la campagne présidentielle des États-Unis de 2004. Selon un sondage paru dans Newsweek, 47% des électeurs voteraient pour John Kerry si l'élection avait lieu aujourd'hui. 45% voteraient pour George W. Bush et 2% pour Ralph Nader. La taille de l'échantillon est de 1 013 personnes interrogées, et la marge d'erreur est de ±4%. Dans le reste de l'article, nous utiliserons l'intervalle de confiance de 99%.
Un sondage nécessite de prendre un échantillon de la population. Dans le cas du sondage de Newsweek, la population prise en compte sont les personnes qui voteront. Étant donné l'impossibilité d'interroger tous les électeurs, les instituts de sondage construisent des échantillons qui sont normalement représentatif de la population. Il est possible qu'ils interrogent 1 013 personnes qui vont voter pour Bush alors que dans la réalité les électeurs sont partagés, mais c'est très peu probable si l'échantillon est suffisamment représentatif de la population.
La marge d'erreur est juste un intervalle de confiance de 99%, qui revient donc à une simple transformation de l'écart-type du résultat. Cette section discute brièvement l'écart-type d'un résultat, l'intervalle de confiance et lie ces deux concepts à la marge d'erreur.
L'écart-type peut être estimée simplement étant donné une proportion ou un pourcentage, p, et le nombre de personnes enquêtées, N. Dans le cas du sondage commandé par Newsweek, le pourcentage de vote pour Kerry, p=0,47 et N=1 013. Selon des théories statistiques présentées ci-dessous,
Plus ou moins 1 écart-type est un intervalle de confiance de 68%, plus ou moins 1,96 écart-type est approximativement un intervalle de confiance de 95%, et un intervalle de confiance de 99% est un écart-type de 2,58 de chaque de côté de la valeur estimée.
Soit N le nombre de votants dans l'échantillon. Supposons qu'ils ont été tirés de façon aléatoire et indépendante de la population totale. L'hypothèse est peut être trop forte, mais si la constitution de l'échantillon est faite avec soin la réalité peut au moins s'approcher de cette situation. Soit p la proportion de votants de la population totale qui voteront « oui ». Alors le nombre X de votants de l'échantillon qui voteront « oui » est une variable aléatoire distribuée selon une loi binomiale de paramètres N et p. Si N est suffisamment grand, alors X suit la loi normale de moyenne Np et de variance Np(1 − p). Donc
suit la loi normale centrée réduite (celle qui a pour paramètres 0 et 1).
La table de la loi normale révèle que P(−2,576 < Z < 2,576) = 0,99, ou, en d'autres termes, qu'il y a 99 chances sur cent pour que cet événement se réalise. Ainsi,
Cela équivaut à
En remplaçant p dans le premier et le troisième membre de cette inégalité par la valeur estimée X/N débouche rarement sur des erreurs importantes si N est assez grand. Cette opération se traduit par:
Le premier et le troisième membre de l'inégalité dépendent de la valeur observable X/N et de la valeur inobservable p, et sont les valeurs extrêmes de l'intervalle de confiance. Autrement dit, la marge d'erreur est