Échantillonnage
et
estimation
Intervalles de fluctuation et de
confiance
Estimation et intervalle de confiance
Théorème
Estimation et intervalle de confiance
Dans le but d’estimer la probabilité p d’apparition
d’un certain caractère,
on le teste sur un
échantillon de taille n. On note f la fréquence
d’apparition du caractère dans l’échantillon
étudié.
Alors :
• P (p ∈ [f −
√1 ; f
n
√1 ])
n
+
≥ 0, 95
Cet intervalle est appelé intervalle de confiance de
p au niveau de confiance 0, 95.
Exemple
Reprenons
l’exemple
du
sondage
sur
l’abstentionnisme.
L’étude se fait sur un échantillon de n = 1000
personnes.
La
fréquence
observée
sur
l’échantillon est de 0, 195.
L’intervalle de confiance au niveau de confiance
0, 95 de la proportion de français ayant l’intention
de s’abstenir est donc :
• [0, 195 −
√ 1 ; 0, 195
1000
+
√1 ]
1000
= [0, 163; 0, 227]
On peut donc affirmer, avec un risque de se
tromper inférieur à 0, 05, qu’entre 16, 3 % et 22, 7
% des français ont l’intention de s’abstenir.
Remarque
• On calcule facilement que l’amplitude
d’un intervalle de confiance au niveau de
confiance 0, 95 vaut
√2 .
n
• Plus l’échantillon étudié est grand, plus
l’intervalle de confiance se rétrécit : on est
plus précis.
Propriété
Déterminer une taille d’échantillon suffisante
Soit p la proportion d’un caractère dans une
population.
Pour déterminer p avec une précision de t % dans
cette population, la valeur minimale de la taille n
de la population doit être solution de l’équation :
•
√2
n
=
t
100
• équivalent à n =
( 200 )2
t
.
Exemple
Si
maintenant
on
voulait
estimer
le
taux
d’abstention par un intervalle de confiance
au niveau de confiance 0, 95 d’amplitude de 1 %,
il faudrait étudier un échantillon de taille n telle
que :
•
√2
n
= 0, 01
• donc n =
(
2
0,01
)2
= 40 000.
Il faudrait donc interroger 40000 personnes pour
obtenir une telle précision.