NOTION Échantillonnage-et-intervalle-de-fluctuation

Le 20-03-2019

Échantillonnage

et

estimation

Intervalles de fluctuation et de
confiance
Échantillonnage et intervalle de fluctuation
Définition
Variable aléatoire « fréquence »
Soit p la proportion d’un caractère dans une
population.
On choisit un échantillon de taille n dans cette
population :
• on note Xn la variable aléatoire qui à cet
échantillon associe le nombre d’individus
possédant le caractère en question ;
• on note Fn la variable aléatoire qui à cette
échantillon associe la proportion d’individu
possédant le caractère en question ;
• soit k ∈ [0; n] :
– P (Xn = k) = P (Fn =

k
n)

Définition
Intervalle de fluctuation asymptotique au seuil
0, 95
Soit Fn une variable aléatoire « fréquence ».
L’intervalle de fluctuation asymptotique au seuil
de 0, 95 de Fn est :
• In = [p − 1, 96

p(1−p)

;p
n


+ 1, 96

p(1−p)

] n

• P (Fn ∈ In ) ≥ 0, 95
Théorème
Échantillonnage et intervalle de fluctuation au
seuil 0, 95 : traduction pratique
On connaît la probabilité p d’apparition d’un
certain caractère.
On veut estimer la probable fréquence Fn
d’apparition de ce caractère au sein d’un
échantillon de taille n.  Si on a simultanément :
• n ≥ 30
• np ≥ 5
• n(1 − p) ≥ 5
Alors :
• P (Fn ∈ In ) ≈ 0, 95

Exemple
Reprenons l’exemple de la cantine du collège.
• Le collège compte 250 élèves mangeant à la
cantine.
• On a p = 0, 75.
• Le responsable des achats privilégie le fait
que tous les enfants qui veulent de la bûche
puissent en avoir. Il ne veut pas prendre un
risque plus élevé que 2, 5 %.
• n = 250 > 30, 250 × 0, 75 = 187, 5 > 5, et 250 ×
(1 − 0, 75) = 62, 5 > 5 donc on est bien dans
les conditions d’utilisation d’un intervalle de
fluctuation asymptotique.
• L’intervalle de fluctuation au seuil de 0, 95

0,75(1−0,75)

est I250 = [0, 75 − 1, 96
; [0, 75 +
250

0,75(1−0,75)

1, 96
] ≈ [0, 70; 0, 80].
250
• Il y a donc 5 % de chances que la proportion
d’élèves ne voulant pas de bûche ne soit pas
dans cet intervalle : 2, 5 % de chances qu’il y
en ait moins, 2, 5 % qu’il y en ait plus.
• Le responsable choisit donc d’acheter des
bûches pour 80 % des élèves, soit 0, 8 × 250 =
200 bûches. Il ne prend un risque que de
0, 025 qu’il y ait plus de 200 élèves voulant de
la bûche.
• Cela a permis d’éviter l’achat de 50 bûches
qui avaient 97, 5 % de chances de finir à la
poubelle.
Remarque
Comme il y a

n au dénominateur, plus n est

grand, plus l’intervalle est réduit autour de p : les
résultats ont moins de risque de fluctuer si on
prend un plus grand échantillon, ils seront donc
plus fiables.