statistiques... mais pratique

Publié le par You

Il est souvent arrivé que voulant connaître le comportement d’un ou de plusieurs paramètres dans une population mère, l’on soit obligé de procéder à une enquête sur un échantillon  de cette population.

A partir de cet instant, il se pose à nous la question de la   « représentativité » de l’échantillon choisi. En d’autres termes, pourrons-nous dire que l’échantillon traduit fidèlement le comportement de l’ensemble de la population ? On rentre de plein pied dans le domaine de l’incertitude. Une épine principale consiste à définir l’effectif « n » de l’échantillon pouvant permettre de faire des extrapolations sur la population.

Devant une telle situation, il s’agit tout d’abord de se fixer un niveau de certitude voulue. Par exemple se fixer un niveau de 5%, voudra dire que les paramètres de l’échantillon enquêté sont contenus dans un intervalle de confiance de 95% (normale, 95% + 5% =100% !!!).

En dehors de ce niveau de certitude, on a aussi besoin de choisir une largeur d’intervalle (i). Par exemple, pour une largeur d’intervalle de 6%, on pourra dire que tous les paramètres étudiés dans l’échantillon seront identiques à 95% à ceux de la population dans un intervalle de plus ou moins 3%.

En admettant que les variables suivent une loi normale (restons pratiques et ne cherchons pas plus loin), on peut utiliser l’équation suivante pour déterminer « n » :

 

            n =   (1,96)2  * N

                   (1,96)2 + (i) 2 (N-1)

 

1,96 n’est pas tombé du ciel ! C’est un exemple et on le lit sur le tableau de distribution de la loi normale centrée réduite pour  un niveau de certitude de 5% (par exemple pour 1%, on lirait 2,58). Ce sont d’ailleurs deux niveaux généralement utilisés.

« N » est l’effectif de la population mère sur laquelle on prélève l’échantillon.

 

OUF ! On ne connait pas toujours l’effectif de la population que faire alors ?

Publié dans Développement rural

Pour être informé des derniers articles, inscrivez vous :
Commenter cet article