La taille de l’échantillon dépend :
• Du seuil de confiance (E) qui fixe la représentativité de l’échantillon ;
• De la précision désirée (e) c’est-à-dire de l’erreur acceptée ;
• De l’homogénéité (p) de la population dans ses réponses.
Le calcul s’opère de la façon suivante :
n = t² p ( 1 – p )
e²
t dépend du seuil de confiance E (t = 1,96 pour E = 95% ; t = 2,575 pour
E = 99% ; t = 1.645 pour E = 90%). Dans la pratique commerciale, E est
généralement de 95%.
P est égale à 0.5 lorsqu’elle est inconnue. Mais elle peut être précisée si
on a l’information, par une enquête précédente par exemple.
Ainsi, si on veut connaître la proportion d’agriculteurs susceptibles de
cesser leur activité dans les cinq ans-exemple relevé de la réalité française-, la
taille (n) de l’échantillon sondé au seuil de confiance 95% est la suivante :
P inconnue
fixée à 0,5
P estimée à 30% lors d’une
enquête précédente
e précisée au taux élevé de ± 1% n= 9604 n= 8068
e précisée au taux classique de ± 2% n= 2401 n= 2017
Le doublement de la précision voulu quadruple la taille de l’échantillon
nécessaire.
On mesure l’importance d’une bonne appréciation de la précision
nécessaire et l’intérêt de la pré enquête, le coût étant bien entendu
proportionnel à la taille de l’échantillon. On peut ainsi obtenir une qualité de
l’information suffisante pour un coût réduit. Dans la pratique commerciale, les
tailles utilisées sont de 1000 (recherche d’un ordre de grandeur) à 5000 (panel
de consommateurs).