Population par rapport à l'écart-type de l'échantillon
En statistique, plusieurs indices sont utilisés pour décrire un ensemble de données correspondant à sa tendance centrale, sa dispersion et son asymétrie. L'écart type est l'une des mesures les plus courantes de la dispersion des données à partir du centre de l'ensemble de données.
En raison de difficultés pratiques, il ne sera pas possible d'utiliser les données de l'ensemble de la population lorsqu'une hypothèse est testée. Par conséquent, nous utilisons des valeurs de données provenant d'échantillons pour faire des inférences sur la population. Dans une telle situation, ceux-ci sont appelés estimateurs car ils estiment les valeurs des paramètres de la population.
Il est extrêmement important d'utiliser des estimateurs sans biais dans l'inférence. Un estimateur est dit sans biais si la valeur attendue de cet estimateur est égale au paramètre de population. Par exemple, nous utilisons la moyenne de l'échantillon comme estimateur sans biais de la moyenne de la population. (Mathématiquement, on peut montrer que la valeur attendue de la moyenne de l'échantillon est égale à la moyenne de la population). Dans le cas de l'estimation de l'écart-type de la population, l'écart-type de l'échantillon est également un estimateur sans biais.
Qu'est-ce que l'écart type d'une population ?
Lorsque les données de l'ensemble de la population peuvent être prises en compte (par exemple dans le cas d'un recensement), il est possible de calculer l'écart-type de la population. Pour calculer l'écart type de la population, on calcule d'abord les écarts des valeurs de données par rapport à la moyenne de la population. La racine carrée moyenne (moyenne quadratique) des écarts est appelée écart-type de la population.
Dans une classe de 10 élèves, les données sur les élèves peuvent facilement être collectées. Si une hypothèse est testée sur cette population d'étudiants, il n'est pas nécessaire d'utiliser des valeurs d'échantillon. Par exemple, les poids des 10 étudiants (en kilogrammes) sont mesurés à 70, 62, 65, 72, 80, 70, 63, 72, 77 et 79. Ensuite, le poids moyen des dix personnes (en kilogrammes) est (70+62+65+72+80+70+63+72+77+79)/10, soit 71 (en kilogrammes). C'est la moyenne de la population.
Maintenant, pour calculer l'écart-type de la population, nous calculons les écarts par rapport à la moyenne. Les écarts respectifs à la moyenne sont (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 et (79 – 71)=8. La somme des carrés de l'écart est (-1)2 + (-9)2 + (-6)2 + 1 2 + 92 + (-1)2 + (-8)2+ 12 + 62 + 82 =366. L'écart-type de la population est √(366/10)=6,05 (en kilogrammes). 71 est le poids moyen exact des élèves de la classe et 6.05 est l'écart type exact du poids par rapport à 71.
Qu'est-ce que l'écart type de l'échantillon ?
Lorsque les données d'un échantillon (de taille n) sont utilisées pour estimer les paramètres de la population, l'écart type de l'échantillon est calculé. Tout d'abord, les écarts des valeurs de données par rapport à la moyenne de l'échantillon sont calculés. Étant donné que la moyenne de l'échantillon est utilisée à la place de la moyenne de la population (qui est inconnue), il n'est pas approprié de prendre la moyenne quadratique. Afin de compenser l'utilisation de la moyenne de l'échantillon, la somme des carrés des écarts est divisée par (n-1) au lieu de n. L'écart-type de l'échantillon est la racine carrée de ceci. Dans les symboles mathématiques, S=√{∑(xi-ẍ)2 / (n-1)}, où S est l'écart type de l'échantillon, ẍ est la moyenne de l'échantillon et xi sont les points de données.
Maintenant, supposons que, dans l'exemple précédent, la population est constituée des élèves de toute l'école. Ensuite, la classe ne sera qu'un échantillon. Si cet échantillon est utilisé dans l'estimation, l'écart-type de l'échantillon sera √(366/9)=6.38 (en kilogrammes) puisque 366 a été divisé par 9 au lieu de 10 (la taille de l'échantillon). Le fait à observer est qu'il n'est pas garanti que ce soit la valeur exacte de l'écart type de la population. Il s'agit simplement d'une estimation.
Quelle est la différence entre l'écart-type de la population et l'écart-type de l'échantillon ?
• L'écart-type de la population est la valeur exacte du paramètre utilisé pour mesurer la dispersion à partir du centre, tandis que l'écart-type de l'échantillon en est un estimateur sans biais.
• L'écart-type de la population est calculé lorsque toutes les données concernant chaque individu de la population sont connues. Sinon, l'écart type de l'échantillon est calculé.
• L'écart-type de la population est donné par σ=√{ ∑(xi-µ)2/ n} où µ est la moyenne de la population et n est la taille de la population mais l'écart type de l'échantillon est donné par S=√{ ∑(xi-ẍ)2 / (n-1)} où ẍ est la moyenne de l'échantillon et n la taille de l'échantillon.