Écart-type vs Moyenne
Dans les statistiques descriptives et inférentielles, plusieurs indices sont utilisés pour décrire un ensemble de données correspondant à sa tendance centrale, sa dispersion et son asymétrie. Dans l'inférence statistique, ceux-ci sont communément appelés estimateurs car ils estiment les valeurs des paramètres de la population.
Tendance centrale désigne et situe le centre de la distribution des valeurs. La moyenne, le mode et la médiane sont les indices les plus couramment utilisés pour décrire la tendance centrale d'un ensemble de données. La dispersion est la quantité de propagation des données à partir du centre de la distribution. La portée et l'écart type sont les mesures de dispersion les plus couramment utilisées. Les coefficients d'asymétrie de Pearson sont utilisés pour décrire l'asymétrie d'une distribution de données. Ici, l'asymétrie fait référence à la symétrie ou non de l'ensemble de données par rapport au centre et, si ce n'est pas le cas, à son degré d'asymétrie.
Qu'est-ce que ça veut dire ?
Mean est l'indice de tendance centrale le plus couramment utilisé. Étant donné un ensemble de données, la moyenne est calculée en prenant la somme de toutes les valeurs de données, puis en la divisant par le nombre de données. Par exemple, les poids de 10 personnes (en kilogrammes) sont mesurés à 70, 62, 65, 72, 80, 70, 63, 72, 77 et 79. Ensuite, le poids moyen des dix personnes (en kilogrammes) peut être calculé comme suit. La somme des poids est 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Moyenne=(somme) / (nombre de données)=710 / 10=71 (en kilogrammes).
Comme dans cet exemple particulier, la valeur moyenne d'un ensemble de données peut ne pas être un point de données de l'ensemble mais sera unique pour un ensemble de données donné. La moyenne aura les mêmes unités que les données d'origine. Par conséquent, il peut être marqué sur le même axe que les données et peut être utilisé dans des comparaisons. De plus, il n'y a pas de restriction de signe pour la moyenne d'un ensemble de données. Il peut être négatif, nul ou positif, car la somme de l'ensemble de données peut être négative, nulle ou positive.
Qu'est-ce que l'écart type ?
L'écart type est l'indice de dispersion le plus couramment utilisé. Pour calculer l'écart type, on calcule d'abord les écarts des valeurs de données par rapport à la moyenne. La moyenne quadratique des écarts est appelée l'écart type.
Dans l'exemple précédent, les écarts respectifs par rapport à la moyenne sont (70 - 71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 et (79-71)=8. La somme des carrés de déviation est (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. L'écart type est √(366/10)=6,05 (en kilogrammes). De cela, on peut conclure que la majorité des données se situent dans l'intervalle 71 ± 6.05, à condition que l'ensemble de données ne soit pas très asymétrique, et c'est effectivement le cas dans cet exemple particulier.
Étant donné que l'écart type a les mêmes unités que les données d'origine, il nous donne une mesure de l'écart entre les données et le centre; plus l'écart type est grand plus la dispersion. De plus, l'écart type sera une valeur non négative quelle que soit la nature des données dans l'ensemble de données.
Quelle est la différence entre l'écart type et la moyenne ?
• L'écart type est une mesure de la dispersion par rapport au centre, tandis que la moyenne mesure l'emplacement du centre d'un ensemble de données.
• L'écart type est toujours une valeur non négative, mais la moyenne peut prendre n'importe quelle valeur réelle.