Dispersion vs asymétrie
Dans les statistiques et la théorie des probabilités, la variation des distributions doit souvent être exprimée de manière quantitative à des fins de comparaison. La dispersion et l'asymétrie sont deux concepts statistiques où la forme de la distribution est présentée dans une échelle quantitative.
En savoir plus sur Dispersion
En statistique, la dispersion est la variation d'une variable aléatoire ou sa distribution de probabilité. C'est une mesure de la distance entre les points de données et la valeur centrale. Pour exprimer cela quantitativement, des mesures de dispersion sont utilisées dans les statistiques descriptives.
La variance, l'écart type et l'intervalle interquartile sont les mesures de dispersion les plus couramment utilisées.
Si les valeurs des données ont une certaine unité, en raison de l'échelle, les mesures de dispersion peuvent également avoir les mêmes unités. La plage interdécile, la plage, la différence moyenne, l'écart absolu médian, l'écart absolu moyen et l'écart type de distance sont des mesures de dispersion avec des unités.
En revanche, il existe des mesures de dispersion qui n'ont pas d'unités, c'est-à-dire sans dimension. La variance, le coefficient de variation, le coefficient quartile de dispersion et la différence moyenne relative sont des mesures de dispersion sans unité.
La dispersion dans un système peut provenir d'erreurs, telles que des erreurs instrumentales et d'observation. De plus, des variations aléatoires dans l'échantillon lui-même peuvent entraîner des variations. Il est important d'avoir une idée quantitative de la variation des données avant de tirer d'autres conclusions à partir de l'ensemble de données.
En savoir plus sur l'asymétrie
En statistique, l'asymétrie est une mesure de l'asymétrie des distributions de probabilité. L'asymétrie peut être positive ou négative, ou dans certains cas inexistante. Il peut également être considéré comme une mesure de décalage par rapport à la distribution normale.
Si l'asymétrie est positive, la majeure partie des points de données est centrée à gauche de la courbe et la queue droite est plus longue. Si l'asymétrie est négative, la majeure partie des points de données est centrée vers la droite de la courbe et la queue gauche est plutôt longue. Si l'asymétrie est nulle, la population est distribuée normalement.
Dans une distribution normale, c'est-à-dire lorsque la courbe est symétrique, la moyenne, la médiane et le mode ont la même valeur. Si l'asymétrie n'est pas nulle, cette propriété n'est pas vérifiée et la moyenne, le mode et la médiane peuvent avoir des valeurs différentes.
Les premier et deuxième coefficients d'asymétrie de Pearson sont couramment utilisés pour déterminer l'asymétrie des distributions.
Premier coefficient d'asymétrie de Pearson=(moyenne - mode) / (écart-type)
Second skewness de Pearson coffeicent=3(mean - mode) / (satndard deviation)
Dans les cas plus sensibles, le coefficient de moment normalisé de Fisher-Pearson ajusté est utilisé.
G={n / (n-1)(n-2)} ∑i=1 ((y-ӯ)/s)3
Quelle est la différence entre Dispersion et Skewness ?
La dispersion concerne la plage sur laquelle les points de données sont distribués, et l'asymétrie concerne la symétrie de la distribution.
Les deux mesures de dispersion et d'asymétrie sont des mesures descriptives et le coefficient d'asymétrie donne une indication sur la forme de la distribution.
Les mesures de dispersion sont utilisées pour comprendre la plage des points de données et le décalage par rapport à la moyenne, tandis que l'asymétrie est utilisée pour comprendre la tendance à la variation des points de données dans une certaine direction.