Différence entre la variance et la covariance

Différence entre la variance et la covariance
Différence entre la variance et la covariance

Vidéo: Différence entre la variance et la covariance

Vidéo: Différence entre la variance et la covariance
Vidéo: Loi Normale : tout ce qu'il faut savoir 2024, Novembre
Anonim

Variance vs Covariance

La variance et la covariance sont deux mesures utilisées en statistique. La variance est une mesure de la dispersion des données et la covariance indique le degré de changement de deux variables aléatoires ensemble. La variance est plutôt un concept intuitif, mais la covariance est définie mathématiquement de manière pas si intuitive au début.

En savoir plus sur la variance

La variance est une mesure de la dispersion des données par rapport à la valeur moyenne de la distribution. Il indique à quelle distance les points de données se situent par rapport à la moyenne de la distribution. C'est l'un des principaux descripteurs de la distribution de probabilité et l'un des moments de la distribution. De plus, la variance est un paramètre de la population et la variance d'un échantillon de la population agit comme un estimateur de la variance de la population. D'un certain point de vue, il est défini comme le carré de l'écart type.

En langage clair, cela peut être décrit comme la moyenne des carrés de la distance entre chaque point de données et la moyenne de la distribution. La formule suivante est utilisée pour calculer la variance.

Var(X)=E[(X-µ)2] pour une population, et

Var(X)=E[(X-‾x)2] pour un échantillon

Il peut encore être simplifié pour donner Var(X)=E[X2]-(E[X])2.

Variance a certaines propriétés de signature et est souvent utilisée dans les statistiques pour simplifier l'utilisation. La variance est non négative car elle est le carré des distances. Cependant, la plage de la variance n'est pas confinée et dépend de la distribution particulière. La variance d'une variable aléatoire constante est nulle et la variance ne change pas par rapport à un paramètre de localisation.

En savoir plus sur la covariance

En théorie statistique, la covariance est une mesure de la variation simultanée de deux variables aléatoires. En d'autres termes, la covariance est une mesure de la force de la corrélation entre deux variables aléatoires. En outre, cela peut être considéré comme une généralisation du concept de variance de deux variables aléatoires.

La covariance de deux variables aléatoires X et Y, qui sont distribuées conjointement avec une seconde impulsion finie, est connue sous le nom de σXY=E[(X-E[X])(Y-E[Y])]. À partir de là, la variance peut être considérée comme un cas particulier de covariance, où deux variables sont identiques. Cov(X, X)=Var(X)

En normalisant la covariance, le coefficient de corrélation linéaire ou le coefficient de corrélation de Pearson peut être obtenu, qui est défini comme ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )

Graphiquement, la covariance entre une paire de points de données peut être considérée comme l'aire du rectangle avec les points de données aux sommets opposés. Il peut être interprété comme une mesure de l'ampleur de la séparation entre les deux points de données. Considérant les rectangles pour l'ensemble de la population, le chevauchement des rectangles correspondant à tous les points de données peut être considéré comme la force de la séparation; variance des deux variables. La covariance est à deux dimensions, à cause de deux variables, mais la simplifier à une variable donne la variance d'une seule comme séparation dans une dimension.

Quelle est la différence entre variance et covariance ?

• La variance est la mesure de la propagation/dispersion dans une population tandis que la covariance est considérée comme une mesure de la variation de deux variables aléatoires ou de la force de la corrélation.

• La variance peut être considérée comme un cas particulier de covariance.

• La variance et la covariance dépendent de l'ampleur des valeurs des données et ne peuvent pas être comparées; par conséquent, ils sont normalisés. La covariance est normalisée dans le coefficient de corrélation (divisé par le produit des écarts types des deux variables aléatoires) et la variance est normalisée dans l'écart type (en prenant la racine carrée)

Conseillé: