Corrélation vs Covariance
La corrélation et la covariance sont des concepts étroitement liés dans les statistiques théoriques. Ils sont importants pour déterminer la relation entre deux variables aléatoires.
Qu'est-ce que la corrélation ?
La corrélation est une mesure de la force de la relation entre deux variables. Le coefficient de corrélation quantifie le degré de changement d'une variable en fonction du changement de l'autre variable. En statistique, la corrélation est liée au concept de dépendance, qui est la relation statistique entre deux variables
Le coefficient de corrélation de Pearson ou simplement le coefficient de corrélation r est une valeur comprise entre -1 et 1 (-1≤r≤+1). C'est le coefficient de corrélation le plus couramment utilisé et valable uniquement pour une relation linéaire entre les variables. Si r=0 aucune relation n'existe, et si r≥0 la relation est directement proportionnelle; la valeur d'une variable augmente avec l'augmentation de l'autre. Si r≤0 la relation est inversement proportionnelle; une variable diminue à mesure que l'autre augmente.
En raison de la condition de linéarité, le coefficient de corrélation r peut également être utilisé pour établir la présence d'une relation linéaire entre les variables.
Qu'est-ce que la covariance ?
En théorie statistique, la covariance est une mesure de la variation simultanée de deux variables aléatoires. En d'autres termes, la covariance est une mesure de la force de la corrélation entre deux variables aléatoires.
Dans une autre perspective, on peut voir que la corrélation n'est que la version normalisée de la covariance, où la covariance est divisée par le produit des écarts-types des deux variables aléatoires. La plage de covariance peut être large; il n'est donc pas facile de comparer. Cette difficulté est surmontée en amenant les valeurs de covariance à une plage où elles peuvent être comparées en les normalisant (un peu comme ce que fait le score z). Bien que la covariance et la variance soient liées l'une à l'autre de la manière ci-dessus, leurs distributions de probabilité ne sont pas liées l'une à l'autre de manière simple et doivent être traitées séparément.
Quelle est la différence entre la corrélation et la covariance ?
• La corrélation et la covariance sont des mesures de la relation entre deux variables aléatoires. La corrélation est la mesure de la force de la linéarité des deux variables et la covariance est une mesure de la force de la corrélation.
• Les valeurs des coefficients de corrélation sont comprises entre -1 et +1, tandis que la plage de covariance n'est pas constante, mais peut être positive ou négative. Mais si les variables aléatoires sont standardisées avant de calculer la covariance, alors la covariance est égale à la corrélation et a une valeur comprise entre -1 et +1.