Association contre corrélation
L'association et la corrélation sont deux méthodes pour expliquer une relation entre deux variables statistiques. L'association fait référence à un terme plus général et la corrélation peut être considérée comme un cas particulier d'association, où la relation entre les variables est de nature linéaire.
Qu'est-ce que l'association ?
Le terme statistique association est défini comme une relation entre deux variables aléatoires qui les rend statistiquement dépendantes. Il se réfère plutôt à une relation générale sans que les détails de la relation soient mentionnés, et il n'est pas nécessaire qu'il s'agisse d'une relation causale.
De nombreuses méthodes statistiques sont utilisées pour établir l'association entre deux variables. Le coefficient de corrélation de Pearson, le rapport des cotes, la corrélation de distance, les Lambda de Goodman et de Kruskal et le rho de Spearman (ρ) en sont quelques exemples.
Qu'est-ce que la corrélation ?
La corrélation est une mesure de la force de la relation entre deux variables. Le coefficient de corrélation quantifie le degré de changement d'une variable en fonction du changement de l'autre variable. En statistique, la corrélation est liée au concept de dépendance, qui est la relation statistique entre deux variables
Le coefficient de corrélation de Pearson ou simplement le coefficient de corrélation r est une valeur comprise entre -1 et 1 (-1≤r≤+1). C'est le coefficient de corrélation le plus couramment utilisé et valable uniquement pour une relation linéaire entre les variables. Si r=0, aucune relation n'existe, et si r≥0, la relation est directement proportionnelle; la valeur d'une variable augmente avec l'augmentation de l'autre. Si r≤0, la relation est inversement proportionnelle; une variable diminue à mesure que l'autre augmente.
En raison de la condition de linéarité, le coefficient de corrélation r peut également être utilisé pour établir la présence d'une relation linéaire entre les variables.
Le coefficient de corrélation de rang de Spearman et le coefficient de corrélation de rang de Kendrall mesurent la force de la relation, à l'exclusion du facteur linéaire. Ils considèrent dans quelle mesure une variable augmente ou diminue avec l'autre. Si les deux variables augmentent ensemble, le coefficient sera positif et si une variable augmente tandis que l'autre diminue, la valeur du coefficient sera négative.
Les coefficients de corrélation de rang sont utilisés uniquement pour établir le type de relation, mais pas pour enquêter en détail comme le coefficient de corrélation de Pearson. Ils permettent également d'alléger les calculs et de rendre les résultats plus indépendants de la non-normalité des distributions considérées.
Quelle est la différence entre association et corrélation ?
• L'association fait référence à la relation générale entre deux variables aléatoires tandis que la corrélation fait référence à une relation plus ou moins linéaire entre les variables aléatoires.
• L'association est un concept, mais la corrélation est une mesure d'association et des outils mathématiques sont fournis pour mesurer l'ampleur de la corrélation.
• Le coefficient de corrélation du moment du produit de Pearson établit la présence d'une relation linéaire et détermine la nature de la relation (qu'elle soit proportionnelle ou inversement proportionnelle).
• Les coefficients de corrélation de rang sont utilisés pour déterminer la nature de la relation uniquement, à l'exclusion de la linéarité de la relation (elle peut être linéaire ou non, mais elle indiquera si les variables augmentent ensemble, diminuent ensemble ou une augmente tandis que l'autre diminue ou vice versa).