Variables aléatoires vs distribution de probabilité
Les expériences statistiques sont des expériences aléatoires qui peuvent être répétées indéfiniment avec un ensemble de résultats connus. Des variables aléatoires et des distributions de probabilité sont associées à de telles expériences. Pour chaque variable aléatoire, il existe une distribution de probabilité associée définie par une fonction appelée fonction de distribution cumulative.
Qu'est-ce qu'une variable aléatoire ?
Une variable aléatoire est une fonction qui attribue des valeurs numériques aux résultats d'une expérience statistique. En d'autres termes, il s'agit d'une fonction définie à partir de l'espace échantillon d'une expérience statistique dans l'ensemble des nombres réels.
Par exemple, considérez une expérience aléatoire consistant à lancer deux fois une pièce. Les résultats possibles sont HH, HT, TH et TT (H – têtes, T – contes). Soit la variable X le nombre de têtes observées dans l'expérience. Alors, X peut prendre les valeurs 0, 1 ou 2, et c'est une variable aléatoire. Ici, la variable aléatoire X mappera l'ensemble S={HH, HT, TH, TT} (l'espace d'échantillonnage) à l'ensemble {0, 1, 2} de telle sorte que HH soit mappé à 2, HT et TH sont mappés sur 1 et TT est mappé sur 0. En notation de fonction, cela peut être écrit comme X: S → R où X(HH)=2, X(HT)=1, X(TH)=1 et X(TT)=0.
Il existe deux types de variables aléatoires: discrètes et continues, en conséquence le nombre de valeurs possibles qu'une variable aléatoire peut prendre est au plus dénombrable ou non. Dans l'exemple précédent, la variable aléatoire X est une variable aléatoire discrète puisque {0, 1, 2} est un ensemble fini. Considérons maintenant l'expérience statistique consistant à trouver les poids des élèves d'une classe. Soit Y la variable aléatoire définie comme le poids d'un élève. Y peut prendre n'importe quelle valeur réelle dans un intervalle spécifique. Par conséquent, Y est une variable aléatoire continue.
Qu'est-ce qu'une distribution de probabilité ?
La distribution de probabilité est une fonction qui décrit la probabilité qu'une variable aléatoire prenne certaines valeurs.
Une fonction appelée fonction de distribution cumulative (F) peut être définie à partir de l'ensemble des nombres réels vers l'ensemble des nombres réels comme F(x)=P(X ≤ x) (la probabilité que X soit inférieur ou égal à x) pour chaque résultat possible x. Maintenant, la fonction de distribution cumulative de X dans le premier exemple peut être écrite comme F(a)=0, si a<0; F(a)=0,25, si 0≤a<1; F(a)=0.75, si 1≤a<2 et F(a)=1, si a≥2.
Dans le cas de variables aléatoires discrètes, une fonction peut être définie à partir de l'ensemble des résultats possibles vers l'ensemble des nombres réels de telle sorte que ƒ(x)=P(X=x) (la probabilité de X étant égal à x) pour chaque résultat possible x. Cette fonction particulière ƒ est appelée la fonction de masse de probabilité de la variable aléatoire X. Maintenant, la fonction de masse de probabilité de X dans le premier exemple particulier peut être écrite comme ƒ(0)=0,25, ƒ(1)=0,5, ƒ(2)=0,25 et ƒ(x)=0 sinon. Ainsi, la fonction de masse de probabilité ainsi que la fonction de distribution cumulative décriront la distribution de probabilité de X dans le premier exemple.
Dans le cas de variables aléatoires continues, une fonction appelée fonction de densité de probabilité (ƒ) peut être définie comme ƒ(x)=dF(x)/dx pour chaque x où F est la fonction de distribution cumulative de la variable aléatoire continue. Il est facile de voir que cette fonction satisfait ∫ƒ(x)dx=1. La fonction de densité de probabilité ainsi que la fonction de distribution cumulative décrivent la distribution de probabilité d'une variable aléatoire continue. Par exemple, la distribution normale (qui est une distribution de probabilité continue) est décrite à l'aide de la fonction de densité de probabilité ƒ(x)=1/√(2πσ2) e^([(x- µ)]2/(2σ2)).
Quelle est la différence entre les variables aléatoires et la distribution de probabilité ?
• La variable aléatoire est une fonction qui associe les valeurs d'un espace échantillon à un nombre réel.
• La distribution de probabilité est une fonction qui associe les valeurs qu'une variable aléatoire peut prendre à la probabilité d'occurrence respective.