Statistiques descriptives vs inférentielles
La statistique est la discipline de la collecte, de l'analyse et de la présentation des données. La théorie des statistiques est divisée en deux branches sur la base des informations qu'elles produisent en analysant les données.
Qu'est-ce que la statistique descriptive ?
Les statistiques descriptives sont la branche des statistiques qui décrivent quantitativement les principales propriétés d'un ensemble de données. Pour représenter les propriétés d'un ensemble de données aussi précisément que possible, les données sont résumées à l'aide d'outils graphiques ou numériques.
Le résumé graphique se fait en tabulant, regroupant et représentant graphiquement les valeurs des variables d'intérêt. Les histogrammes de distribution de fréquence et de distribution de fréquence relative sont de telles représentations. Ils décrivent la distribution des valeurs dans la population.
Le résumé numérique implique le calcul de mesures descriptives telles que la moyenne, le mode et la moyenne. Les mesures descriptives sont en outre classées en deux classes; ce sont des mesures de tendance centrale et des mesures de dispersion/variation. Les mesures de la tendance centrale sont la moyenne/moyenne, la médiane et le mode. Chacun a son propre niveau d'applicabilité et d'utilité. Là où l'un peut échouer, l'autre peut mieux représenter l'ensemble de données.
Comme son nom l'indique, les mesures de dispersion consistent à mesurer la distribution des données. La plage, l'écart type, la variance, les plages de centiles et de quartiles et le coefficient de variation sont des mesures de dispersion. Ils fournissent des informations sur la diffusion des données.
Un exemple simple d'utilisation de statistiques descriptives est le calcul de la moyenne pondérée cumulative d'un étudiant. Le GPA est essentiellement la moyenne pondérée des résultats des étudiants et reflète la performance académique globale de cet étudiant en particulier.
Qu'est-ce que la statistique inférentielle ?
Les statistiques inférentielles sont la branche des statistiques qui tirent des conclusions sur la population concernée à partir de l'ensemble de données obtenu à partir d'un échantillon soumis à des variations aléatoires, observationnelles et d'échantillonnage. En général, les résultats sont obtenus à partir d'un échantillon aléatoire de la population et les conclusions tirées de l'échantillon sont ensuite généralisées pour représenter l'ensemble de la population.
L'échantillon est un sous-ensemble de la population, et les mesures des statistiques descriptives pour les données acquises à partir de l'échantillon sont simplement appelées statistiques. Les mesures des statistiques descriptives obtenues à partir de l'analyse de l'échantillon sont appelées paramètres lorsqu'elles sont appliquées à la population, et elles représentent l'ensemble de la population.
Les statistiques inférentielles se concentrent sur la façon de généraliser les statistiques obtenues à partir d'un échantillon aussi précisément que possible pour représenter la population. Un facteur préoccupant est la nature de l'échantillon. Si l'échantillon est biaisé, les résultats sont également biaisés et les paramètres basés sur ceux-ci ne représentent pas correctement l'ensemble de la population. Par conséquent, l'échantillonnage est une étude importante des statistiques inférentielles. Les hypothèses statistiques, la théorie de la décision statistique et la théorie de l'estimation, les tests d'hypothèses, la conception d'expériences, l'analyse de variance et l'analyse de régression sont des sujets d'étude importants dans la théorie des statistiques inférentielles.
Un bon exemple de statistiques inférentielles en action est la prédiction des résultats d'une élection avant le vote au moyen d'un sondage.
Quelle est la différence entre les statistiques descriptives et inférentielles ?
• Les statistiques descriptives visent à résumer les données recueillies à partir d'un échantillon. La technique produit des mesures de tendance centrale et de dispersion qui représentent la manière dont les valeurs des variables sont concentrées et dispersées.
• La statistique inférentielle généralise les statistiques obtenues à partir d'un échantillon à la population générale à laquelle appartient l'échantillon. Les mesures de la population sont qualifiées de paramètres.
• Les statistiques descriptives ne font que résumer les propriétés de l'échantillon à partir duquel les données ont été acquises, mais dans les statistiques inférentielles, la mesure de l'échantillon est utilisée pour déduire les propriétés de la population.
• Dans les statistiques inférentielles, les paramètres ont été obtenus à partir d'un échantillon, mais pas de l'ensemble de la population; par conséquent, il existe toujours une certaine incertitude par rapport aux valeurs réelles.