Données catégorielles vs données numériques
Les données sont les faits ou les informations collectées à des fins de référence ou d'analyse. Souvent, ces données sont collectées en tant qu'attribut du sujet concerné. Cet attribut peut varier de l'un à l'autre donc cet attribut variable peut être considéré comme une variable. Les variables peuvent prendre différentes formes de valeurs et celles-ci sont intrinsèques aux données collectées.
Les variables peuvent être qualitatives ou quantitatives; c'est-à-dire que si la variable est quantitative, les réponses sont des nombres et l'ampleur de l'attribut mesuré peut être énoncée avec un certain degré de précision. L'autre type, les variables qualitatives mesurent les attributs qualitatifs et les valeurs assumées par les variables ne peuvent pas être données en termes de taille ou d'ampleur. Les variables elles-mêmes sont appelées variables catégorielles et les données collectées au moyen d'une variable catégorique sont des données catégorielles.
En savoir plus sur les données numériques
Les données numériques sont essentiellement les données quantitatives obtenues à partir d'une variable, et la valeur a un sens de taille/ampleur. Les données numériques obtenues sont ensuite divisées en trois catégories supplémentaires basées sur la théorie développée par Stanley Smith Stevens. Les données numériques peuvent être ordinales, d'intervalle ou de rapport. Le type de données est déterminé par la méthode de mesure des valeurs, et les types sont appelés niveaux de mesure.
Le poids d'une personne, la distance entre deux points, la température et le prix d'une action sont des exemples de données numériques.
En statistique, la majorité des méthodes est dérivée de l'analyse de données numériques. Les statistiques descriptives de base, la régression et d'autres méthodes inférentielles sont principalement utilisées pour l'analyse des données numériques.
En savoir plus sur les données catégorielles
Les données catégorielles sont des valeurs pour une variable qualitative, souvent un nombre, un mot ou un symbole. Ils mettent en évidence le fait que la variable dans le cas considéré appartient à l'un des nombreux choix disponibles. Par conséquent, ils appartiennent à l'une des catégories; d'où le nom catégorique.
L'affiliation politique d'une personne, la nationalité d'une personne, la couleur préférée d'une personne et le groupe sanguin d'un patient sont des attributs qualitatifs. Parfois, un nombre peut être obtenu en tant que valeur catégorique, mais le nombre lui-même ne représente pas l'ampleur de l'attribut mesuré. Le code postal en est un exemple.
En outre, toutes les valeurs catégorielles appartiennent au type de données nominal, qui est un autre type basé sur les niveaux de mesures. Les méthodes utilisées pour analyser les données catégorielles sont différentes de celles des données numériques, mais le principe sous-jacent peut être le même.
Quelle est la différence entre les données catégorielles et numériques ?
• Les données numériques sont des valeurs obtenues pour une variable quantitative et portent un sens de grandeur lié au contexte de la variable (par conséquent, ce sont toujours des nombres ou des symboles portant une valeur numérique). Les données catégorielles sont des valeurs obtenues pour une variable qualitative; les numéros de données catégorielles n'ont pas de sens de grandeur.
• Les données numériques appartiennent toujours au type ordinal, ratio ou intervalle, tandis que les données catégorielles appartiennent au type nominal.
• Les méthodes utilisées pour analyser les données quantitatives sont différentes des méthodes utilisées pour les données catégorielles, même si les principes sont les mêmes au moins l'application présente des différences significatives.
• Les données numériques sont analysées à l'aide de méthodes statistiques dans les statistiques descriptives, la régression, les séries chronologiques et bien d'autres.
• Pour les données catégorielles, on utilise généralement des méthodes descriptives et des méthodes graphiques. Certains tests non paramétriques sont également utilisés.