La principale différence entre la classification et l'arbre de régression est que, dans la classification, les variables dépendantes sont catégorielles et non ordonnées, tandis que dans la régression, les variables dépendantes sont des valeurs entières continues ou ordonnées.
La classification et la régression sont des techniques d'apprentissage permettant de créer des modèles de prédiction à partir des données recueillies. Les deux techniques sont présentées graphiquement sous forme d'arbres de classification et de régression, ou plutôt d'organigrammes avec des divisions de données après chaque étape, ou plutôt de "branches" dans l'arbre. Ce processus est appelé partitionnement récursif. Des domaines tels que l'exploitation minière utilisent ces techniques d'apprentissage de classification et de régression. Cet article se concentre sur l'arbre de classification et l'arbre de régression.
Qu'est-ce que la classification ?
La classification est une technique utilisée pour arriver à un schéma qui montre l'organisation des données en commençant par une variable précurseur. Les variables dépendantes sont ce qui classe les données.
Figure 01: Exploration de données
L'arbre de classification commence par la variable indépendante, qui se divise en deux groupes déterminés par les variables dépendantes existantes. Il est destiné à élucider les réponses sous forme de catégorisation induite par les variables dépendantes.
Qu'est-ce que la régression
La régression est une méthode de prédiction basée sur une valeur de sortie numérique supposée ou connue. Cette valeur de sortie est le résultat d'une série de partitionnement récursif, chaque étape ayant une valeur numérique et un autre groupe de variables dépendantes qui se ramifient en une autre paire comme celle-ci.
L'arbre de régression commence par une ou plusieurs variables précurseurs et se termine par une variable de sortie finale. Les variables dépendantes sont des variables numériques continues ou discrètes.
Quelle est la différence entre la classification et la régression ?
Classification vs Régression |
|
Un modèle d'arbre où la variable cible peut prendre un ensemble discret de valeurs. | Un modèle d'arbre où la variable cible peut prendre des valeurs continues, généralement des nombres réels. |
Variable dépendante | |
Pour l'arbre de classification, les variables dépendantes sont catégorielles. | Pour l'arbre de régression, les variables dépendantes sont numériques. |
Valeurs | |
Possède un nombre défini de valeurs non ordonnées. | Possède soit des valeurs discrètes mais ordonnées, soit des valeurs indiscrètes. |
Objectif de la construction | |
Le but de la construction de l'arbre de régression est d'adapter un système de régression à chaque branche déterminante de manière à ce que la valeur de sortie attendue apparaisse. | Un arbre de classification se ramifie comme déterminé par une variable dépendante dérivée du nœud précédent. |
Résumé - Classification vs Régression
Les arbres de régression et de classification sont des techniques utiles pour cartographier le processus qui pointe vers un résultat étudié, qu'il s'agisse d'une classification ou d'une valeur numérique unique. La différence entre l'arbre de classification et l'arbre de régression est leur variable dépendante. Les arbres de classification ont des variables dépendantes qui sont catégorielles et non ordonnées. Les arbres de régression ont des variables dépendantes qui sont des valeurs continues ou des valeurs entières ordonnées.