Différence entre la classification et la régression

Table des matières:

Différence entre la classification et la régression
Différence entre la classification et la régression

Vidéo: Différence entre la classification et la régression

Vidéo: Différence entre la classification et la régression
Vidéo: QU'EST CE QUE LA REGRESSION ET LA CLASSIFICATION EN MACHINE LEARNING ? - VLOG IA 2024, Juillet
Anonim

La principale différence entre la classification et l'arbre de régression est que, dans la classification, les variables dépendantes sont catégorielles et non ordonnées, tandis que dans la régression, les variables dépendantes sont des valeurs entières continues ou ordonnées.

La classification et la régression sont des techniques d'apprentissage permettant de créer des modèles de prédiction à partir des données recueillies. Les deux techniques sont présentées graphiquement sous forme d'arbres de classification et de régression, ou plutôt d'organigrammes avec des divisions de données après chaque étape, ou plutôt de "branches" dans l'arbre. Ce processus est appelé partitionnement récursif. Des domaines tels que l'exploitation minière utilisent ces techniques d'apprentissage de classification et de régression. Cet article se concentre sur l'arbre de classification et l'arbre de régression.

Différence entre classification et régression - Résumé de la comparaison
Différence entre classification et régression - Résumé de la comparaison
Différence entre classification et régression - Résumé de la comparaison
Différence entre classification et régression - Résumé de la comparaison

Qu'est-ce que la classification ?

La classification est une technique utilisée pour arriver à un schéma qui montre l'organisation des données en commençant par une variable précurseur. Les variables dépendantes sont ce qui classe les données.

Différence entre classification et régression
Différence entre classification et régression
Différence entre classification et régression
Différence entre classification et régression

Figure 01: Exploration de données

L'arbre de classification commence par la variable indépendante, qui se divise en deux groupes déterminés par les variables dépendantes existantes. Il est destiné à élucider les réponses sous forme de catégorisation induite par les variables dépendantes.

Qu'est-ce que la régression

La régression est une méthode de prédiction basée sur une valeur de sortie numérique supposée ou connue. Cette valeur de sortie est le résultat d'une série de partitionnement récursif, chaque étape ayant une valeur numérique et un autre groupe de variables dépendantes qui se ramifient en une autre paire comme celle-ci.

L'arbre de régression commence par une ou plusieurs variables précurseurs et se termine par une variable de sortie finale. Les variables dépendantes sont des variables numériques continues ou discrètes.

Quelle est la différence entre la classification et la régression ?

Classification vs Régression

Un modèle d'arbre où la variable cible peut prendre un ensemble discret de valeurs. Un modèle d'arbre où la variable cible peut prendre des valeurs continues, généralement des nombres réels.
Variable dépendante
Pour l'arbre de classification, les variables dépendantes sont catégorielles. Pour l'arbre de régression, les variables dépendantes sont numériques.
Valeurs
Possède un nombre défini de valeurs non ordonnées. Possède soit des valeurs discrètes mais ordonnées, soit des valeurs indiscrètes.
Objectif de la construction
Le but de la construction de l'arbre de régression est d'adapter un système de régression à chaque branche déterminante de manière à ce que la valeur de sortie attendue apparaisse. Un arbre de classification se ramifie comme déterminé par une variable dépendante dérivée du nœud précédent.

Résumé - Classification vs Régression

Les arbres de régression et de classification sont des techniques utiles pour cartographier le processus qui pointe vers un résultat étudié, qu'il s'agisse d'une classification ou d'une valeur numérique unique. La différence entre l'arbre de classification et l'arbre de régression est leur variable dépendante. Les arbres de classification ont des variables dépendantes qui sont catégorielles et non ordonnées. Les arbres de régression ont des variables dépendantes qui sont des valeurs continues ou des valeurs entières ordonnées.

Conseillé: