Différence entre l'apprentissage automatique supervisé et non supervisé

Table des matières:

Différence entre l'apprentissage automatique supervisé et non supervisé
Différence entre l'apprentissage automatique supervisé et non supervisé

Vidéo: Différence entre l'apprentissage automatique supervisé et non supervisé

Vidéo: Différence entre l'apprentissage automatique supervisé et non supervisé
Vidéo: Différence entre apprentissage machine supervisé et non-supervisé (cours exemple concret définition) 2024, Novembre
Anonim

Différence clé - Machine Learning supervisé vs non supervisé

L'apprentissage supervisé et l'apprentissage non supervisé sont deux concepts fondamentaux de l'apprentissage automatique. L'apprentissage supervisé est une tâche d'apprentissage automatique consistant à apprendre une fonction qui mappe une entrée à une sortie en fonction des exemples de paires entrée-sortie. L'apprentissage non supervisé est la tâche d'apprentissage automatique consistant à déduire une fonction pour décrire une structure cachée à partir de données non étiquetées. La principale différence entre l'apprentissage automatique supervisé et non supervisé est que l'apprentissage supervisé utilise des données étiquetées, tandis que l'apprentissage non supervisé utilise des données non étiquetées.

Machine Learning est un domaine de l'informatique qui permet à un système informatique d'apprendre à partir de données sans être explicitement programmé. Il permet d'analyser les données et d'en prédire les modèles. Il existe de nombreuses applications de l'apprentissage automatique. Certains d'entre eux sont la reconnaissance faciale, la reconnaissance gestuelle et la reconnaissance vocale. Il existe différents algorithmes liés à l'apprentissage automatique. Certains d'entre eux sont la régression, la classification et le regroupement. Les langages de programmation les plus courants pour développer des applications basées sur l'apprentissage automatique sont R et Python. D'autres langages tels que Java, C++ et Matlab peuvent également être utilisés.

Qu'est-ce que l'apprentissage supervisé ?

Dans les systèmes basés sur l'apprentissage automatique, le modèle fonctionne selon un algorithme. En apprentissage supervisé, le modèle est supervisé. Tout d'abord, il est nécessaire de former le modèle. Avec les connaissances acquises, il peut prédire les réponses pour les instances futures. Le modèle est entraîné à l'aide d'un jeu de données étiqueté. Lorsqu'un échantillon de données est fourni au système, il peut prédire le résultat. Voici un petit extrait du célèbre jeu de données IRIS.

Différence entre l'apprentissage supervisé et non supervisé_Figure 02
Différence entre l'apprentissage supervisé et non supervisé_Figure 02

Selon le tableau ci-dessus, la longueur de sépale, la largeur de sépale, la longueur de patel, la largeur de patel et l'espèce sont appelées les attributs. Les colonnes sont appelées caractéristiques. Une ligne contient des données pour tous les attributs. Par conséquent, une ligne est appelée une observation. Les données peuvent être numériques ou catégorielles. Le modèle reçoit les observations avec le nom de l'espèce correspondante comme entrée. Lorsqu'une nouvelle observation est donnée, le modèle doit prédire le type d'espèce auquel elle appartient.

Dans l'apprentissage supervisé, il existe des algorithmes de classification et de régression. La classification est le processus de classification des données étiquetées. Le modèle a créé des limites qui séparaient les catégories de données. Lorsque de nouvelles données sont fournies au modèle, il peut les classer en fonction de l'emplacement du point. Le K-Nearest Neighbors (KNN) est un modèle de classification. En fonction de la valeur k, la catégorie est décidée. Par exemple, lorsque k vaut 5, si un point de données particulier est proche de huit points de données dans la catégorie A et de six points de données dans la catégorie B, alors le point de données sera classé comme A.

La régression est le processus de prédiction de la tendance des données précédentes pour prédire le résultat des nouvelles données. Dans la régression, la sortie peut consister en une ou plusieurs variables continues. La prédiction est effectuée à l'aide d'une ligne qui couvre la plupart des points de données. Le modèle de régression le plus simple est une régression linéaire. Il est rapide et ne nécessite pas de paramètres de réglage comme dans KNN. Si les données montrent une tendance parabolique, le modèle de régression linéaire n'est pas adapté.

Différence entre l'apprentissage supervisé et non supervisé
Différence entre l'apprentissage supervisé et non supervisé

Voici quelques exemples d'algorithmes d'apprentissage supervisé. Généralement, les résultats générés par les méthodes d'apprentissage supervisé sont plus précis et fiables car les données d'entrée sont bien connues et étiquetées. Par conséquent, la machine doit analyser uniquement les motifs cachés.

Qu'est-ce que l'apprentissage non supervisé ?

Dans l'apprentissage non supervisé, le modèle n'est pas supervisé. Le modèle fonctionne de lui-même, pour prédire les résultats. Il utilise des algorithmes d'apprentissage automatique pour tirer des conclusions sur des données non étiquetées. Généralement, les algorithmes d'apprentissage non supervisé sont plus difficiles que les algorithmes d'apprentissage supervisé car il y a peu d'informations. Le clustering est un type d'apprentissage non supervisé. Il peut être utilisé pour regrouper les données inconnues à l'aide d'algorithmes. Le k-mean et le clustering basé sur la densité sont deux algorithmes de clustering.

algorithme k-mean, place k centroïde au hasard pour chaque cluster. Ensuite, chaque point de données est affecté au centroïde le plus proche. La distance euclidienne est utilisée pour calculer la distance entre le point de données et le centroïde. Les points de données sont classés en groupes. Les positions des k centroïdes sont recalculées. La nouvelle position du centroïde est déterminée par la moyenne de tous les points du groupe. Encore une fois, chaque point de données est affecté au centroïde le plus proche. Ce processus se répète jusqu'à ce que les centroïdes ne changent plus. k-mean est un algorithme de clustering rapide, mais il n'y a pas d'initialisation spécifiée des points de clustering. En outre, il existe une grande variation des modèles de clustering basés sur l'initialisation des points de cluster.

Un autre algorithme de clustering est le clustering basé sur la densité. Il est également connu sous le nom d'applications de regroupement spatial basé sur la densité avec bruit. Cela fonctionne en définissant un cluster comme l'ensemble maximal de points connectés de densité. Ce sont deux paramètres utilisés pour le regroupement basé sur la densité. Ce sont Ɛ (epsilon) et des points minimum. Le Ɛ est le rayon maximum du voisinage. Les points minimums sont le nombre minimum de points dans le voisinage Ɛ pour définir un cluster. Ce sont quelques exemples de clustering qui relèvent de l'apprentissage non supervisé.

Généralement, les résultats générés par les algorithmes d'apprentissage non supervisé ne sont pas très précis et fiables car la machine doit définir et étiqueter les données d'entrée avant de déterminer les modèles et fonctions cachés.

Quelle est la similitude entre l'apprentissage automatique supervisé et non supervisé ?

L'apprentissage supervisé et non supervisé sont des types d'apprentissage automatique

Quelle est la différence entre l'apprentissage automatique supervisé et non supervisé ?

Apprentissage automatique supervisé vs non supervisé

L'apprentissage supervisé est la tâche d'apprentissage automatique consistant à apprendre une fonction qui mappe une entrée à une sortie en fonction d'exemples de paires entrée-sortie. L'apprentissage non supervisé est la tâche d'apprentissage automatique consistant à déduire une fonction pour décrire une structure cachée à partir de données non étiquetées.
Fonctionnalité principale
Dans l'apprentissage supervisé, le modèle prédit le résultat en fonction des données d'entrée étiquetées. Dans l'apprentissage non supervisé, le modèle prédit le résultat sans données étiquetées en identifiant les modèles par lui-même.
Exactitude des résultats
Les résultats générés par les méthodes d'apprentissage supervisé sont plus précis et fiables. Les résultats générés par les méthodes d'apprentissage non supervisées ne sont pas très précis et fiables.
Algorithmes principaux
Il existe des algorithmes de régression et de classification dans l'apprentissage supervisé. Il existe des algorithmes de clustering dans l'apprentissage non supervisé.

Résumé – Machine Learning supervisé vs non supervisé

L'apprentissage supervisé et l'apprentissage non supervisé sont deux types d'apprentissage automatique. L'apprentissage supervisé est la tâche d'apprentissage automatique consistant à apprendre une fonction qui mappe une entrée à une sortie en fonction d'exemples de paires entrée-sortie. L'apprentissage non supervisé est la tâche d'apprentissage automatique consistant à déduire une fonction pour décrire une structure cachée à partir de données non étiquetées. La différence entre l'apprentissage automatique supervisé et non supervisé est que l'apprentissage supervisé utilise des données étiquetées tandis que l'apprentissage non supervisé utilise des données non étiquetées.

Conseillé: