Apprentissage supervisé dans Apache Mahout

L'apprentissage supervisé est une technique d'apprentissage automatique, dans laquelle une fonction est déduite des exemples étiquetés de données d'apprentissage.

L'apprentissage supervisé est le procédé, dans lequel les données d'entraînement comprennent à la fois l'entrée et les résultats souhaités. La formation du système avec des exemples est appelée apprentissage supervisé. Ou bien, l'entraînement à l'algorithme avec un enseignant peut également être traité comme un apprentissage supervisé. Après avoir entraîné l'algorithme avec toutes les données d'échantillon ou des données étiquetées, qui ont les deux prédicteurs sur la variable cible, on peut entraîner l'algorithme et utiliser l'exemple invisible pour une classification ultérieure.





tutoriel servicenow pour les débutants pdf

Voici quelques-unes des caractéristiques importantes de l'apprentissage supervisé dans Mahout:

  • La construction d'un ensemble approprié de formation, de validation et de test (Bok) est cruciale.
  • Ces méthodes sont généralement rapides et précises.
  • Les méthodes d'apprentissage supervisé doivent pouvoir se généraliser.
  • Ils donnent des résultats corrects, lorsque de nouvelles données sont données en entrée sans connaître una prioricible.
  • Dans certains cas, les bons résultats (cibles) sont connus et donnés en entrée au modèle pendant le processus d'apprentissage.

Exemple d'apprentissage supervisé

Dans le cas où vous souhaitez former une mission et que vous recevez deux groupes d'images différents avec les données étiquetées, par exemple. dans l'image ci-dessus, un groupe a les images d'un éléphant et l'autre a celles d'un lion. Les données étiquetées impliquent que chaque ensemble de données ait une valeur cible. Dans l'exemple ci-dessus, l'ensemble de données est constitué d'images d'éléphant, tandis que l'étiquette qui lui est donnée, c'est-à-dire «Éléphant», est la valeur cible de l'ensemble de données. Un tel ensemble de données étiqueté est utilisé pour le processus d'apprentissage, de sorte que l'algorithme d'apprentissage peut tirer parti de cet ensemble de données et créer un modèle, qui peut être utilisé pour classer les exemples invisibles sans les données étiquetées ou la variable cible.



Identifions les caractéristiques qui aident à identifier un objet comme un éléphant ou un lion:

Les caractéristiques pourrait être - taille, couleur, hauteur, taille de l'oreille, tronc, défense

Cela peut être appelé un ensemble de fonctionnalités, qui sera utilisé à des fins de formation. Cet ensemble de fonctionnalités aura un impact sur la variable cible finale. Ces variables sont appelées variables prédictives , car ils nous aident à déterminer le variable cible finale . La dernière variable peut également être appelée une étiquette. La variable finale voici Elephant / Lion.



table-word

Dans cet exemple, chacun des enregistrements des catégories, taille, couleur, hauteur, taille de l'oreille, tronc et défense est une variable prédictive, tandis que Éléphant et Lion sont les variables cibles. Ces variables peuvent être traitées respectivement comme des exemples d'entraînement et des ensembles de données d'entraînement.

Ainsi, l'apprentissage supervisé est un moyen par lequel vous vous entraînez avec les étiquettes, dans lequel vous demandez à l'algorithme d'en extraire certaines fonctionnalités, et sur cette base, chaque fois que vous voyez un exemple invisible, l'algorithme pourra le classer. dans la bonne classe.

Vous avez une question pour nous? Mentionnez-les dans la section commentaires et nous vous recontacterons.

Articles Similaires: