Quelles sont les conditions préalables à l'apprentissage automatique?

Ce blog sur les conditions préalables à l'apprentissage automatique vous aidera à comprendre les concepts de base que vous devez connaître avant de vous lancer dans l'apprentissage automatique.

L'apprentissage automatique est sans aucun doute la technologie la plus demandée de l'époque! Si vous êtes un débutant qui commence avec le Machine Learning, il est important que vous connaissiez les prérequis pour le Machine Learning. Ce blog vous aidera à comprendre les différents concepts que vous devez connaître avant de vous lancer dans le Machine Learning.



Pour acquérir une connaissance approfondie de l'intelligence artificielle et de l'apprentissage automatique, vous pouvez vous inscrire en direct par Edureka avec une assistance 24/7 et un accès à vie.



Voici une liste de sujets couvert dans ce blog:

  1. Prérequis pour l'apprentissage automatique
  2. Comprendre l'apprentissage automatique avec un cas d'utilisation

Prérequis pour l'apprentissage automatique

Pour commencer avecMachine Learning, vous devez être familiarisé avec les concepts suivants:



  1. Statistiques
  2. Algèbre linéaire
  3. Calcul
  4. Probabilité
  5. Langages de programmation

Statistiques

Les statistiques contiennent des outils qui peuvent être utilisés pour obtenir des résultats à partir des données. Il existe des statistiques descriptives qui sont utilisées pour transformer les données brutes en certaines informations importantes. En outre, les statistiques inférentielles peuvent être utilisées pour obtenir des informations importantes à partir d'un échantillon de données au lieu d'utiliser un ensemble de données complet.

En apprendre davantage sur Statistiques, vous pouvez consulter les blogs suivants:

comment utiliser le tri en c ++

Algèbre linéaire

Offres d'algèbre linéaireavec des vecteurs, des matrices et des transformations linéaires. Il est très important dans l'apprentissage automatique car il peut être utilisé pour transformer et effectuer des opérations sur l'ensemble de données.



Calcul

Le calcul est un domaine important en mathématiques et il joue un rôle essentiel dans de nombreux algorithmes d'apprentissage automatique. L'ensemble de données ayant plusieurs fonctionnalités estutilisé pour créer des modèles d'apprentissage automatique, car les fonctionnalités sont multiples, le calcul multivariable joue un rôle important dans la création d'un modèle d'apprentissage automatique. Les intégrations et les différences sont indispensables.

Probabilité

La probabilité aide à prédire la probabilité des événements, elle nous aide à raisonner que la situation peut ou non se reproduire. Pour l'apprentissage automatique, la probabilité est un fondation.

Mathematics

Pour en savoir plus sur la probabilité, vous pouvez passer par ceci Blog.

Langage de programmation

Il est essentiel de connaître les langages de programmation comme R et Python afin de mettre en œuvre l'ensemble du processus d'apprentissage automatique. Python et R fournissent tous deux des bibliothèques intégrées qui facilitent la mise en œuvre d'algorithmes d'apprentissage automatique.

En plus d'avoir des connaissances de base en programmation, il est également important que vous sachiez comment extraire, traiter et analyser les données. C'est l'une des compétences les plus importantes nécessaires pour l'apprentissage automatique.

Pour en savoir plus sur la programmation langues pour le Machine Learning, vous pouvez consulter les blogs suivants:

  1. Les meilleures bibliothèques Python pour la science des données et l'apprentissage automatique

Cas d'utilisation de l'apprentissage automatique

L'apprentissage automatique consiste à créer un algorithme qui peut apprendre à partir des données pour faire une prédiction, comme les types d'objets présents dans l'image, ou le moteur de recommandation, la meilleure combinaison de médicaments pour guérir certaines maladies ou le filtrage du spam.

L'apprentissage automatique est basé sur des prérequis mathématiques et si vous savez pourquoi les mathématiques sont utilisées dans l'apprentissage automatique, cela le rendra amusant. Vous devez connaître les mathématiques derrière les fonctions que vous allez utiliser, quel modèle convient aux données et pourquoi.

Commençons donc par un problème intéressant de prédiction des prix des logements, ayant un ensemble de données contenant un historique des différentes caractéristiques et prix, pour l'instant, nous allons considérer la superficie de la surface habitable en pieds carrés et les prix.

Nous avons maintenant un ensemble de données contenant deux colonnes, comme indiqué ci-dessous:

Il doit y avoir une certaine corrélation entre ces deux variables pour savoir que nous devrons construire un modèle qui peut prédire le prix des maisons, comment pouvons-nous le faire?

Représentons graphiquement ces données et voyons à quoi elles ressemblent:

Ici, l'axe X est le prix par pied carré de surface habitable et l'axe Y est le prix de la maison. Si nous traçons tous les points de données, nous obtiendrons un nuage de points qui peut être représenté par une ligne comme indiqué dans la figure ci-dessus et si nous entrons des données, il prédira alors un résultat. Idéalement, nous devons trouver une ligne qui coupera le maximum de points de données.

Ici, nous essayons de créer une ligne appelée:

Y = mX + c

Cette méthode de prédiction de la relation linéaire entre la cible (variable dépendante) et la variable prédictive (variable indépendante) est appelée régression linéaire. Il permet d'étudier et de résumer une relation entre deux variables.

  • X = variable indépendante
  • Y = variable dépendante
  • c = ordonnée à l'origine
  • m = pente de la ligne

Si nous considérons l'équation, nous avons des valeurs pour X qui est une variable indépendante, donc tout ce que nous avons à faire est de calculer les valeurs de m et c afin de prédire la valeur de Y.

Alors, comment trouver ces variables?

Afin de trouver ces variables, nous pouvons essayer un tas de valeurs et essayer de trouver une ligne qui coupe le nombre maximum de points de données. Mais comment trouver la meilleure ligne de coupe?

Ainsi, afin de trouver la ligne la mieux ajustée, nous pouvons utiliser la fonction d'erreur des moindres carrés qui trouvera l'erreur entre la valeur réelle de y et la valeur prédite y`.

La fonction d'erreur des moindres carrés peut être représentée à l'aide de l'équation suivante:

En utilisant cette fonction, nous pouvons trouver l'erreur pour chaque point de données prédit en la comparant à la valeur réelle du point de données. Vous prenez ensuite la somme de toutes ces erreurs et les mettez au carré pour trouver l'écart dans la prédiction.

Si nous ajoutons le troisième axe à notre graphique contenant toutes les valeurs d'erreur possibles et le traçons dans un espace en 3 dimensions, cela ressemblera à ceci:

lesquels des énoncés suivants sont des exemples d'instructions de contrôle?

Dans l'image ci-dessus, les valeurs idéales seraient dans la partie inférieure noire qui prédira les prix proches du point de données réel. L'étape suivante consiste à trouver les meilleures valeurs possibles pour m et c. Cela peut être fait en utilisant la technique d'optimisation appelée descente de gradient.

La descente de gradient est une méthode itérative, dans laquelle nous commençons par initialiser un ensemble de valeurs pour nos variables et les améliorons lentement en minimisant l'erreur entre la valeur réelle et la valeur prédite.

Maintenant, si nous pensons que pratiquement les prix de l'appartement ne dépendent pas vraiment du prix au mètre carré, il existe de nombreux facteurs tels que le nombre de chambres, de salles de bains, etc. Si nous considérons également ces caractéristiques, l'équation aura l'air quelque chose comme ça

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

C'est une régression multilinéaire qui appartient à l'algèbre linéaire, ici nous pouvons utiliser des matrices de taille mxn où m sont des entités et n sont des points de données.

Prenons une autre situation où nous pouvons utiliser la probabilité pour trouver l’état de la maison afin de classer une maison selon qu’elle est en bon ou en mauvais état. Pour cela, pour travailler nous devrons utiliser une technique appelée régression logistique qui travaille sur la probabilité d'occurrences représentée par une fonction sigmoïde.

Dans cet article, nous avons couvert les prérequis de l'apprentissage automatique et leur application dans l'apprentissage automatique. Donc, fondamentalement, il se compose de statistiques, de calcul, d'algèbre linéaire et de théorie des probabilités. Le calcul utilise des techniques d'optimisation, l'algèbre linéaire a des algorithmes qui peuvent fonctionner sur d'énormes ensembles de données, avec une probabilité que nous puissions prédire la probabilité d'occurrences et les statistiques nous aident à déduire des informations utiles à partir de l'échantillon d'ensembles de données.

Maintenant que vous connaissez les conditions préalables à l'apprentissage automatique, je suis sûr que vous êtes curieux d'en savoir plus. Voici quelques blogs qui vous aideront à démarrer avec la science des données:

Si vous souhaitez vous inscrire à un cours complet sur l'intelligence artificielle et l'apprentissage automatique, Edureka a un Cela vous permettra de maîtriser des techniques telles que l'apprentissage supervisé, l'apprentissage non supervisé et le traitement du langage naturel. Il comprend une formation sur les dernières avancées et approches techniques de l'intelligence artificielle et de l'apprentissage automatique telles que l'apprentissage en profondeur, les modèles graphiques et l'apprentissage par renforcement.