Qu'est-ce qu'un réseau neuronal? Introduction aux réseaux de neurones artificiels

Ce blog sur ce qu'est un réseau de neurones vous présentera les concepts de base des réseaux de neurones et comment ils peuvent résoudre des problèmes complexes liés aux données.

Avec l'avancement de l'apprentissage automatique, a pris une grande route. Le Deep Learning est considéré comme la technologie la plus avancée conçue pour résoudre des problèmes complexes qui utilisent des ensembles de données massifs. Ce blog sur ce qu'est un réseau de neurones vous présentera les concepts de base des réseaux de neurones et comment ils peuvent résoudre des problèmes complexes liés aux données.



Pour acquérir une connaissance approfondie de l'intelligence artificielle et du Deep Learning, vous pouvez vous inscrire en direct par Edureka avec une assistance 24/7 et un accès à vie.



trouver le plus grand nombre dans un tableau

Voici une liste de sujets qui seront traités dans ce Blog:

  1. Qu'est-ce qu'un réseau neuronal?
  2. Qu'est-ce que le Deep Learning?
  3. Différence entre AI, ML et DL
  4. Besoin d'apprentissage en profondeur
  5. Cas d'utilisation du Deep Learning
  6. Comment fonctionnent les réseaux de neurones?
  7. Réseau neuronal expliqué avec l'exemple

Définition simple d'un réseau neuronal

Modélisé selon le cerveau humain, un Neural Network a été conçu pour imiter la fonctionnalité d'un cerveau humain . Le cerveau humain est un réseau neuronal composé de plusieurs neurones, de même, un réseau neuronal artificiel (ANN) est composé de plusieurs perceptrons (expliqué plus tard).



Réseau de neurones - Qu

Un réseau de neurones se compose de trois couches importantes:

  • Couche d'entrée: Comme son nom l'indique, cette couche accepte toutes les entrées fournies par le programmeur.
  • Couche cachée: Entre la couche d'entrée et la couche de sortie se trouve un ensemble de couches appelées couches cachées. Dans cette couche, des calculs sont effectués qui aboutissent à la sortie.
  • Couche de sortie: Les entrées passent par une série de transformations via la couche cachée qui aboutit finalement à la sortie qui est délivrée via ce couche.

Avant d'entrer dans les détails du fonctionnement d'un réseau de neurones, comprenons ce qu'est le Deep Learning.



Qu'est-ce que le Deep Learning?

Le Deep Learning est un domaine avancé de l'apprentissage automatique qui utilise les concepts de réseaux de neurones pour résoudre des cas d'utilisation hautement informatiques qui impliquent l'analyse de données multidimensionnelles. Il automatise le processus d'extraction des fonctionnalités, garantissant qu'une intervention humaine très minimale est nécessaire.

Alors, qu'est-ce que le Deep Learning exactement?

Le Deep Learning est un sous-domaine de l'apprentissage automatique qui utilise des algorithmes inspirés de la structure et de la fonction du cerveau appelés réseaux de neurones artificiels.

Différence entre AI, ML et DL (Intelligence Artificielle vs Machine Learning vs Deep Learning)

Les gens ont souvent tendance à penser que , , et L'apprentissage en profondeur sont les mêmes car ils ont des applications communes. Par exemple, Siri est une application d'IA, d'apprentissage automatique et d'apprentissage en profondeur.

Alors, comment ces technologies sont-elles liées?

  • Intelligence artificielle est la science qui consiste à amener les machines à imiter le comportement des humains.
  • Apprentissage automatique est un sous-ensemble de l'intelligence artificielle (IA) qui vise à amener les machines à prendre des décisions en leur fournissant des données.
  • L'apprentissage en profondeur est un sous-ensemble du Machine Learning qui utilise le concept de réseaux de neurones pour résoudre des problèmes complexes.

Pour résumer, l'IA, le Machine Learning et le Deep Learning sont des domaines interconnectés. L'apprentissage automatique et l'apprentissage en profondeur aident l'intelligence artificielle en fournissant un ensemble d'algorithmes et de réseaux de neurones à résoudre problèmes liés aux données.

Maintenant que vous êtes familiarisé avec les bases, comprenons ce qui a conduit à la nécessité du Deep Learning.

Besoin d'apprentissage en profondeur: limites des algorithmes et techniques traditionnels d'apprentissage automatique

L'apprentissage automatique a été une percée majeure dans le monde technique, il a conduit à l'automatisation de tâches monotones et chronophages, il a aidé à résoudre des problèmes complexes et à prendre des décisions plus intelligentes. Cependant, il y avait quelques inconvénients dans le Machine Learning qui ont conduit à l'émergence du Deep Learning.

Voici quelques limitations du Machine Learning:

  1. Impossible de traiter les données de grande dimension: L'apprentissage automatique ne peut traiter que de petites dimensions de données contenant un petit ensemble de variables. Si vous souhaitez analyser des données contenant des centaines de variables, le Machine Learning ne peut pas être utilisé.
  2. L'ingénierie des fonctionnalités est manuelle: Prenons un cas d'utilisation où vous avez 100 variables prédictives et vous devez limiter uniquement les variables significatives. Pour ce faire, vous devez étudier manuellement la relation entre chacune des variables et déterminer celles qui sont importantes pour prédire la sortie. Cette tâche est extrêmement fastidieuse et prend du temps pour un développeur.
  3. Pas idéal pour effectuer la détection d'objets et le traitement d'image: La détection d'objets nécessitant des données de grande dimension, le Machine Learning ne peut pas être utilisé pour traiter des ensembles de données d'image, il n'est idéal que pour les ensembles de données avec un nombre limité de fonctionnalités.

Avant d'entrer dans les profondeurs de Réseaux de neurones, considérons un cas d’utilisation concret où le Deep Learning est mis en œuvre.

Cas d'utilisation / applications du Deep Learning

Saviez-vous que PayPal traite plus de 235 milliards de dollars de paiements provenant de quatre milliards de transactions effectuées par ses plus de 170 millions de clients? Il utilise cette vaste quantité de données pour identifier d'éventuelles activités frauduleuses, entre autres raisons.

À l’aide d’algorithmes de Deep Learning, PayPal a extrait les données de l’historique des achats de ses clients en plus d’examiner les schémas de fraude probable stockés dans ses bases de données pour prédire si une transaction particulière est frauduleuse ou non.

La société s'appuie sur la technologie Deep Learning & Machine Learning depuis environ 10 ans. Au départ, l'équipe de surveillance de la fraude a utilisé des modèles simples et linéaires. Mais au fil des ans, l'entreprise est passée à une technologie d'apprentissage automatique plus avancée appelée Deep Learning.

Le responsable des risques de fraude et Data Scientist chez PayPal, Ke Wang, a déclaré:

«Ce que nous apprécions d'un apprentissage automatique plus moderne et avancé, c'est sa capacité à consommer beaucoup plus de données, à gérer des couches et des couches d'abstraction et à pouvoir« voir »des choses qu'une technologie plus simple ne pourrait pas voir, même les êtres humains pourraient ne pas pouvoir voir. '

Un modèle linéaire simple est capable de consommer une vingtaine de variables. Cependant, avec la technologie Deep Learning, on peut exécuter des milliers de points de données. Par conséquent, en mettant en œuvre Technologie Deep Learning, PayPal peut enfin analyser des millions de transactions pour identifier toute fraude activité.

Voyons maintenant dans les profondeurs d'un réseau neuronal et comprenons comment ils fonctionnent.

Comment fonctionne un réseau neuronal?

Pour comprendre les réseaux de neurones, nous devons les décomposer et comprendre l'unité la plus basique d'un réseau de neurones, à savoir un Perceptron.

Qu'est-ce qu'un perceptron?

Un Perceptron est un réseau neuronal à couche unique utilisé pour classer les données linéaires. Il comporte 4 éléments importants:

  1. Contributions
  2. Poids et biais
  3. Fonction de sommation
  4. Fonction d'activation ou de transformation

La logique de base derrière un Perceptron est la suivante:

Les entrées (x) reçues de la couche d'entrée sont multipliées par leurs poids attribués w. Les valeurs multipliées sont ensuite ajoutées pour former la somme pondérée. La somme pondérée des entrées et leurs poids respectifs sont ensuite appliqués à une fonction d'activation correspondante. La fonction d'activation mappe l'entrée à la sortie respective.

Poids et biais dans l'apprentissage profond

Pourquoi devons-nous attribuer des pondérations à chaque entrée?

Une fois qu'une variable d'entrée est transmise au réseau, une valeur choisie au hasard est affectée comme poids de cette entrée. Le poids de chaque point de données d'entrée indique l'importance de cette entrée dans la prédiction du résultat.

Le paramètre de polarisation, par contre, vous permet d'ajuster la courbe de fonction d'activation de manière à obtenir une sortie précise.

Fonction de sommation

Une fois que les entrées reçoivent un poids, le produit de l'entrée et du poids respectifs est pris. L'ajout de tous ces produits nous donne la somme pondérée. Ceci est fait par la fonction de sommation.

Fonction d'activation

L'objectif principal des fonctions d'activation est de mapper la somme pondérée à la sortie. Les fonctions d'activation telles que tanh, ReLU, sigmoïde, etc. sont des exemples de fonctions de transformation.

Pour en savoir plus sur les fonctions des Perceptrons, vous pouvez parcourir ce Blog.

Avant nous Pour conclure ce blog, prenons un exemple simple pour comprendre le fonctionnement d’un réseau neuronal.

Les réseaux de neurones expliqués avec un exemple

Considérez un scénario dans lequel vous devez créer un réseau neuronal artificiel (ANN) qui classe les images en deux classes:

comment utiliser les packages en java
  • Classe A: contenant des images de feuilles non malades
  • Classe B: contenant des images de feuilles malades

Alors, comment créer un réseau neuronal qui classe les feuilles en cultures malades et non malades?

Le processus commence toujours par le traitement et la transformation de l'entrée de manière à ce qu'elle puisse être facilement traitée. Dans notre cas, chaque image de feuille sera décomposée en pixels en fonction de la dimension de l'image.

Par exemple, si l'image est composée de 30 sur 30 pixels, le nombre total de pixels sera de 900. Ces pixels sont représentés sous forme de matrices, qui sont ensuite introduites dans la couche d'entrée du réseau neuronal.

Tout comme nos cerveaux ont des neurones qui aident à construire et à connecter les pensées, un ANN a des perceptrons qui acceptent les entrées et les traitent en les passant de la couche d'entrée à la couche cachée et enfin à la couche de sortie.

Lorsque l'entrée est transmise de la couche d'entrée à la couche masquée, un poids aléatoire initial est attribué à chaque entrée. Les entrées sont ensuite multipliées par leurs poids correspondants et leur somme est envoyée comme entrée à la couche cachée suivante.

Ici, une valeur numérique appelée biais est attribuée à chaque perceptron, qui est associée à la pondération de chaque entrée. En outre, chaque perceptron passe par une activation ou une fonction de transformation qui détermine si un perceptron particulier est activé ou non.

Un perceptron activé est utilisé pour transmettre des données à la couche suivante. De cette manière, les données sont propagées (propagation vers l'avant) à travers le réseau neuronal jusqu'à ce que les perceptrons atteignent la couche de sortie.

Au niveau de la couche de sortie, une probabilité est dérivée qui décide si les données appartiennent à la classe A ou à la classe B.

Cela semble simple, non? Eh bien, le concept derrière les réseaux de neurones est purement basé sur le fonctionnement du cerveau humain. Vous avez besoin d'une connaissance approfondie de divers concepts et algorithmes mathématiques. Voici une liste de blogs pour vous aider à démarrer:

  1. Qu'est-ce que le Deep Learning? Premiers pas avec le Deep Learning
  2. Deep Learning avec Python: Guide du débutant sur le Deep Learning

Si vous avez trouvé ce blog pertinent, consultez le par Edureka, une entreprise d'apprentissage en ligne de confiance avec un réseau de plus de 250 000 apprenants satisfaits répartis dans le monde entier. Le cours de formation Edureka Deep Learning avec certification TensorFlow aide les apprenants à devenir des experts dans la formation et l'optimisation des réseaux de neurones de base et convolutifs à l'aide de projets et d'affectations en temps réel ainsi que de concepts tels que la fonction SoftMax, les réseaux de neurones à encodeur automatique, la machine Boltzmann restreinte (RBM).