Processus d'analyse prédictive dans Business Analytics avec R

Le blog donne une brève idée du processus d'analyse prédictive dans Business Analytics avec R



Processus de modélisation typique:

Dans un processus de modélisation typique, il est important de commencer à dessiner une hypothèse. Un RFP (Request for Proposal) est reçu, puis une hypothèse est établie.



conversion double en int en java
  1. Déterminer la bonne source de données - Ici, le client peut donner une source de données, sinon, nous devons chercher une source de données. Dans un scénario, où nous essayons d'évaluer qui gagnerait l'élection, une analyse publique des données est effectuée avec des sources qui incluent les médias sociaux, les chaînes d'information ou l'opinion publique. Nous devons également comprendre la quantité de données nécessaires pour analyser le problème. Dans ce cas, nous recherchons généralement de grands échantillons, car il s'agit d'un cas d'élection. En revanche, si l'analyse est faite sur la santé, il est difficile de se tourner vers une population importante car il y a une possibilité de ne pas avoir assez de personnes pour valider l'hypothèse. De plus, la qualité des données est très importante.
  2. Extraire les données - Par exemple, si nous prenons un échantillon de population, nous pouvons examiner des attributs, tels que revenu élevé, faible revenu, âge, population active (hors site / sur site), résidents, NRI, couverture des hôpitaux, etc., pour lancer l'étude . Ici, nous n'avons peut-être pas besoin d'autant d'attributs pour l'hypothèse. Nous comprenons que des attributs, comme un revenu élevé ou faible, peuvent ne pas être les facteurs qui contribuent à déterminer qui remportera les élections. Mais l'âge peut faire une différence car il donnera un décompte direct du nombre de personnes qui voteront. Plusieurs fois, nous pouvons exclure des attributs moins utilisés ou inclure des attributs utiles. Cela pourrait mal tourner dans les deux cas. C'est la raison pour laquelle l'analyse est un défi.
  3. Massez les données pour s'adapter à l'outil - En effet, tous les outils ne peuvent pas accepter toutes les données. Certains outils n'acceptent que les données CSV ou les données Excel. Le manque d'outils est un défi.
  4. Exécutez l'analyse - Cette opération peut être réalisée à l'aide de nombreuses techniques d'analyse.
  5. Conclure - L'analyse donne des chiffres pour être précis. Mais c'est à un utilisateur de tirer des conclusions de ces chiffres. Par exemple, s'il dit 10% ou 20%, nous devons comprendre ce que cela signifie? Dérive-t-il une corrélation entre l'attribut A et l'attribut B?
  6. Mettre en œuvre les résultats - Il est important de mettre en œuvre des conclusions pour voir des résultats dans les affaires. Par exemple, on peut conclure que «Les gens achètent un parapluie pendant la saison des pluies» ce qui peut entraîner davantage d’affaires. Ici, nous devons mettre en œuvre la conclusion où nous fabriquons des parapluies, disponibles dans les magasins, mais cela peut avoir des problèmes de gestion. Au moment où les statistiques donnent le résultat, la mise en œuvre peut mal tourner.
  7. Surveiller les progrès - Dernière étape ici, la surveillance joue un rôle important. Le suivi peut mal tourner car peu d’organisations souhaitent suivre les progrès et il est considéré comme une étape négligeable. Mais la surveillance est importante car nous pouvons comprendre si nos recherches et nos conclusions vont dans la bonne direction.

Consultez également cet article' La corrélation ne signifie pas la causalité 'qui donne un aperçu de la façon dont les analystes peuvent se tromper. Un point important à noter dans ce graphique est que l'analyse en cours est la seule étape où la machine est responsable et au-delà, c'est à un être humain qui déterminera en fin de compte comment la recherche est effectuée.

Vous avez une question pour nous? Mentionnez-les dans la section commentaires et nous vous recontacterons.



qu'est-ce que indexof en javascript

Articles Similaires: