Pourquoi devriez-vous fusionner lorsque vous pouvez déjà rejoindre Tableau?

Fusion de données dans Tableau - une méthode utilisée lorsqu'il existe des données associées dans plusieurs sources de données, que vous souhaitez analyser ensemble dans une seule vue.

Dans un monde qui génère et consomme 2,5 quintillions d'octets de données par jour, les organisations sont tenues de rechercher de nouvelles méthodes pour transformer et combiner les données afin d'atteindre une efficacité optimale. Une de ces méthodes de combinaison de données est Fusion de données dans Tableau .



trouver le plus grand nombre dans un tableau java

Maintenant, parce que cela sert un objectif si important dans le cycle de données d'une organisation donnée, cela en fait un module très essentiel dans la plupart . Dans ce blog, nous discuterons des concepts suivants:



Pourquoi avez-vous besoin de Data Blending dans Tableau?

Supposons que vous soyez un Tableau Developer qui a des données transactionnelles stockées dans Salesforce et des données de quota stockées dans Access. Les données que vous souhaitez combiner sont stockées dans différentes bases de données et la granularité des données capturées dans chaque table est différente dans les deux sources de données. La fusion des données est donc le meilleur moyen de combiner ces données.

La fusion des données est utile dans les conditions suivantes:



  1. Vous souhaitez combiner des données de différentes bases de données qui ne sont pas prises en charge par les jointures entre bases de données.

    Les jointures entre bases de données ne prennent pas en charge les connexions aux cubes (par exemple, Oracle Essbase) ou à certaines connexions d'extraction uniquement (par exemple, Google Analytics). Dans ce cas, configurez des sources de données individuelles pour les données que vous souhaitez analyser, puis utilisez la fusion de données pour combiner les sources de données sur une seule feuille.

  2. Les données sont à différents niveaux de détail.

    Parfois, un ensemble de données capture des données à l'aide de niveaux de détail c'est-à-dire une granularité plus ou moins grande que l'autre ensemble de données.

    Par exemple, supposons que vous analysiez des données transactionnelles et des données de quota. Les données transactionnelles peuvent capturer toutes les transactions. Cependant, les données sur les quotas peuvent regrouper les transactions au niveau du trimestre. Étant donné que les valeurs transactionnelles sont capturées à différents niveaux de détail dans chaque ensemble de données, vous devez utiliser la fusion de données pour combiner les données.



Qu'est-ce que la fusion de données dans Tableau?

La fusion de données est une fonctionnalité très puissante Tableau . Il est utilisé lorsqu'il existe des données associées dans plusieurs sources de données, que vous souhaitez analyser ensemble dans une seule vue. Il s'agit d'une méthode de combinaison de données qui complète une table de données d'une source de données avec des colonnes de données d'une autre source de données.

Habituellement, vous utilisez des jointures pour effectuer ce type de combinaison de données, mais il arrive parfois, en fonction de facteurs tels que le type de données et leur granularité, qu'il soit préférable d'utiliser la fusion de données.

comment utiliser le package en java

En quoi est-ce différent de la jonction de données?

Le mélange de données simule une jointure gauche traditionnelle. La principale différence entre les deux est quand la jointure est effectuée par rapport à l'agrégation.

Joint gauche

Lorsque vous utilisez une jointure gauche pour combiner des données, une requête est envoyée à la base de données où la jointure est effectuée. L'utilisation d'une jointure à gauche renvoie toutes les lignes de la table de gauche et toutes les lignes de la table de droite qui ont une correspondance de ligne correspondante dans la table de gauche. Les résultats de la jointure sont ensuite renvoyés et agrégés par Tableau.

Par exemple, supposons que vous ayez les tableaux suivants. Si les colonnes communes sont Identifiant d'utilisateur , une jointure à gauche prend toutes les données de la table de gauche, ainsi que toutes les données de la table de droite car chaque ligne a une correspondance de ligne correspondante dans la table de gauche.

Jonction de données - Fusion de données dans Tableau - EdurekaFusion de données

Lorsque vous utilisez la fusion de données pour combiner des données, une requête est envoyée à la base de données pour chaque source de données utilisée sur la feuille. Les résultats des requêtes, y compris les données agrégées, sont renvoyés et combinés par Tableau. La vue utilise toutes les lignes de la source de données principale, la table de gauche et les lignes agrégées de la source de données secondaire, la table de droite, en fonction de la dimension des champs de liaison.

Vous pouvez modifier le champ de liaison ou ajouter d'autres champs de liaison pour inclure des lignes de données différentes ou supplémentaires de la source de données secondaire dans le mélange, en modifiant les valeurs agrégées.

Par exemple, supposons que vous ayez les tableaux suivants. Si les champs de liaison sont Identifiant d'utilisateur dans les deux tableaux, le mélange de vos données prend toutes les données du tableau de gauche et complète le tableau de gauche avec les données du tableau de droite. Dans ce cas, toutes les valeurs ne peuvent pas faire partie de la table résultante pour les raisons suivantes:

  • Une ligne dans le tableau de gauche n'a pas de correspondance de ligne correspondante dans le tableau de droite, comme indiqué par la valeur nulle.
  • Il existe plusieurs valeurs correspondantes dans les lignes du tableau de droite, comme indiqué par l'astérisque (*).

Supposons que vous ayez les mêmes tables que ci-dessus, mais que la source de données secondaire contienne un nouveau champ appelé Finalités . Encore une fois, si le champ de liaison est Identifiant d'utilisateur , la fusion de vos données prend toutes les données du tableau de gauche et les complète avec les données du tableau de droite. Dans ce cas, vous voyez la même valeur nulle et les mêmes astérisques dans l'exemple précédent en plus de ce qui suit:

  • Parce que le Finalités est une mesure, vous voyez les valeurs de ligne pour leFinalitéschamp agrégé avant que les données du tableau de droite ne soient combinées avec les données du tableau de gauche.
  • Comme dans l'exemple précédent, une ligne du tableau de gauche n'a pas la ligne correspondante pour le Finalités champ, comme indiqué par la deuxième valeur nulle.

Quand remplacer l'adhésion pour Mélange

1. Les données doivent être nettoyées.

Si vos tables ne correspondent pas correctement après une jointure, configurez des sources de données pour chaque table, effectuez les personnalisations nécessaires (c'est-à-dire renommez les colonnes, modifiez les types de données de colonne, créez des groupes, utilisez des calculs, etc.), et puis utilisez la fusion des données pour combiner les données.

allez trier c ++

2. Les jointures provoquent des données en double.

La duplication de données après une jointure est un symptôme de données à différents niveaux de détail. Si vous remarquez des données en double, au lieu de créer une jointure, utilisez plutôt la fusion de données pour fusionner sur une dimension commune.

3. Vous avez beaucoup de données.

En général, les jointures sont recommandées pour combiner les données de la même base de données. Les jointures sont gérées par la base de données, ce qui permet aux jointures de tirer parti de certaines des fonctionnalités natives de la base de données. Cependant, si vous travaillez avec de grands ensembles de données, les jointures peuvent mettre la base de données à rude épreuve et affecter considérablement les performances. Dans ce cas, la fusion des données peut aider. Étant donné que Tableau gère la combinaison des données une fois les données agrégées, il y a moins de données à combiner. Lorsqu'il y a moins de données à combiner, les performances s'améliorent généralement.

Fusion de vos données dans Tableau

Vous pouvez utiliser la fusion de données lorsque vous avez des données dans des sources de données distinctes que vous souhaitez analyser ensemble sur une seule feuille. Tableau a deux sources de données intégrées nommées Échantillon-supermarché et Échantillon de chaîne de café.mdb qui sera utilisé pour illustrer le mélange de données.

Étape 1: connectez-vous à vos données et configurez les sources de données

  • Connectez-vous à un ensemble de données et configurez la source de données sur la page de la source de données. Un jesource de données nbuilt Échantillon de chaîne de café.mdb ,qui est un fichier de base de données MS Access, sera utilisé pour illustrer le mélange de données.
  • Aller à Les données > Nouvelle source de données, connectez-vous au deuxième ensemble de données.Cet exemple utilise le Échantillon - Supermarché la source de données. Then mis en place la source de données.
  • Cliquez sur l'onglet de la feuille pour commencer à créer votre vue.

Étape 2: Désignez une source de données principale

  • Faites glisser au moins un champ de votre source de données principale dans la vue pour le désigner comme source de données principale. dans le Les données volet, cliquez sur la source de données que vous souhaitez désigner comme source de données principale. Dans cet exemple, Échantillon de chaîne de café est sélectionné.
  • La capture d'écran suivante montre les différentes tables et jointures disponibles dans le fichier.

Étape 3: Désignez une source de données secondaire

  • Les champs utilisés dans la vue à partir de sources de données qui ne sont pas la source de données principale ou les liens actifs désignent automatiquement les sources de données suivantes comme source de données secondaire. Dans ce cas, Sample Superstore.

Étape 4: fusion des données

  • Vous pouvez désormais intégrer les données des deux sources en fonction d'une dimension commune ( Etat , dans ce cas). Notez qu'une petite image de lien apparaît à côté de la dimension - État. Cela indique la dimension commune entre les deux sources de données.
  • Supposons que vous créez un graphique à barres avec Ratio de profit dans l'étagère à colonnes et Etat dans le Row Shelf, le graphique montre comment le ratio de profit varie pour chaque état dans les supermarchés et les chaînes de cafés.

Limitations de la fusion de données dans Tableau

  1. Il existe certaines limitations de mélange de données autour des agrégats non additifs, tels que MÉDIAN , et RAWSQLAGG .
  2. Le mélange de données compromet la vitesse de requête avec une granularité élevée.
  3. Lorsque vous essayez de trier par un champ calculé qui utilise des données combinées, le champ calculé n'est pas répertorié dans la liste déroulante Champ de la boîte de dialogue Trier.
  4. Les sources de données de cube ne peuvent être utilisées que comme source de données principale pour la fusion des données dans Tableau. Ils ne peuvent pas être utilisés comme sources de données secondaires.

J'espère que vous avez tous, maintenant, une bonne idée de Fusion de données dans Tableau de ce blog. Envie de plus de connaissances? Ne vous inquiétez pas, cette vidéo vous permettra de mieux comprendre le concept.