Comment les expressions LOD fonctionnent-elles dans Tableau?

Les expressions Tableau LOD représentent un moyen élégant et puissant de répondre à des questions impliquant plusieurs niveaux de granularité dans une seule visualisation.

Le but de tout outil BI est de donner L'analyse des données un meilleur flux. Si l'on, en tant que professionnel, fait face à la difficulté d'utiliser l'outil tout en résolvant un problème, l'état du flux est rompu. Une cause fréquente de ce problème est la nécessité de travailler avec des données qui ont été agrégées à différents Niveau de détail dans Tableau (LOD) .



Tableau placé au sommet de la pile pour la 6e fois consécutive, dans le Magic Quadrant de Gartner, en dit clairement quelque chose sur sa demande sur le marché. C'est probablement le meilleur moment pour .



Ce blog vous aidera à comprendre les expressions LOD et abordera les sujets suivants:



Tableau LOD: Pourquoi avez-vous besoin de LOD?

Il y a souvent des questions que l'on est obligé de rencontrer lors de l'analyse des données. Ces questions sont souvent simples à poser, mais difficiles à répondre. Ils ressemblent souvent à quelque chose comme:

Questions in Tableau - Tableau LOD - EdurekaPour répondre à ces types de questions, une nouvelle syntaxe a été introduite, appelée Niveau de détail dans Tableau 9.0. Cette nouvelle syntaxe a à la fois simplifié et étendu le langage de calcul de Tableau en permettant de répondre directement à ces questions.

Tableau LOD: Qu'est-ce que LOD?

Les expressions LOD représentent un moyen élégant et puissant de répondre à des questions impliquant plusieurs niveaux de granularité dans une seule visualisation.



Le niveau de détail dans les expressions Tableau ou LOD vous permet de calculer des valeurs au niveau de la source de données et au niveau de la visualisation. Cependant, les expressions LOD vous donnent encore plus de contrôle sur le niveau de granularité que vous souhaitez calculer. Ils peuvent être exécutés à un plus granulaire niveau (INCLUDE Calculation), un moins granulaire niveau (EXCLUDE Calculation), ou un tout à fait indépendant doux l (Calcul FIXE).

Tableau LOD: Expressions de niveau de ligne et de niveau de vue

Niveau de ligne

Dans Tableau, les expressions référençant non agrégé les colonnes de source de données sont calculées pour chaque ligne de la table sous-jacente. Dans ce cas, la dimensionnalité de l'expression est niveau de ligne . Voici un exemple d'expression au niveau de la ligne:

[Ventes] / [Bénéfice]

Ce calcul sera évalué dans chaque ligne de la base de données. La valeur Sales de chaque ligne sera divisée par la valeur Profit de cette ligne, produisant une nouvelle colonne avec le résultat de la multiplication (un ratio de profit).

Si vous créez un calcul avec cette définition, enregistrez-le sous le nom [ProfitRatio], puis faites-le glisser du Volet de données sur une étagère, Tableau doit généralement agréger le champ calculé pour la vue:

SUM [ProfitRatio]

Afficher le niveau

En revanche, les expressions référençant agrégé les colonnes de source de données sont calculées à la dimensionnalité définie par les dimensions de la vue. Dans ce cas, la dimensionnalité de l'expression est au niveau de la vue. Voici un exemple d'expression au niveau de la vue:

cast double en int java

SUM (Ventes) / SUM (Profit)

Si vous faites glisser ce calcul sur une étagère (ou que vous le saisissez directement sur une étagère en tant que calcul ad-hoc), Tableau le place dans un Fonction AGG :

AGG (SUM (Ventes) / SUM (Profit))

C'est ce qu'on appelle un Calcul agrégé .

Tableau LOD: Agrégation et expressions LOD

L'expression LOD est plus grossière que le niveau de détail de la vue

Une expression a un niveau de détail plus grossier que la vue lorsqu'elle fait référence à un sous-ensemble des dimensions dans la vue.

Par exemple, pour une vue contenant les dimensions [Catégorie] et [Segment], vous pouvez créer un niveau de détail dans Tableau qui n'utilise qu'une seule de ces dimensions:

{FIXED [Segment]: SUM ([Sales])}

Dans ce cas, l'expression a un niveau de détail plus grossier que la vue. Il fonde ses valeurs sur une dimension ([Segment]), alors que la vue base sa vue sur deux dimensions ([Segment] et [Catégorie]).

Le résultat est que l'utilisation de l'expression de niveau de détail dans la vue entraîne la réplication de certaines valeurs, c'est-à-dire apparaître plusieurs fois .

L'expression LOD est plus fine que le niveau de détail de la vue

Une expression a un niveau de détail plus fin que la vue lorsqu'elle fait référence à un sur-ensemble des dimensions dans la vue.

transformation xml dans informatica avec exemple

Lorsque vous utilisez une telle expression dans la vue, Tableau agrégera les résultats jusqu'au niveau de la vue. Par exemple, le niveau de détail suivant dans Tableau fait référence à deux dimensions:

{FIXED [Segment], [Category]: SUM ([Sales])}

Lorsque cette expression est utilisée dans une vue qui n'a que [Segment] comme niveau de détail, les valeurs doit être agrégé . Voici ce que vous verriez si vous faisiez glisser cette expression sur une étagère:

AVG ([{FIXED [Segment]], [Category]]: SUM ([Sales]])}])

Une agrégation (dans ce cas, la moyenne) est automatiquement attribuée par Tableau. Vous pouvez modifier l'agrégation selon vos besoins.

Ajout d'une expression LOD à la vue

Le fait qu'un niveau de détail dans une expression Tableau soit agrégé ou répliqué dans la vue est déterminé par le type d'expression et granularité .

  • Les expressions INCLUDE auront soit le même niveau de détail que la vue, soit un niveau de détail plus fin que la vue. Par conséquent, les valeurs ne seront jamais répliquées.
  • Les expressions FIXED peuvent avoir un niveau de détail plus fin que la vue, un niveau de détail plus grossier ou le même niveau de détail. La nécessité d'agréger les résultats d'un niveau de détail FIXE dépend des dimensions de la vue.
  • Les expressions EXCLUDE font toujours apparaître des valeurs répliquées dans la vue. Lorsque des calculs incluant des expressions de niveau de détail EXCLUDE sont placés sur une étagère, Tableau utilise par défaut Agrégation ATTR par opposition à SUM ou AVG, pour indiquer que l'expression n'est pas réellement agrégée et que la modification de l'agrégation n'aura aucun effet sur la vue.

Les expressions de niveau de détail sont toujours automatiquement regroupées lorsqu'elles sont ajoutées à une étagère de la vue, à moins qu'elles ne soient utilisées comme dimensions.

Tableau LOD: Filtres et expressions LOD

L'image ici représente leordre d'exécution des filtres de haut en bas.Le texte de droite montre où les expressions LOD sont évaluées dans cette séquence.

Les filtres d'extraction (en orange) ne sont pertinents que si vous créez un extrait Tableau à partir d'une source de données. Les filtres de calculs de table (bleu foncé) sont appliqués après l'exécution des calculs et masquent donc les marques sans filtrer les données sous-jacentes utilisées dans les calculs.

Les calculs FIXED sont appliqués avant les filtres de dimension. Par conséquent, à moins que vous ne promouviez les champs de votre étagère Filtre pour améliorer les performances de la vue avec des filtres contextuels, ils seront ignorés.

Tableau LOD: Types d'expressions LOD

INCLURE le calcul

INCLUDE calcule les valeurs en utilisant les dimensions spécifiées en plus des dimensions de la vue. Cette expression de niveau de détail est particulièrement utile lors de l’inclusion d’une dimension qui n’est pas dans la vue.

Par exemple: {INCLUDE [Nom du client]: SUM ([Ventes])}

EXCLURE le calcul

EXCLUDE supprime explicitement les dimensions de l'expression, c'est-à-dire qu'elles soustraient les dimensions du niveau de détail de la vue. Ce niveau de détail dans Tableau est le plus utile pour éliminer une dimension dans la vue.

Par exemple: {EXCLUDE [Région]: SUM ([Ventes])}

Calcul FIXE

FIXED calcule les valeurs à l'aide des dimensions spécifiées sans référence au niveau de détail de la vue, c'est-à-dire sans référence aux autres dimensions de la vue. Cette expression de niveau de détail ignore également tous les filtres de la vue autres que les filtres de contexte, les filtres de source de données et les filtres d'extraction.

Par exemple: {FIXED [Région]: SOMME ([Ventes])}

Tableau LOD: Création d'expressions LOD

Syntaxe d'une expression LOD

Une expression de niveau de détail a la structure suivante:

COMPRENDRE

Étape 1: configurer la visualisation

  1. Ouvrez Tableau Desktop et connectez-vous au Échantillon-Supermarché source de données enregistrée.
  2. Accédez à une nouvelle feuille de calcul.
  3. Du Les données volet, sous Dimensions, faites glisser Région à la Colonnes Étagère.
  4. Du Les données volet, sous Mesures, faites glisser Ventes à la Lignes Étagère. Un graphique à barres montrant la somme des ventes pour chaque région apparaît.

Étape 2: créer l'expression LOD

Au lieu de la somme de toutes les ventes par région, vous souhaitez peut-être également voir les ventes moyennes par client pour chaque région. Vous pouvez utiliser une expression LOD pour ce faire.

  1. Sélectionner Une analyse > Créer un champ calculé.
  2. Dans l'éditeur de calcul qui s'ouvre, procédez comme suit:
    • Nommez le calcul, Ventes par client.
    • Entrez l'expression LOD suivante:

      {INCLUDE [Nom du client]: SUM ([Ventes])}

  3. Lorsque vous avez terminé, cliquez sur D'accord. L'expression LOD nouvellement créée est ajoutée au volet Données, sous Mesures.

Étape 3: utiliser l'expression LOD dans la visualisation

  1. Du Les données volet, sous Mesures, faites glisser Ventes par client à la Lignes étagère et placez-la à gauche de SUM (Sales).
  2. Sur l'étagère Lignes, cliquez avec le bouton droit de la souris Ventes par client et sélectionnez Mesure (somme) > Moyenne. Vous pouvez maintenant voir à la fois la somme de toutes les ventes et les ventes moyennes par client pour chaque région. Par exemple, vous pouvez voir que dans la région Centre, les ventes totalisent environ 500 000 USD avec une vente moyenne pour chaque client d'environ 800 USD .

Tableau LOD: Sources de données prenant en charge les expressions LOD

La source de données Pris en charge / non pris en charge
Actian VectorwiseNon supporté.
Amazon EMR Hadoop HivePrise en charge de Hive 0.13 et suivantes.
Amazon RedshiftPrise en charge.
Base de données AsterPrise en charge de la version 4.5 et suivantes.
Cloudera HadoopPrise en charge de Hive 0.13 et suivantes.
Cloudera ImpalaPrise en charge d'Impala 1.2.2 et suivantes.
Cubes (sources de données multidimensionnelles)Non supporté.
DataStax EntrepriseNon supporté.
EXASOLPrise en charge.
Oiseau de feuPrise en charge de la version 2.0 et suivantes.
ODBC génériqueLimité. Dépend de la source de données.
Google Big QueryPris en charge pour SQL standard, pas hérité.
IBM DB2À partir de la version 8.1 prise en charge.
MarkLogicÀ partir de la version 7.0 prise en charge.
SAP HANAPrise en charge.
SAP Sybase ASEPrise en charge.
SAP Sybase IQVersion prise en charge 15.1 et suivantes.
Spark SQLPrise en charge.
SplunkNon supporté.
Tableau Data ExtractPrise en charge.
TeradataPrise en charge.
VerticaÀ partir de la version 6.1 prise en charge.
Microsoft AccessNon supporté.
Connexions basées sur Microsoft JetNon supporté.
Ruche Hortonworks HadoopPrise en charge de Hive 0.13 et suivantes.

pouvez-vous étendre et implémenter en java

Dans la version 1.1 de HIVE, les expressions LOD qui produisent des jointures croisées ne sont pas fiables.

IBM BigInsightsPrise en charge.
Microsoft SQL ServerPrise en charge de SQL Server 2005 et des versions ultérieures.
MySQLPrise en charge.
IBM PDA (Netezza)À partir de la version 7.0 prise en charge.
OraclePrise en charge de la version 9i.
Matrice des acteurs (ParAccel)À partir de la version 3.1 prise en charge.
Pivotal GreenplumÀ partir de la version 3.1 prise en charge.
PostgreSQLÀ partir de la version 7.0 prise en charge.
Progression OpenEdgePrise en charge.

Tableau LOD: Calculs de table vs LOD

Les expressions LOD ne sont pas une nouvelle forme de calcul de table. Bien qu'ils puissent remplacer de nombreux calculs de table, leur objectif principal est d'ouvrir de nouvelles possibilités.Les expressions LOD et les calculs de table fonctionnent différemment.

Calculs de table Expressions LOD
Les calculs de table sont générés par Résultats de la requête .Les expressions LOD sont générées dans le cadre de la requête vers le source de données sous-jacente . Ils sont donc exprimés sous forme de sélection imbriquée, en fonction des performances du SGBD.
Les calculs de table peuvent ne produisent que des résultats égaux ou moins granulaires que ledit LOD.LOD peut produire des résultats indépendant dudit LOD .
Les dimensions qui contrôlent les opérations d'un tableau sont distinctes de la syntaxe de calcul.Les dimensions qui contrôlent les opérations d'une expression LOD sont intégré dans l'expression lui-même.
Les calculs de table sont utilisés comme mesures agrégées .Les expressions LOD peuvent être utilisées dans d'autres constructions.
Les filtres sur les calculs de table agissent comme un CACHER .Les filtres sur le LOD agissent comme un EXCLURE .

Tableau LOD: Limitations de LOD

Voici les contraintes qui s'appliquent aux expressions LOD.

  • Les expressions LOD qui font référence à des mesures à virgule flottante ont tendance à se comporter de manière non fiable lorsqu'elles sont utilisées dans une vue qui nécessite une comparaison des valeurs de l'expression.
  • Le niveau de détail n'est pas affiché sur la page Source de données.
  • Lors du référencement d'un paramètre dans une déclaration de dimensionnalité, utilisez toujours le nom du paramètre, et non la valeur du paramètre.
  • Avec la fusion de données, le champ de liaison de la source de données principale doit être dans la vue avant de pouvoir utiliser une expression de niveau de détail de la source de données secondaire.

De plus, certaines sources de données ont des limites de complexité. Tableau ne désactivera pas les calculs pour ces bases de données, mais des erreurs de requête sont possibles si les calculs deviennent trop complexes.