Le but de tout outil BI est de donner L'analyse des données un meilleur flux. Si l'on, en tant que professionnel, fait face à la difficulté d'utiliser l'outil tout en résolvant un problème, l'état du flux est rompu. Une cause fréquente de ce problème est la nécessité de travailler avec des données qui ont été agrégées à différents Niveau de détail dans Tableau (LOD) .
Tableau placé au sommet de la pile pour la 6e fois consécutive, dans le Magic Quadrant de Gartner, en dit clairement quelque chose sur sa demande sur le marché. C'est probablement le meilleur moment pour .
Ce blog vous aidera à comprendre les expressions LOD et abordera les sujets suivants:
- Pourquoi avez-vous besoin d'un niveau de détail dans Tableau?
- Qu'est-ce que le niveau de détail dans Tableau?
- Expressions de niveau de ligne et de niveau de vue
- Types d'expressions LOD
- Agrégation et expressions LOD
- Filtres et expressions LOD
- Création d'expressions LOD
- Sources de données prenant en charge le niveau de détail dans Tableau
- Calculs de table et niveau de détail dans Tableau
- Limitations du niveau de détail dans Tableau
Tableau LOD: Pourquoi avez-vous besoin de LOD?
Il y a souvent des questions que l'on est obligé de rencontrer lors de l'analyse des données. Ces questions sont souvent simples à poser, mais difficiles à répondre. Ils ressemblent souvent à quelque chose comme:
Pour répondre à ces types de questions, une nouvelle syntaxe a été introduite, appelée Niveau de détail dans Tableau 9.0. Cette nouvelle syntaxe a à la fois simplifié et étendu le langage de calcul de Tableau en permettant de répondre directement à ces questions.
Tableau LOD: Qu'est-ce que LOD?
Les expressions LOD représentent un moyen élégant et puissant de répondre à des questions impliquant plusieurs niveaux de granularité dans une seule visualisation.
Le niveau de détail dans les expressions Tableau ou LOD vous permet de calculer des valeurs au niveau de la source de données et au niveau de la visualisation. Cependant, les expressions LOD vous donnent encore plus de contrôle sur le niveau de granularité que vous souhaitez calculer. Ils peuvent être exécutés à un plus granulaire niveau (INCLUDE Calculation), un moins granulaire niveau (EXCLUDE Calculation), ou un tout à fait indépendant doux l (Calcul FIXE).
Tableau LOD: Expressions de niveau de ligne et de niveau de vue
Niveau de ligne
Dans Tableau, les expressions référençant non agrégé les colonnes de source de données sont calculées pour chaque ligne de la table sous-jacente. Dans ce cas, la dimensionnalité de l'expression est niveau de ligne . Voici un exemple d'expression au niveau de la ligne:
[Ventes] / [Bénéfice]
Ce calcul sera évalué dans chaque ligne de la base de données. La valeur Sales de chaque ligne sera divisée par la valeur Profit de cette ligne, produisant une nouvelle colonne avec le résultat de la multiplication (un ratio de profit).
Si vous créez un calcul avec cette définition, enregistrez-le sous le nom [ProfitRatio], puis faites-le glisser du Volet de données sur une étagère, Tableau doit généralement agréger le champ calculé pour la vue:
SUM [ProfitRatio]
Afficher le niveau
En revanche, les expressions référençant agrégé les colonnes de source de données sont calculées à la dimensionnalité définie par les dimensions de la vue. Dans ce cas, la dimensionnalité de l'expression est au niveau de la vue. Voici un exemple d'expression au niveau de la vue:
cast double en int java
SUM (Ventes) / SUM (Profit)
Si vous faites glisser ce calcul sur une étagère (ou que vous le saisissez directement sur une étagère en tant que calcul ad-hoc), Tableau le place dans un Fonction AGG :
AGG (SUM (Ventes) / SUM (Profit))
C'est ce qu'on appelle un Calcul agrégé .
Tableau LOD: Agrégation et expressions LOD
L'expression LOD est plus grossière que le niveau de détail de la vue
Une expression a un niveau de détail plus grossier que la vue lorsqu'elle fait référence à un sous-ensemble des dimensions dans la vue.
Par exemple, pour une vue contenant les dimensions [Catégorie] et [Segment], vous pouvez créer un niveau de détail dans Tableau qui n'utilise qu'une seule de ces dimensions:
{FIXED [Segment]: SUM ([Sales])}
Dans ce cas, l'expression a un niveau de détail plus grossier que la vue. Il fonde ses valeurs sur une dimension ([Segment]), alors que la vue base sa vue sur deux dimensions ([Segment] et [Catégorie]).
Le résultat est que l'utilisation de l'expression de niveau de détail dans la vue entraîne la réplication de certaines valeurs, c'est-à-dire apparaître plusieurs fois .
L'expression LOD est plus fine que le niveau de détail de la vue
Une expression a un niveau de détail plus fin que la vue lorsqu'elle fait référence à un sur-ensemble des dimensions dans la vue.
transformation xml dans informatica avec exemple
Lorsque vous utilisez une telle expression dans la vue, Tableau agrégera les résultats jusqu'au niveau de la vue. Par exemple, le niveau de détail suivant dans Tableau fait référence à deux dimensions:
{FIXED [Segment], [Category]: SUM ([Sales])}
Lorsque cette expression est utilisée dans une vue qui n'a que [Segment] comme niveau de détail, les valeurs doit être agrégé . Voici ce que vous verriez si vous faisiez glisser cette expression sur une étagère:
AVG ([{FIXED [Segment]], [Category]]: SUM ([Sales]])}])
Une agrégation (dans ce cas, la moyenne) est automatiquement attribuée par Tableau. Vous pouvez modifier l'agrégation selon vos besoins.
Ajout d'une expression LOD à la vue
Le fait qu'un niveau de détail dans une expression Tableau soit agrégé ou répliqué dans la vue est déterminé par le type d'expression et granularité .
- Les expressions INCLUDE auront soit le même niveau de détail que la vue, soit un niveau de détail plus fin que la vue. Par conséquent, les valeurs ne seront jamais répliquées.
- Les expressions FIXED peuvent avoir un niveau de détail plus fin que la vue, un niveau de détail plus grossier ou le même niveau de détail. La nécessité d'agréger les résultats d'un niveau de détail FIXE dépend des dimensions de la vue.
- Les expressions EXCLUDE font toujours apparaître des valeurs répliquées dans la vue. Lorsque des calculs incluant des expressions de niveau de détail EXCLUDE sont placés sur une étagère, Tableau utilise par défaut Agrégation ATTR par opposition à SUM ou AVG, pour indiquer que l'expression n'est pas réellement agrégée et que la modification de l'agrégation n'aura aucun effet sur la vue.
Les expressions de niveau de détail sont toujours automatiquement regroupées lorsqu'elles sont ajoutées à une étagère de la vue, à moins qu'elles ne soient utilisées comme dimensions.
Tableau LOD: Filtres et expressions LOD
L'image ici représente leordre d'exécution des filtres de haut en bas.Le texte de droite montre où les expressions LOD sont évaluées dans cette séquence.
Les filtres d'extraction (en orange) ne sont pertinents que si vous créez un extrait Tableau à partir d'une source de données. Les filtres de calculs de table (bleu foncé) sont appliqués après l'exécution des calculs et masquent donc les marques sans filtrer les données sous-jacentes utilisées dans les calculs.
Les calculs FIXED sont appliqués avant les filtres de dimension. Par conséquent, à moins que vous ne promouviez les champs de votre étagère Filtre pour améliorer les performances de la vue avec des filtres contextuels, ils seront ignorés.
Tableau LOD: Types d'expressions LOD
INCLURE le calcul
INCLUDE calcule les valeurs en utilisant les dimensions spécifiées en plus des dimensions de la vue. Cette expression de niveau de détail est particulièrement utile lors de l’inclusion d’une dimension qui n’est pas dans la vue.
Par exemple: {INCLUDE [Nom du client]: SUM ([Ventes])}
EXCLURE le calcul
EXCLUDE supprime explicitement les dimensions de l'expression, c'est-à-dire qu'elles soustraient les dimensions du niveau de détail de la vue. Ce niveau de détail dans Tableau est le plus utile pour éliminer une dimension dans la vue.
Par exemple: {EXCLUDE [Région]: SUM ([Ventes])}
Calcul FIXE
FIXED calcule les valeurs à l'aide des dimensions spécifiées sans référence au niveau de détail de la vue, c'est-à-dire sans référence aux autres dimensions de la vue. Cette expression de niveau de détail ignore également tous les filtres de la vue autres que les filtres de contexte, les filtres de source de données et les filtres d'extraction.
Par exemple: {FIXED [Région]: SOMME ([Ventes])}
Tableau LOD: Création d'expressions LOD
Syntaxe d'une expression LOD
Une expression de niveau de détail a la structure suivante:
COMPRENDRE
Étape 1: configurer la visualisation
- Ouvrez Tableau Desktop et connectez-vous au Échantillon-Supermarché source de données enregistrée.
- Accédez à une nouvelle feuille de calcul.
- Du Les données volet, sous Dimensions, faites glisser Région à la Colonnes Étagère.
- Du Les données volet, sous Mesures, faites glisser Ventes à la Lignes Étagère. Un graphique à barres montrant la somme des ventes pour chaque région apparaît.
Étape 2: créer l'expression LOD
Au lieu de la somme de toutes les ventes par région, vous souhaitez peut-être également voir les ventes moyennes par client pour chaque région. Vous pouvez utiliser une expression LOD pour ce faire.
- Sélectionner Une analyse > Créer un champ calculé.
- Dans l'éditeur de calcul qui s'ouvre, procédez comme suit:
- Nommez le calcul, Ventes par client.
- Entrez l'expression LOD suivante:
{INCLUDE [Nom du client]: SUM ([Ventes])}
- Lorsque vous avez terminé, cliquez sur D'accord. L'expression LOD nouvellement créée est ajoutée au volet Données, sous Mesures.
Étape 3: utiliser l'expression LOD dans la visualisation
- Du Les données volet, sous Mesures, faites glisser Ventes par client à la Lignes étagère et placez-la à gauche de SUM (Sales).
- Sur l'étagère Lignes, cliquez avec le bouton droit de la souris Ventes par client et sélectionnez Mesure (somme) > Moyenne. Vous pouvez maintenant voir à la fois la somme de toutes les ventes et les ventes moyennes par client pour chaque région. Par exemple, vous pouvez voir que dans la région Centre, les ventes totalisent environ 500 000 USD avec une vente moyenne pour chaque client d'environ 800 USD .
Tableau LOD: Sources de données prenant en charge les expressions LOD
La source de données | Pris en charge / non pris en charge |
Actian Vectorwise | Non supporté. |
Amazon EMR Hadoop Hive | Prise en charge de Hive 0.13 et suivantes. |
Amazon Redshift | Prise en charge. |
Base de données Aster | Prise en charge de la version 4.5 et suivantes. |
Cloudera Hadoop | Prise en charge de Hive 0.13 et suivantes. |
Cloudera Impala | Prise en charge d'Impala 1.2.2 et suivantes. |
Cubes (sources de données multidimensionnelles) | Non supporté. |
DataStax Entreprise | Non supporté. |
EXASOL | Prise en charge. |
Oiseau de feu | Prise en charge de la version 2.0 et suivantes. |
ODBC générique | Limité. Dépend de la source de données. |
Google Big Query | Pris en charge pour SQL standard, pas hérité. |
IBM DB2 | À partir de la version 8.1 prise en charge. |
MarkLogic | À partir de la version 7.0 prise en charge. |
SAP HANA | Prise en charge. |
SAP Sybase ASE | Prise en charge. |
SAP Sybase IQ | Version prise en charge 15.1 et suivantes. |
Spark SQL | Prise en charge. |
Splunk | Non supporté. |
Tableau Data Extract | Prise en charge. |
Teradata | Prise en charge. |
Vertica | À partir de la version 6.1 prise en charge. |
Microsoft Access | Non supporté. |
Connexions basées sur Microsoft Jet | Non supporté. |
Ruche Hortonworks Hadoop | Prise en charge de Hive 0.13 et suivantes.pouvez-vous étendre et implémenter en java Dans la version 1.1 de HIVE, les expressions LOD qui produisent des jointures croisées ne sont pas fiables. |
IBM BigInsights | Prise en charge. |
Microsoft SQL Server | Prise en charge de SQL Server 2005 et des versions ultérieures. |
MySQL | Prise en charge. |
IBM PDA (Netezza) | À partir de la version 7.0 prise en charge. |
Oracle | Prise en charge de la version 9i. |
Matrice des acteurs (ParAccel) | À partir de la version 3.1 prise en charge. |
Pivotal Greenplum | À partir de la version 3.1 prise en charge. |
PostgreSQL | À partir de la version 7.0 prise en charge. |
Progression OpenEdge | Prise en charge. |
Tableau LOD: Calculs de table vs LOD
Les expressions LOD ne sont pas une nouvelle forme de calcul de table. Bien qu'ils puissent remplacer de nombreux calculs de table, leur objectif principal est d'ouvrir de nouvelles possibilités.Les expressions LOD et les calculs de table fonctionnent différemment.
Calculs de table | Expressions LOD |
Les calculs de table sont générés par Résultats de la requête . | Les expressions LOD sont générées dans le cadre de la requête vers le source de données sous-jacente . Ils sont donc exprimés sous forme de sélection imbriquée, en fonction des performances du SGBD. |
Les calculs de table peuvent ne produisent que des résultats égaux ou moins granulaires que ledit LOD. | LOD peut produire des résultats indépendant dudit LOD . |
Les dimensions qui contrôlent les opérations d'un tableau sont distinctes de la syntaxe de calcul. | Les dimensions qui contrôlent les opérations d'une expression LOD sont intégré dans l'expression lui-même. |
Les calculs de table sont utilisés comme mesures agrégées . | Les expressions LOD peuvent être utilisées dans d'autres constructions. |
Les filtres sur les calculs de table agissent comme un CACHER . | Les filtres sur le LOD agissent comme un EXCLURE . |
Tableau LOD: Limitations de LOD
Voici les contraintes qui s'appliquent aux expressions LOD.
- Les expressions LOD qui font référence à des mesures à virgule flottante ont tendance à se comporter de manière non fiable lorsqu'elles sont utilisées dans une vue qui nécessite une comparaison des valeurs de l'expression.
- Le niveau de détail n'est pas affiché sur la page Source de données.
- Lors du référencement d'un paramètre dans une déclaration de dimensionnalité, utilisez toujours le nom du paramètre, et non la valeur du paramètre.
- Avec la fusion de données, le champ de liaison de la source de données principale doit être dans la vue avant de pouvoir utiliser une expression de niveau de détail de la source de données secondaire.
De plus, certaines sources de données ont des limites de complexité. Tableau ne désactivera pas les calculs pour ces bases de données, mais des erreurs de requête sont possibles si les calculs deviennent trop complexes.