Tutoriel Python Seaborn: Qu'est-ce que Seaborn et comment l'utiliser?



Tutoriel Python Seaborn sur la différence entre seaborn et matplotlib. Découvrez également les différentes fonctions et personnalisations disponibles dans seaborn.

Python est un entrepôt de nombreuses bibliothèques et frameworks extrêmement puissants. Parmi eux, est Seaborn, qui est un dominant visualisation de données bibliothèque, donnant une autre raison aux programmeurs de terminer . Dans ce didacticiel Python Seaborn, vous apprendrez tous les talents de la visualisation de données à l'aide de Seaborn.

Avant de poursuivre, parcourons tous les sujets de discussion de cet article:





Commençons donc par expliquer l’importance de Python Seaborn.

Pourquoi utiliser Python Seaborn?

Comme mentionné précédemment, la bibliothèque Python Seaborn est utilisée pour faciliter la tâche difficile de visualisation des données et elle est basée sur . Seaborn permet la création de graphiques statistiques à travers les fonctionnalités suivantes:



  • Une API basée sur des ensembles de données permettant la comparaison entre plusieurs variables

  • Prend en charge les grilles multi-tracés qui à leur tour facilitent la création de visualisations complexes

  • Visualisations univariées et bivariées disponibles pour comparer entre des sous-ensembles de données



  • Disponibilité de différentes palettes de couleurs pour révéler différents types de motifs

  • Estimations et graphiques automatiquement

Donc, si vous vous demandez pourquoi utiliser Seaborn alors que vous avez déjà Matplotlib, voici la réponse.

Python Seaborn vs Matplotlib:

«Si Matplotlib« essaie de rendre les choses faciles faciles et les choses difficiles possibles », seaborn essaie de rendre aussi facile un ensemble bien défini de choses difficiles» - Michael Waskom (créateur de Seaborn).
En fait, Matplotlib est bon mais Seaborn est meilleur. Il y a essentiellement deux lacunes de Matplotlib que Seaborn corrige:

  1. Matplotlib peut être personnalisé, mais il est difficile de déterminer les paramètres nécessaires pour rendre les tracés plus attrayants. D'autre part, Seaborn est livré avec de nombreux thèmes personnalisés et des interfaces de haut niveau pour résoudre ce problème.

  2. Lorsque vous travaillez avec Pandas , Matplotlib ne sert pas bien lorsqu'il s'agit de traiter les DataFrames, alors que les fonctions Seaborn fonctionnent en fait sur les DataFrames.

Comment installer Seaborn?

Pour installer la bibliothèque Python Seaborn, vous pouvez utiliser les commandes suivantes en fonction de la plate-forme que vous utilisez:

pip installer seaborn

ou

conda installer seaborn

Une fois que cela est installé, assurez-vous simplement d'installer les packages et les bibliothèques dont seaborn dépend.

Installation des dépendances Python Seaborn:

Les dépendances obligatoires pour seaborn sont:

Il existe également une dépendance recommandée qui est:

  • modèles d'état

Pour installer ces bibliothèques, vous pouvez utiliser les mêmes commandes que celles indiquées précédemment pour Seaborn avec leurs noms respectifs. Une fois installés, ils peuvent être importés facilement. Seaborn vous permet de charger n'importe quel jeu de données depuis en utilisant le load_dataset () fonction. Vous pouvez également afficher tous les ensembles de données disponibles en utilisant la fonction get_dataset_names () comme suit:

EXEMPLE:

importer seaborn en tant que sns sns.get_dataset_names ()

Cela renverra une liste de tous les ensembles de données disponibles.
Maintenant que vous avez configuré votre environnement pour travailler avec seaborn, passons à autre chose pour découvrir comment utiliser ses fonctions de traçage dans .

Fonctions de traçage Seaborn

Visualiser les relations statistiques:

Le processus de compréhension des relations entre les variables d'un ensemble de données et la manière dont ces relations dépendent à leur tour d'autres variables est appelé analyse statistique. Examinons maintenant plus en détail les fonctions nécessaires à cette fin:

relplot():

Il s'agit d'une fonction au niveau de la figure qui utilise deux autres fonctions d'axes pour visualiser les relations statistiques, à savoir:

  • nuage de points ()
  • graphique linéaire()

Ces fonctions peuvent être spécifiées en utilisant le paramètre ‘kind’ de relplot (). Dans le cas où ce paramètre est donné, il prend le paramètre par défaut qui est scatterplot (). Avant de commencer à écrire votre code, assurez-vous d'importer les bibliothèques requises comme suit:

print_r en chaîne
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns sns.set (style = 'darkgrid')

Veuillez noter que l'attribut style est également personnalisable et peut prendre n'importe quelle valeur telle que darkgrid, ticks, etc. dont je parlerai plus tard dans la section intrigue-esthétique. Prenons maintenant un petit exemple:

EXEMPLE:

f = sns.load_dataset ('vols') sns.relplot (x = 'passagers', y = 'mois', data = f)

PRODUCTION:

Vols1-Tutoriel Python Seaborn-Edureka

Comme vous pouvez le voir, les points sont tracés en 2 dimensions. Cependant, vous pouvez ajouter une autre dimension en utilisant la sémantique «hue». Prenons un exemple de la même chose:

EXEMPLE:

f = sns.load_dataset ('vols') sns.relplot (x = 'passagers', y = 'mois', hue = 'année', data = f)

Vous verrez la sortie suivante:

PRODUCTION:

Cependant, il existe de nombreuses autres personnalisations que vous pouvez essayer telles que les couleurs, les styles, la taille, etc. Laissez-moi simplement vous montrer comment vous pouvez changer la couleur dans l'exemple suivant:

EXEMPLE:

sns.set (style = 'darkgrid') f = sns.load_dataset ('Flights') sns.relplot (x = 'passagers', y = 'month', hue = 'year', palette = 'ch: r = - .5, l = .75 ', données = f)

PRODUCTION:

graphique linéaire():

Cette fonction vous permettra de tracer une ligne continue pour vos données. Vous pouvez utiliser cette fonction en modifiant le paramètre «kind» comme suit:

EXEMPLE:

a = pd.DataFrame ({'Jour': [1,2,3,4,5,6,7], 'Épicerie': [30,80,45,23,51,46,76], 'Vêtements' : [13,40,34,23,54,67,98], 'Ustensiles': [12,32,27,56,87,54,34]}, index = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Day', y = 'Clothes', kind = 'line', data = a) g.fig.autofmt_xdate ()

PRODUCTION:

La valeur par défaut pour le lineplot est y en fonction de x. Cependant, il peut être modifié si vous le souhaitez. Il existe de nombreuses autres options que vous pouvez essayer davantage.

Voyons maintenant comment tracer des données catégorielles.

Tracé avec des données catégorielles:

Cette approche entre en jeu lorsque notre variable principale est ensuite divisée en groupes discrets (catégoriques). Ceci peut être réalisé en utilisant la fonction catplot ().

catplot ():

C'est une fonction au niveau de la figure comme relplot (). Il peut être caractérisé par trois familles de fonctions au niveau des axes à savoir:

  1. Scatterplots - Ceux-ci incluent stripplot (), swarmplot ()

  2. Diagrammes de distribution - qui sont boxplot (), violinplot (), boxenplot ()

  3. Estimateplots - à savoir pointplot (), barplot (), countplot ()

Prenons maintenant quelques exemples pour illustrer ceci:

EXEMPLE:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', données = a)

PRODUCTION:

Comme vous pouvez le voir, dans l'exemple ci-dessus, je n'ai pas défini le paramètre «kind». Par conséquent, il a renvoyé le graphique comme nuage de points par défaut. Vous pouvez spécifier l'une des fonctions de niveau des axes pour modifier le graphique selon les besoins. Prenons également un exemple de ceci:

EXEMPLE:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', kind = 'violon', data = a)

PRODUCTION:

La sortie ci-dessus montre le violinplot pour l'ensemble de données de conseils. Essayons maintenant de trouver comment visualiser la distribution d'un jeu de données.

Visualiser la distribution d'un jeu de données:

Cela concerne essentiellement la compréhension des ensembles de données avec un contexte pour être univarié ou bivarié. Avant de commencer, importez simplement les éléments suivants:

import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from scipy import stats sns.set (color_codes = True)

Une fois cela fait, vous pouvez continuer à tracer des distributions univariées et bivariées.

Tracer des distributions univariées:

Pour les tracer, vous pouvez utiliser la fonction distplot () comme suit:

EXEMPLE:

a = np.random.normal (loc = 5, taille = 100, échelle = 2) sns.distplot (a)

PRODUCTION:

Comme vous pouvez le voir dans l'exemple ci-dessus, nous avons tracé un graphique pour la variable a dont les valeurs sont générées par la fonction normal () en utilisant distplot.

Tracer des distributions bivariées:

Cela entre en jeu lorsque vous avez deux variables indépendantes aléatoires résultant en un événement probable. La meilleure fonction pour tracer ce type de graphes est jointplot (). Tracons maintenant un graphe bivarié en utilisant jointplot ().

EXEMPLE:

x = pd.DataFrame ({'Jour': [1,2,3,4,5,6,7], 'Épicerie': [30,80,45,23,51,46,76], 'Vêtements' : [13,40,34,23,54,67,98], 'Ustensiles': [12,32,27,56,87,54,34]}, index = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Jour': [8,9,10,11,12,13,14], 'Épicerie': [30,80,45,23,51,46, 76], 'Vêtements': [13,40,34,23,54,67,98], 'Ustensiles': [12,32,27,56,87,54,34]}, index = [8,9 , 10,11,12,13,14]) moyenne, cov = [0, 1], [(1, .5), (.5, 1)] données = np.random.multivariate_normal (moyenne, cov, 200 ) avec sns.axes_style ('white'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

PRODUCTION:

Maintenant que vous avez compris les différentes fonctions de Python Seaborn, passons à la création de grilles structurées multi-tracés.

Grilles multi-parcelles:

Python Seaborn vous permet de tracer plusieurs grilles côte à côte. Ce sont essentiellement des tracés ou des graphiques qui sont tracés en utilisant la même échelle et les mêmes axes pour faciliter la comparaison entre eux. Ceci, à son tour, aide le programmeur à différencier rapidement les tracés et à obtenir de grandes quantités d'informations.

Prenons l'exemple suivant de la fonction facetgrid () pour tracer ces graphiques.

EXEMPLE:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'species') b.map (plt.hist, 'sepal_length')

PRODUCTION:

La sortie ci-dessus montre clairement la comparaison entre les conseils donnés pendant le déjeuner et le dîner. Vous pouvez également tracer à l'aide de la fonction PairGrid lorsque vous avez une paire de variables à comparer. Prenons l'exemple suivant.

EXEMPLE:

sns.set (style = 'ticks') a = sns.load_dataset ('Flights') b = sns.PairGrid (a) b.map (plt.scatter)

PRODUCTION:

Comme vous pouvez le voir, la sortie ci-dessus compare clairement l'année et le nombre de passagers de différentes manières.

Seaborn permet également des personnalisations concernant l'esthétique, ce qui est discuté plus loin.

Plot-Esthétique:

Ce segment du didacticiel Python Seaborn vise à rendre nos parcelles plus attrayantes et plus agréables.

Python Seaborn Figure-Esthétique:

La première fonction dont je vais parler est set (). J’ai déjà utilisé le paramètre ‘style’ de cette fonction. Ce paramètre traite essentiellement des thèmes marins. À l'heure actuelle, cinq d'entre eux sont disponibles à savoir darkgrid, ticks, whitegrid, blanc et foncé.

Prenons l'exemple suivant illustrant le thème blanc.

EXEMPLE:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', données = a)

PRODUCTION:

Dans la sortie ci-dessus, vous pouvez remarquer que le thème est changé en blanc. Vous pouvez également les explorer davantage en utilisant les autres thèmes. Si vous remarquez dans la sortie précédente, il y a des axes présents tout autour du graphique. Cependant, ceci est également personnalisable à l'aide de la fonction despine (). Regardez l'exemple ci-dessous.

EXEMPLE:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', data = a) sns.despine (offset = 10, trim = True)

PRODUCTION:



Notez la différence entre les deux sorties précédentes. Cependant, il existe de nombreuses autres options que vous pouvez explorer par vous-même.

Palettes de couleurs Python Seaborn:

La couleur est fondamentalement la caractéristique qui approche les yeux humains au-delà de toute autre caractéristique. Seaborn vous permet de jouer avec les couleurs en utilisant diverses fonctions telles que color_palette (), hls_palette (), husl_palette (), etc. Jetez un œil aux couleurs actuellement présentes dans seaborn.

EXEMPLE:

import numpy as np import seaborn as sns import matplotlib.pyplot as plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

PRODUCTION:

L'image ci-dessus montre les couleurs présentes dans seaborn. Je l'ai fait en utilisant la fonction palplot (). Pour des variations plus profondes, vous pouvez utiliser hls_palette (), husl_palette (), etc.

Cela nous amène à la fin du didacticiel Python Seaborn. J'espère que vous avez tout compris clairement. Assurez-vous de pratiquer autant que possible .

Vous avez une question pour nous? Veuillez le mentionner dans la section commentaires de ce blog «Python Seaborn Tutorial» et nous vous répondrons dans les plus brefs délais.

Pour obtenir des connaissances approfondies sur Python ainsi que sur ses différentes applications, vous pouvez vous inscrire en direct avec une assistance 24/7 et un accès à vie.