SQL pour la science des données: une solution unique pour les débutants



Cet article de blog sur SQL pour la science des données vous aidera à comprendre comment SQL peut être utilisé pour stocker, accéder et récupérer des données pour effectuer une analyse de données.

Depuis que la science des données a été classée numéro 1 pour être le poste le plus prometteur de l'époque, nous essayons tous de rejoindre la course de . Cet article de blog sur SQL pour la science des données vous aidera à comprendre comment SQL peut être utilisé pour stocker, accéder et récupérer des données pour effectuer une analyse de données.

Voici une liste de sujets qui seront couvert dans ce blog:





    1. Pourquoi SQL est-il nécessaire pour la science des données?
    2. Qu'est-ce que SQL?
    3. Bases de SQL
    4. Installer MySQL
    5. Pratique

Pourquoi SQL est-il nécessaire pour la science des données?

Saviez-vous que nous générons plus de 2,5 quintillions d'octets de données chaque jour? Ce rythme de génération de données est la raison de la popularité des technologies haut de gamme telles que Science des données , , etc.

Dériver des informations utiles à partir de données est ce que l'on appelle la science des données. La science des données implique l'extraction, le traitement et l'analyse de tonnes de données. Actuellement, ce dont nous avons besoin qui peut être utilisé pour stocker et gérer cette vaste quantité de données.



Qu

C'est ici que SQL entre en jeu.

SQL peut être utilisé pour stocker, accéder et extraire d'énormes quantités de données afin de mener à bien l'ensemble du processus de science des données de manière plus fluide.



Qu'est-ce que SQL?

SQL qui signifie Structured Query Language est un langage de requête destiné à gérer les bases de données relationnelles.

Mais qu'est-ce qu'une base de données relationnelle exactement?

Une base de données relationnelle est un groupe de tables bien définies à partir desquelles les données peuvent être consultées, modifiées, mises à jour, etc., sans avoir à modifier les tables de la base de données. SQL est la norme (API) des bases de données relationnelles.

Pour en revenir à SQL, la programmation SQL peut être utilisée pour effectuer plusieurs actions sur des données telles que l'interrogation, l'insertion, la mise à jour, la suppression d'enregistrements de base de données. Les exemples de bases de données relationnelles qui utilisent SQL incluent MySQL Database, Oracle, etc.

Pour en savoir plus sur SQL, vous pouvez parcourir le blogs suivants:

  1. Comprendre les types de données SQL - Tout ce que vous devez savoir sur les types de données SQL
  2. CREATE TABLE in SQL - Tout ce que vous devez savoir sur la création de tables en SQL

Avant de commencer avec une démonstration sur SQL, familiarisons-nous avec les commandes SQL de base.

Bases de SQL

SQL fournit un ensemble de commandes simples pour modifier les tables de données, passons en revue certaines des commandes SQL de base:

  • CRÉER UNE BASE DE DONNÉES - crée une nouvelle base de données
  • CRÉER UNE TABLE - crée une nouvelle table
  • INSÉRER DANS - insère de nouvelles données dans une base de données
  • SÉLECTIONNER - extrait des données d'une base de données
  • MISE À JOUR - met à jour les données dans une base de données
  • EFFACER - supprime les données d'une base de données
  • ALTER DATABASE - modifie une base de données
  • MODIFIER TABLE - modifie une table
  • DROP TABLE - supprime une table
  • CRÉER UN INDEX - crée un index pour rechercher un élément
  • DROP INDEX - supprime Un index

Pour mieux comprendre SQL, installons MySQL et voyons comment vous pouvez jouer avec les données.

Installer MySQL

L'installation de MySQL est une tâche simple. Voici un guide étape par étape cela vous aidera à installer MySQL sur votre système.

Une fois l'installation terminée MySQL, suivez la section ci-dessous pour une démo simple qui vous montrera comment insérer, manipuler et modifier des données.

SQL pour la science des données - Démo MySQL

Dans cette démonstration, nous verrons comment créer des bases de données et les traiter. Il s'agit d'une démonstration de niveau débutant pour vous familiariser avec l'analyse de données sur SQL.

Alors, commençons!

Étape 1: créer une base de données SQL

Une base de données SQL est un entrepôt de stockage dans lequel les données peuvent être stockées dans un format structuré. Créons maintenant une base de données en utilisant MySQL :

CRÉER UNE BASE DE DONNÉES edureka UTILISER edureka

Dans le code ci-dessus, il existe deux commandes SQL:

Remarque : Les commandes SQL sont définies en majuscules et un point-virgule est utilisé pour terminer une commande SQL.

  1. CREATE DATABASE: cette commande crée une base de données appelée «edureka»

  2. UTILISATION: Cette commande est utilisée pour activer la base de données. Ici, nous activons la base de données «edureka».

Étape 2: Créez une table avec les fonctionnalités de données requises

Créer une table est aussi simple que créer une base de données. Il vous suffit de définir les variables ou les fonctionnalités de la table avec leurs types de données respectifs. Voyons comment cela peut être fait:

CREATE TABLE toys (TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Price INTEGER, Quantity INTEGER)

Dans l'extrait de code ci-dessus, les choses suivantes se produisent:

  1. Utilisez la commande 'CRÉER UNE TABLE' pour créer une table appelée jouets.
  2. La table de jouets contient 4 fonctionnalités, à savoir, TID (Transaction ID), Item_name, Price et Quantity.
  3. Chaque variable est définie avec ses types de données respectifs.
  4. La variable TID est déclarée comme clé primaire. Une clé primaire désigne essentiellement une variable qui peut stocker une valeur unique.

Vous pouvez vérifier les détails de la table définie en utilisant la commande suivante:

DÉCRIRE les jouets

Étape 3: insertion de données dans le tableau

Maintenant que nous avons créé un tableau, remplissons-le avec quelques valeurs. Plus tôt dans ce blog, j'ai mentionné comment vous pouvez ajouter des données dans une table en utilisant simplement une seule commande, c'est-à-dire INSERT INTO.

Voyons comment procéder:

INSERT INTO toys VALUES (NULL, 'Train', 550, 88) INSERT INTO toys VALUES (NULL, 'Hotwheels_car', 350, 80) INSERT INTO toys VALUES (NULL, 'Magic_Pencil' ', 70, 100) INSERT INTO toys VALUES ( NULL, 'Dog_house', 120, 54) INSERT INTO toys VALUES (NULL, 'Skateboard', 700, 42) INSERT INTO toys VALUES (NULL, 'GI Joe', 300, 120)

Dans l'extrait de code ci-dessus, nous avons simplement inséré 6 observations dans notre table 'jouets' en utilisant la commande INSERT INTO. Pour chaque observation, entre crochets, j'ai spécifié la valeur de chaque variable ou caractéristique définie lors de la création du tableau.

La variable TID est définie sur NULL car elle s'incrémente automatiquement à partir de 1.

Voyons maintenant toutes les données présentes dans notre tableau. Cela peut être fait en utilisant la commande ci-dessous:

SELECT * FROM jouets


Étape 4: modifier les entrées de données

Disons que vous avez décidé d’augmenter le prix du G.I. Joe car cela vous attire beaucoup de clients. Comment mettriez-vous à jour le prix de la variable dans une base de données?

C'est simple, utilisez simplement la commande ci-dessous:

UPDATE jouets SET Prix = 350 WHERE TID = 6

La commande UPDATE vous permet de modifier toutes les valeurs / variables stockées dans la table. Le paramètre SET vous permet de sélectionner une fonction particulière et le paramètre WHERE est utilisé pour identifier la variable / valeur que vous souhaitez modifier. Dans la commande ci-dessus, j'ai mis à jour le prix de l'entrée de données dont le TID est 6 (G.I. Joe).

Voyons maintenant le tableau mis à jour:

SELECT * FROM jouets

Vous pouvez également modifier ce que vous souhaitez afficher en vous référant simplement aux colonnes que vous souhaitez afficher. Par exemple, la commande ci-dessous affichera uniquement le nom du jouet et son prix respectif:

SELECT Item_name, Price FROM toys

Étape 5: Récupération des données

Ainsi, après avoir inséré les données et les avoir modifiées, il est enfin temps d'extraire et de récupérer les données en fonction des besoins de l'entreprise. C'est là que les données peuvent être récupérées pour une analyse et une modélisation des données plus poussées.

Notez qu'il s'agit d'un exemple simple pour vous familiariser avec SQL, cependant, dans les scénarios du monde réel, les données sont beaucoup plus compliquées et de grande taille. Malgré cela, les commandes SQL restent les mêmes et c'est ce qui rend SQL si simple et compréhensible. Il peut traiter des ensembles de données complexes avec un ensemble de commandes SQL simples.

Maintenant, récupérons les données avec quelques modifications. Reportez-vous au code ci-dessous et essayez de comprendre ce qu'il fait sans regarder la sortie:

SELECT * FROM jouets LIMIT 2

Tu l'as deviné! Il affiche les deux premières observations présentes dans mon tableau.

Essayons quelque chose de plus intéressant.

SÉLECTIONNER * À PARTIR DE jouets COMMANDER PAR Prix ASC

Comme le montre la figure, les valeurs sont disposées par rapport à l'ordre croissant de la variable de prix. Si vous souhaitez rechercher les trois articles les plus fréquemment achetés, que feriez-vous?

C’est vraiment très simple!

SÉLECTIONNER * DES jouets COMMANDER PAR Quantité DESC LIMIT 3

Essayons une autre.

SÉLECTIONNEZ * À PARTIR DE jouets O Prix> 400 COMMANDER PAR Prix ASC


Cette requête extrait les détails des jouets dont le prix est supérieur à 400 et organise la sortie par ordre croissant du prix.

comment faire des tableaux imbriqués en html

Voilà comment vous pouvez traiter les données en utilisant SQL. Maintenant que vous connaissez les bases de SQL pour la science des données, je suis sûr que vous êtes curieux d'en savoir plus. Voici quelques blogs pour vous aider à démarrer:

  1. Qu'est-ce que la science des données? Guide du débutant à la science des données
  2. Tutoriel MySQL - Un guide du débutant pour apprendre MySQL

Si vous souhaitez vous inscrire à un cours complet sur l'intelligence artificielle et l'apprentissage automatique, Edureka a un Cela vous permettra de maîtriser des techniques telles que l'apprentissage supervisé, l'apprentissage non supervisé et le traitement du langage naturel. Il comprend une formation sur les dernières avancées et approches techniques de l'intelligence artificielle et de l'apprentissage automatique telles que l'apprentissage en profondeur, les modèles graphiques et l'apprentissage par renforcement.