Big Data

Tutoriel HBase: Introduction à HBase et étude de cas Facebook

Ce blog tutoriel HBase vous présente ce qu'est HBase et ses fonctionnalités. Il couvre également l'étude de cas de Facebook Messenger pour comprendre les avantages de HBase.

Installer Puppet - Installez Puppet en quatre étapes simples

Ce blog est un guide sur la façon d'installer Puppet Master et Puppet Agent. Il comprend également un exemple de déploiement d'Apache Tomcat à l'aide du module Puppet Tomcat.

Installation d'Apache Pig sur Linux

Ce blog est un guide étape par étape pour l'installation d'Apache Pig sur un environnement Linux. Nous installerons Apache Pig 0.16.0 et l'exécuterons dans différents modes.

Architecture HBase: modèle de données HBase et mécanisme de lecture / écriture HBase

Ce blog sur l'architecture HBase explique le modèle de données HBase et donne un aperçu de l'architecture HBase. Il explique également différents mécanismes dans HBase.

Tutoriel Hive - Architecture Hive et étude de cas de la NASA

Ce blog didacticiel Hive vous donne une connaissance approfondie de l'architecture Hive et du modèle de données Hive. Il explique également l'étude de cas de la NASA sur Apache Hive.

Tutoriel Spark Streaming - Analyse des sentiments à l'aide d'Apache Spark

Ce blog Spark Streaming vous présentera Spark Streaming, ses fonctionnalités et ses composants. Il comprend un projet d'analyse des sentiments utilisant Twitter.

Spark MLlib - Bibliothèque d'apprentissage automatique d'Apache Spark

Ce blog Spark MLlib vous présentera la bibliothèque d'apprentissage automatique d'Apache Spark. Il comprend un projet de système de recommandation de film utilisant Spark MLlib.

Tutoriel Spark GraphX - Graph Analytics dans Apache Spark

Ce blog du didacticiel GraphX vous présentera Apache Spark GraphX, ses fonctionnalités et ses composants, y compris un projet d'analyse des données de vol.

Tutoriel Apache Flume: Flux de données Twitter

Ce blog de didacticiel Apache Flume explique les principes de base d'Apache Flume et ses fonctionnalités. Il présentera également le streaming Twitter à l'aide d'Apache Flume.

Tutoriel Apache Sqoop - Importer / Exporter des données entre HDFS et RDBMS

Tutoriel Apache Sqoop: Sqoop est un outil de transfert de données entre Hadoop et des bases de données relationnelles. Ce blog couvre l'importation et l'exportation Sooop depuis MySQL.

Tutoriel Oozie: Apprenez à planifier vos travaux Hadoop

Tutoriel Apache Oozie: Oozie est un système de planification de flux de travail pour gérer les travaux Hadoop. C'est un système évolutif, fiable et extensible.

Applications Big Data en temps réel dans divers domaines

Les applications Big Data révolutionnent les organisations et les aident à prendre des décisions commerciales plus informatives en analysant de grands volumes de données.

Introduction à Spark avec Python - PySpark pour les débutants

Apache Spark a pris le contrôle du monde du Big Data & Analytics et Python est l'un des langages de programmation les plus accessibles utilisés dans l'industrie aujourd'hui. Donc, ici, dans ce blog, nous allons en apprendre davantage sur Pyspark (étincelle avec python) pour tirer le meilleur parti des deux mondes.

Tutoriel Hadoop YARN - Apprenez les principes de base de l'architecture YARN

Ce blog se concentre sur Apache Hadoop YARN qui a été introduit dans Hadoop version 2.0 pour la gestion des ressources et la planification des tâches. Il explique l'architecture YARN avec ses composants et les tâches accomplies par chacun d'eux. Il décrit la soumission de l'application et le flux de travail dans Apache Hadoop YARN.

Top Articles

Catégorie

Des Articles Intéressants