Tutoriel HBase: Introduction à HBase et étude de cas Facebook
Ce blog tutoriel HBase vous présente ce qu'est HBase et ses fonctionnalités. Il couvre également l'étude de cas de Facebook Messenger pour comprendre les avantages de HBase.
Ce blog tutoriel HBase vous présente ce qu'est HBase et ses fonctionnalités. Il couvre également l'étude de cas de Facebook Messenger pour comprendre les avantages de HBase.
Ce blog est un guide sur la façon d'installer Puppet Master et Puppet Agent. Il comprend également un exemple de déploiement d'Apache Tomcat à l'aide du module Puppet Tomcat.
Ce blog est un guide étape par étape pour l'installation d'Apache Pig sur un environnement Linux. Nous installerons Apache Pig 0.16.0 et l'exécuterons dans différents modes.
Ce blog sur l'architecture HBase explique le modèle de données HBase et donne un aperçu de l'architecture HBase. Il explique également différents mécanismes dans HBase.
Ce blog didacticiel Hive vous donne une connaissance approfondie de l'architecture Hive et du modèle de données Hive. Il explique également l'étude de cas de la NASA sur Apache Hive.
Ce blog Spark Streaming vous présentera Spark Streaming, ses fonctionnalités et ses composants. Il comprend un projet d'analyse des sentiments utilisant Twitter.
Ce blog Spark MLlib vous présentera la bibliothèque d'apprentissage automatique d'Apache Spark. Il comprend un projet de système de recommandation de film utilisant Spark MLlib.
Ce blog du didacticiel GraphX vous présentera Apache Spark GraphX, ses fonctionnalités et ses composants, y compris un projet d'analyse des données de vol.
Ce blog de didacticiel Apache Flume explique les principes de base d'Apache Flume et ses fonctionnalités. Il présentera également le streaming Twitter à l'aide d'Apache Flume.
Tutoriel Apache Sqoop: Sqoop est un outil de transfert de données entre Hadoop et des bases de données relationnelles. Ce blog couvre l'importation et l'exportation Sooop depuis MySQL.
Tutoriel Apache Oozie: Oozie est un système de planification de flux de travail pour gérer les travaux Hadoop. C'est un système évolutif, fiable et extensible.
Les applications Big Data révolutionnent les organisations et les aident à prendre des décisions commerciales plus informatives en analysant de grands volumes de données.
Apache Spark a pris le contrôle du monde du Big Data & Analytics et Python est l'un des langages de programmation les plus accessibles utilisés dans l'industrie aujourd'hui. Donc, ici, dans ce blog, nous allons en apprendre davantage sur Pyspark (étincelle avec python) pour tirer le meilleur parti des deux mondes.
Ce blog se concentre sur Apache Hadoop YARN qui a été introduit dans Hadoop version 2.0 pour la gestion des ressources et la planification des tâches. Il explique l'architecture YARN avec ses composants et les tâches accomplies par chacun d'eux. Il décrit la soumission de l'application et le flux de travail dans Apache Hadoop YARN.
Dans ce blog sur le didacticiel PySpark, vous découvrirez l'API PSpark qui est utilisée pour travailler avec Apache Spark à l'aide du langage de programmation Python.
Dans ce blog du didacticiel PySpark Dataframe, vous découvrirez les transformations et les actions dans Apache Spark avec plusieurs exemples.
Ce blog Edureka sur Cloudera Hadoop Tutorial vous donnera un aperçu complet des différents composants de Cloudera comme Cloudera Manager, Parcels, Hue, etc.
Cet article décrit l'augmentation de la demande de compétences Hadoop et NoSQL dans l'informatique et d'autres domaines. lisez la suite pour voir comment les compétences Hadoop et NoSQL vous aideront
Ce blog présente les avantages de la mise en œuvre de Hadoop, les initiatives Hadoop, Hadoop dans les petites et grandes organisations et les avantages professionnels de la formation Hadoop.
Hadoop est devenu une compétence à acquérir dans le circuit informatique, le nombre de profils d'apprenants Hadoop augmente considérablement de jour en jour.