OLTP contre OLAP



Le blog suivant décrit brièvement OLTP vs OLAP et les différents cas d'utilisation.

OLTP contre OLAP

On dit que l'OLTP est davantage un système transactionnel en ligne ou un système de stockage de données, dans lequel l'utilisateur effectue de nombreuses transactions en ligne à l'aide du magasin de données. On dit également qu'il y a plus de lectures / écritures ad hoc effectuées en temps réel.





OLAP est davantage un magasin de données hors ligne. On y accèdenombre de foisen mode hors ligne. Par exemple, les fichiers journaux en bloc sont lus, puis réécrits dans des fichiers de données. Certains des domaines communs où OLAP est utilisé sont les travaux de journalisation, les travaux d'exploration de données, etc.

On dit que Cassandra est plus OLTP, car il est en temps réel, alors que Hadoop est plus OLAP, car il est utilisé pour l'analyse et les écritures en masse.



Pourquoi intégrer OLAP et OLTP?

Si vous recherchez le prix le moins cher pour la réservation d'hôtel dans les 365 prochains jours, vous disposez ici d'un énorme ensemble de données pour Cassandra et que vous souhaitez avoir une recommandation sur une base de données en temps réel, une promotion est exécutée en fonction du prix.

def __init __ (soi)

Dans un tel scénario, nous devons itérer tous les enregistrements et conserver les analyses au-dessus, ce qui est un énorme travail hors ligne qui doit être lancé souvent. Ici, Hadoop entre en jeu pour le traitement des données en masse.

L'autre avantage est que nous pouvons exécuter un cluster et abandonner l'exécution d'un autre cluster Hadoop.



Le troisième avantage est que l'on peut également réduire considérablement les coûts d'exploitation.

Étant donné un scénario dans lequel, si un utilisateur connaît bien divers systèmes écologiques Hadoop, tels que Hive, Pig Latin et doit y intégrer des données, il faut alors brancher une source de données dans Cassandra et essayer d'exécuter Map Réduisez également les emplois.

Il existe un modèle notable entre OLTP et OLAP. Dans OLTP, il y a moins d'écritures, par exemple Informations sur l'hôtel. En supposant que les changements de prix se produisent toutes les 5000 fois par seconde, les lectures peuvent être plus ici. Dans un tel scénario, il peut y avoir 1 écriture par seconde mais les lectures peuvent expulser des centaines et des milliers. Le ratio ici est donc d'environ 1: 1000.

C'est une observation intéressante que Cassandra peut s'intégrer facilement dans ce modèle, qui comprend des modèles, où la lecture / écriture est égale. En outre, en ce qui concerne OLTP, même si l'on entre dans un modèle de cohérence réglable et solide, on peut voir un écart de l'ordre de la milliseconde entre les modèles cohérents éventuels et les modèles cohérents les plus puissants. Ainsi, Cassandra peut s'intégrer dans OLTP.

En venant à OLAP, on peut voir différents modèles OLAP, ce qui signifie que plusieurs écritures se produisent simultanément. Dans OLAP, nous vidons les données en une seule fois, c'est-à-dire que tous les fichiers journaux sont placés dans le magasin de données, puis nous commençons le traitement. Le modèle de données ou modèle d'accès est exactement le contraire du type d'application OLTP. Ici, le Hadoop ou MapReduce seront utiles.

Vous avez une question pour nous? Mentionnez-les dans la section commentaires et nous vous recontacterons.

Articles Similaires:

Top 5 des raisons d'apprendre Cassandra