Diferència entre RDBMS i Hadoop

Taula de continguts:

Diferència entre RDBMS i Hadoop
Diferència entre RDBMS i Hadoop

Vídeo: Diferència entre RDBMS i Hadoop

Vídeo: Diferència entre RDBMS i Hadoop
Vídeo: Lecture 07 - Hadoop - Hadoop Vs RDBMS 2024, Juliol
Anonim

La diferència clau entre RDBMS i Hadoop és que el RDBMS emmagatzema dades estructurades mentre que Hadoop emmagatzema dades estructurades, semiestructurades i no estructurades.

El RDBMS és un sistema de gestió de bases de dades basat en el model relacional. Hadoop és un programari per emmagatzemar dades i executar aplicacions en grups de maquinari bàsic.

Imatge
Imatge

Què és RDBMS?

RDBMS significa Relational Database Management System basat en el model relacional. Al RDBMS, les taules s'utilitzen per emmagatzemar dades, i les claus i els índexs ajuden a connectar les taules. Una taula és una col·lecció d'elements de dades, i són les entitats. Conté files i columnes. Les files representen una única entrada a la taula. Les columnes representen els atributs.

Per exemple, la base de dades de vendes pot tenir entitats de clients i productes. El client pot tenir atributs com ara customer_id, name, address, phone_no. L'element pot tenir atributs com ara product_id, name, etc. La clau primària de la taula de client és customer_id mentre que la clau primària de la taula de producte és product_id. Col·locar el product_id a la taula del client com a clau estrangera connecta aquestes dues entitats. Així mateix, les taules també estan relacionades entre si. Proporcionen integritat de dades, normalització i molts més. Pocs dels RDBMS comuns són MySQL, MSSQL i Oracle. Utilitzen SQL per fer consultes.

Què és Hadoop?

The Hadoop és un framework de codi obert d'Apache escrit en Java. Ajuda a emmagatzemar i processar una gran quantitat de dades en grups d'ordinadors mitjançant models de programació senzills. L'objectiu principal d'Hadoop és emmagatzemar i processar Big Data, que fa referència a una gran quantitat de dades complexes. El rendiment de Hadoop, que és la capacitat de processar un volum de dades en un període de temps determinat, és alt.

Diferència entre RDBMS i Hadoop
Diferència entre RDBMS i Hadoop

Hi ha quatre mòduls a l'arquitectura Hadoop. Són Hadoop common, YARN, Hadoop Distributed File System (HDFS) i Hadoop MapReduce. El mòdul comú conté les biblioteques i utilitats Java. També té els fitxers per iniciar Hadoop. Hadoop YARN realitza la planificació de treballs i la gestió de recursos del clúster.

A més, el sistema de fitxers distribuïts de Hadoop (HDFS) és el sistema d'emmagatzematge de Hadoop. Utilitza l'arquitectura mestre-esclau. El node mestre és el NameNode i gestiona les metadades del sistema de fitxers. Altres ordinadors són nodes esclaus o DataNodes. Emmagatzemen les dades reals. D' altra banda, Hadoop MapReduce fa el càlcul distribuït. Té els algorismes per processar les dades. A l'HDFS, el node mestre té un rastrejador de treballs. Executa treballs de reducció de mapes als nodes esclaus. Hi ha un seguiment de tasques per a cada node esclau per completar el processament de dades i enviar el resultat al node mestre. En general, Hadoop ofereix un emmagatzematge massiu de dades amb una gran potència de processament.

Quina diferència hi ha entre RDBMS i Hadoop?

RDBMS vs Hadoop

RDBMS és un programari de sistema per crear i gestionar bases de dades basades en el model relacional. Hadoop és una col·lecció de programari de codi obert que connecta molts ordinadors per resoldre problemes que impliquen una gran quantitat de dades i càlcul.
Varietat de dades
RDBMS emmagatzema dades estructurades. Hadoop emmagatzema dades estructurades, semiestructurades i no estructurades.
Emmagatzematge de dades
RDBMS emmagatzema una quantitat mitjana de dades. Hadoop emmagatzema una gran quantitat de dades que RDBMS.
Velocitat
A RDBMS, les lectures són ràpides. A Hadoop, les lectures i escriptures són ràpides.
Escalabilitat
RDBMS té escalabilitat vertical. Hadoop té escalabilitat horitzontal.
Maquinari
RDBMS utilitza servidors de gamma alta. Hadoop utilitza maquinari bàsic.
Rendiment
El rendiment de RDBMS és més elevat. El rendiment de Hadoop és més baix.

Resum: RDBMS vs Hadoop

En aquest article es parla de la diferència entre RDBMS i Hadoop. La diferència clau entre RDBMS i Hadoop és que el RDBMS emmagatzema dades estructurades mentre que Hadoop emmagatzema dades estructurades, semiestructurades i no estructurades.

Recomanat: