Forskellen mellem RDBMS og Hadoop

Indholdsfortegnelse:

Forskellen mellem RDBMS og Hadoop
Forskellen mellem RDBMS og Hadoop

Video: Forskellen mellem RDBMS og Hadoop

Video: Forskellen mellem RDBMS og Hadoop
Video: Hadoop против РСУБД 2024, Juli
Anonim

Den vigtigste forskel mellem RDBMS og Hadoop er, at RDBMS gemmer strukturerede data, mens Hadoop gemmer strukturerede, semi-strukturerede og ustrukturerede data.

RDBMS er et databasestyringssystem baseret på den relationelle model. Hadoop er en software til lagring af data og kørsel af applikationer på klynger af råvarehardware.

Billede
Billede

Hvad er RDBMS?

RDBMS står for Relational Database Management System baseret på den relationelle model. I RDBMS'et bruges tabeller til at gemme data, og nøgler og indekser hjælper med at forbinde tabellerne. En tabel er en samling af dataelementer, og de er entiteterne. Den indeholder rækker og kolonner. Rækkerne repræsenterer en enkelt post i tabellen. Kolonnerne repræsenterer attributterne.

For eksempel kan salgsdatabasen have kunde- og produktenheder. Kunden kan have attributter som kunde_id, navn, adresse, telefonnr. Varen kan have attributter såsom produkt_id, navn osv. Den primære nøgle i kundetabellen er kunde_id, mens den primære nøgle i produkttabellen er produkt_id. Ved at placere product_id i kundetabellen som en fremmednøgle forbinder disse to enheder. Ligeledes er tabellerne også relateret til hinanden. De giver dataintegritet, normalisering og mange flere. Få af de almindelige RDBMS er MySQL, MSSQL og Oracle. De bruger SQL til forespørgsler.

Hvad er Hadoop?

The Hadoop er en Apache open source-ramme skrevet i Java. Det hjælper med at lagre og behandle en stor mængde data på tværs af klynger af computere ved hjælp af simple programmeringsmodeller. Hovedformålet med Hadoop er at gemme og behandle Big Data, som refererer til en stor mængde komplekse data. Gennemløbet af Hadoop, som er kapaciteten til at behandle en mængde data inden for en bestemt tidsperiode, er høj.

Forskellen mellem RDBMS og Hadoop
Forskellen mellem RDBMS og Hadoop

Der er fire moduler i Hadoop-arkitektur. De er Hadoop common, YARN, Hadoop Distributed File System (HDFS) og Hadoop MapReduce. Det fælles modul indeholder Java-biblioteker og hjælpeprogrammer. Det har også filerne til at starte Hadoop. Hadoop YARN udfører jobplanlægning og klyngressourcestyring.

Yderligere er Hadoop Distributed File System (HDFS) Hadoop-lagringssystemet. Den bruger master-slave-arkitekturen. Masternoden er NameNode, og den administrerer filsystemets metadata. Andre computere er slavenoder eller DataNodes. De gemmer de faktiske data. På den anden side udfører Hadoop MapReduce den distribuerede beregning. Den har algoritmerne til at behandle dataene. I HDFS har Master-knuden en jobtracker. Den kører kortreducerende job på slaveknuderne. Der er en Task Tracker for hver slaveknude til at fuldføre databehandling og sende resultatet tilbage til masterknudepunktet. Samlet set giver Hadoop massiv lagring af data med høj processorkraft.

Hvad er forskellen mellem RDBMS og Hadoop?

RDBMS vs Hadoop

RDBMS er en systemsoftware til oprettelse og styring af databaser, der er baseret på den relationelle model. Hadoop er en samling open source-software, der forbinder mange computere for at løse problemer, der involverer en stor mængde data og beregninger.
Datavariant
RDBMS gemmer strukturerede data. Hadoop gemmer strukturerede, semi-strukturerede og ustrukturerede data.
Datalagring
RDBMS gemmer den gennemsnitlige mængde data. Hadoop gemmer en stor mængde data end RDBMS.
Hastighed
I RDBMS er læsninger hurtige. I Hadoop er læsning og skrivning hurtig.
Scalability
RDBMS har lodret skalerbarhed. Hadoop har vandret skalerbarhed.
Hardware
RDBMS bruger avancerede servere. Hadoop bruger råvarehardware.
Gennemløb
RDBMS-gennemløbet er højere. Hadoop-gennemstrømningen er lavere.

Oversigt – RDBMS vs Hadoop

Denne artikel diskuterede forskellen mellem RDBMS og Hadoop. Den vigtigste forskel mellem RDBMS og Hadoop er, at RDBMS gemmer strukturerede data, mens Hadoop gemmer strukturerede, semi-strukturerede og ustrukturerede data.

Anbefalede: