Hadoop distribuirani datotečni sustav (HDFS)

Autor: Judy Howell
Datum Stvaranja: 28 Srpanj 2021
Datum Ažuriranja: 1 Srpanj 2024
Anonim
Howto install hadoop on Ubuntu
Video: Howto install hadoop on Ubuntu

Sadržaj

Definicija - Što znači Hadoop distribuirani datotečni sustav (HDFS)?

Hadoop Distribuirani datotečni sustav (HDFS) je distribuirani datotečni sustav koji radi na standardnom ili niskom cenovnom hardveru. Razvijen od strane Apache Hadoop, HDFS djeluje poput standardnog distribuiranog datotečnog sustava, ali omogućuje bolju protočnost podataka i pristup putem algoritma MapReduce, visoku toleranciju grešaka i izvornu podršku velikih skupova podataka.


Uvod u Microsoft Azure i Microsoft Cloud | Kroz ovaj vodič naučit ćete o čemu se radi računalstvo u oblaku i kako vam Microsoft Azure može pomoći da preselite i pokrenete svoje poslovanje iz oblaka.

Techopedia objašnjava Hadoop distribuirani datotečni sustav (HDFS)

HDFS pohranjuje veliku količinu podataka smještenih na više strojeva, obično u stotinama i tisućama istodobno povezanih čvorova, i pruža pouzdanost podataka repliciranjem svake instance podataka kao tri različite kopije - dvije u jednoj grupi i jedna u drugoj. Te se kopije mogu zamijeniti u slučaju kvara.

HDFS arhitektura sastoji se od klastera, kojima se svaki pristupa pomoću jednog softverskog alata NameNode instaliranog na zasebnom stroju radi nadgledanja i upravljanja datotečnim sustavom klastera i mehanizmom pristupa korisnicima. Ostali strojevi instaliraju jednu instancu DataNode za upravljanje pohranom klastera.

Budući da je HDFS napisan na Javi, on ima matičnu podršku za Java programska sučelja za programiranje (API) za integraciju i pristupačnost aplikacija. Također mu se može pristupiti putem standardnih web-preglednika.