Kakva je razlika između velikih podataka i Hadoopa?

Autor: Judy Howell
Datum Stvaranja: 5 Srpanj 2021
Datum Ažuriranja: 23 Lipanj 2024
Anonim
Introduction to Amazon Web Services by Leo Zhadanovsky
Video: Introduction to Amazon Web Services by Leo Zhadanovsky

Sadržaj

P:

Kakva je razlika između velikih podataka i Hadoopa?


A:

Razlika između velikog broja podataka i softvera otvorenog koda Hadoop je različita i temeljna. Prvi je imovina, često složen i dvosmislen, dok je drugi program koji ostvaruje niz ciljeva i ciljeva za bavljenje tom imovinom.

Veliki podaci jednostavno su veliki skupovi podataka koje tvrtke i druge stranke sastavljaju kako bi služile određenim ciljevima i operacijama. Veliki podaci mogu obuhvaćati mnogo različitih vrsta podataka u različitim formatima. Na primjer, tvrtke mogu uložiti mnogo posla u prikupljanje tisuća podataka o kupnjama u formatima valuta, o identifikatorima kupaca poput imena ili broja socijalnog osiguranja ili o informacijama o proizvodu u obliku brojeva modela, prodajnih brojeva ili inventarnih brojeva. Sve ovo, ili bilo koja druga velika masa podataka, može se nazvati velikim podacima. U pravilu je sirovo i nekorišteno dok se ne unese u razne alate i rukovatelje.

Hadoop je jedan od alata namijenjenih za obradu velikih podataka. Hadoop i ostali softverski proizvodi rade na tumačenju ili analiziranju rezultata pretraživanja velikih podataka putem određenih vlasničkih algoritama i metoda. Hadoop je program otvorenog koda pod licencom Apache koji održava globalna zajednica korisnika. Sadrži različite glavne komponente, uključujući set funkcija MapReduce i datotečni sustav distribuiran od Hadoop (HDFS).


Ideja koja stoji iza MapReducea je da Hadoop može prvo preslikati veliki skup podataka, a zatim izvršiti smanjenje tog sadržaja radi određenih rezultata. Funkcija smanjenja može se smatrati svojevrsnim filterom za neobrađene podatke. HDFS sustav tada djeluje na distribuciju podataka preko mreže ili ih prema potrebi premješta.

Administratori baze podataka, programeri i ostali mogu koristiti razne značajke Hadoopa za obradu velikih podataka na bilo koji broj načina. Na primjer, Hadoop se može koristiti za provođenje strategija podataka kao što su grupiranje i ciljanje s neujednačenim podacima ili podaci koji se ne uklapaju u tradicionalnu tablicu ili dobro odgovaraju na jednostavne upite.