MapReduce

Autor: Louise Ward
Datum Stvaranja: 9 Veljača 2021
Datum Ažuriranja: 1 Srpanj 2024
Anonim
What is MapReduce?
Video: What is MapReduce?

Sadržaj

Definicija - Što znači MapReduce?

MapReduce je programski model koji je uveo Google za obradu i generiranje velikih skupova podataka na klasterima računala.


Google je prvo formulirao okvir u svrhu prikazivanja Googleovog indeksiranja web stranica, a novi je okvir zamijenio ranije algoritme indeksiranja. Početni programeri smatraju da je MapReduce koristan jer se rutinske knjižnice mogu koristiti za izradu paralelnih programa bez ikakvih briga o komunikaciji unutar klastera, nadzoru zadataka ili postupcima rukovanja kvarovima.

MapReduce radi na velikoj grupi robnih strojeva i vrlo je skalabilan. Ima nekoliko oblika implementacije koje pruža više programskih jezika, kao što su Java, C # i C ++.

Uvod u Microsoft Azure i Microsoft Cloud | Kroz ovaj vodič naučit ćete o čemu se radi računalstvo u oblaku i kako vam Microsoft Azure može pomoći da preselite i pokrenete svoje poslovanje iz oblaka.

Tehopedia objašnjava MapReduce

Okvir MapReduce ima dva dijela:

  1. Funkcija koja se zove "Karta", koja omogućava različitim točkama distribuiranog klastera da distribuiraju svoj rad
  2. Funkcija nazvana "Smanji", koja je osmišljena tako da konačni oblik rezultata klastera smanji na jedan izlaz

Glavna prednost okvira MapReduce je njegova otpornost na pogreške, gdje se očekuju periodična izvješća iz svakog čvora u klasteru po završetku radova.


Zadatak se prenosi s jednog čvora na drugi. Ako glavni čvor primijeti da čvor šuti u dužem intervalu od očekivanog, glavni čvor provodi postupak preusmjeravanja na zamrznuti / odgođeni zadatak.

Okvir MapReduce inspiriran je funkcijama "Map" i "Reduce" koje se koriste u funkcionalnom programiranju. Računalna obrada događa se na podacima pohranjenim u datotečnom sustavu ili unutar baze podataka, koji uzima skup ulaznih ključa i proizvodi skup izlaznih ključnih vrijednosti.

Svakog dana na Googles klasterima se izvršavaju brojni programi MapReduce i MapReduce. Programi se automatski paraleliziraju i izvršavaju na velikom skupu robnih strojeva. Sustav izvođenja bavi se podjelom ulaznih podataka, zakazivanje izvršenja programa na skupu strojeva, rukovanjem kvarom na stroju i upravljanjem potrebnom intermašinskom komunikacijom. Programeri bez iskustva s paralelnim i distribuiranim sustavima lako mogu koristiti resurse velikog distribuiranog sustava.


MapReduce koristi se u distribuiranoj grep, distribuiranoj vrsti, preokretu internetskog povezivanja grafikona, statistici dnevnika internetskog pristupa, grupiranju dokumenata, strojnom učenju i statističkom strojnom prijevodu.