Opi 10 parasta eroa MapReduce vs Langan välillä

Sisällysluettelo:

Anonim

Ero kartan pienentämisen ja langan välillä

Lanka on Yet Another Resource Negotiator, se on uusi kehys resurssien (muisti ja CPU) hallintaan. Se auttaa meitä kaikenlaisen hajautetun sovelluksen kehittämisessä, se tarjoaa meille tarvittavat daemonit ja sovellusliittymät. YARN: n toinen tärkeä ominaisuus on, että se käsittelee ja ajoittaa sovelluksen resurssipyynnöt ja auttaa prosessia pyynnön toteuttamisessa. YARN on yleinen alusta, jolla voidaan ajaa kaikkia hajautettuja sovelluksia. Map Reduce versio 2 on hajautettu sovellus, joka toimii YARN: n päällä. Map map on Hadoop-komponentin prosessointiyksikkö, mutta prosessoi tietoja rinnakkain hajautetussa ympäristössä. Joten periaatteessa kartta-vähentää valtavan tietokomponentin työtä, se käsittelee tiedot ja tallentaa HDFS: ään siten, että haku on helpompaa kuin perinteinen tallennus.

Head to Head -vertailu MapReduce vs. Lanka (Infografia)

Alla on kymmenen parhainta vertailua MapReduce vs. Lanka

Tärkein ero MapReduce vs. langan välillä

  1. Hadoop 1: ssä on kaksi komponenttia, joista ensimmäinen on HDFS (Hadoop Distributed File System) ja toinen on Map Reduce. Kun taas Hadoop 2: lla, siinä on myös kaksi komponenttia HDFS ja YARN / MRv2 (kutsumme yleensä lankaksi Kartta pienentämään versiota 2).
  2. Kun Map Reduce -sovellus lakkaa toimimasta, kaikki hänen orjasolmut lakkaavat toimimasta automaattisesti, tämä on yksi skenaario, jossa työn suorittaminen voi keskeytyä, ja sitä kutsutaan yhdeksi epäonnistumispisteeksi. YARN ratkaisee tämän ongelman arkkitehtuurinsa takia, YARNilla on käsite Aktiivinen nimissolmu sekä valmiustilan nimisolmu. Kun aktiivinen solmu lakkaa toimimasta jonkin aikaa, passiivinen solmu alkaa toimia aktiivisena solmuna ja jatkaa suoritusta.
  3. Kartan pienentämisessä on yksi isäntä- ja useita orja-arkkitehtuureja. Jos isäntä-orja menee alas, koko orja lakkaa toimimasta, tämä on HADOOP1: n ainoa vikakohta, kun taas YARN-arkkitehtuuriin perustuva HADOOP2: n käsite on useita isäntä ja orja, Jos yksi isäntä menee alas, toinen isäntä jatkaa prosessiaan ja jatkaa suoritusta.
  4. Kuten alla olevasta kaaviosta voimme nähdä, ero molemmissa ekosysteemeissä HADOOP1 ja HADOOP2. Komponenttivirta lankaresurssien hallinta on vuorovaikutuksessa Map-vähentä ja HDFS: n kanssa.

Joten pohjimmiltaan YARN on vastuussa resurssienhallinnan keinoista, mitkä tehtävät suoritetaan millä järjestelmällä YARN päättää, kun taas map pienentää ohjelmointikehystä, joka vastaa tietyn työn suorittamisesta, joten map-reduktissa on pohjimmiltaan kaksi komponenttia mapper ja reducer ohjelman suorittamiseen.

  1. Kartassa vähennä kutakin datasolmua, joka suoritetaan erikseen, kun taas Langassa jokaista datasolmua johtaa solmunhallinta.
  2. Kartta vähentää käyttää Job tracker -ohjelmaa tehtävien luomiseen ja määrittämiseen tehtäväseurantaan datan vuoksi. Resurssien hallinta ei ole vaikuttavaa, koska jotkut datasolmuista pysyvät tyhjäkäynnillä eikä ole hyödyllisiä, kun taas YARNissa on Resurssienhallinta jokaiselle klusterin ja jokainen datasolmu suorittaa Node Manager -sovelluksen. Jokaisessa työssä yksi orjasolmu toimii Application Master -sovelluksena ja seuraa resursseja / tehtäviä.

MapReduce vs. Langan vertailutaulukko

Vertailun perusteet LANKA Kartta pienennä
merkitysLanka tarkoittaa vielä yhtä resurssineuvottelijaa.Karttavähennys on itse määritelty.
VersioEsittely Hadoop 2.0: ssaEsittely Hadoop 1.0: ssa
vastuuNyt YARN vastaa resurssienhallinnan osasta.Aikaisempi Kartta vähennys oli vastuussa resurssienhallinnasta ja tietojenkäsittelystä
SuoritusmalliLangan toteutusmalli on yleisempi verrattuna Map vähentääVähemmän yleinen verrattuna lankaan.
Sovelluksen suorittaminenLanka voi suorittaa myös ne sovellukset, jotka eivät noudata Map Reduce -malliaMap Reduce voi suorittaa oman malliperusteisen sovelluksensa.
ArkkitehtuuriYARN esiteltiin MR2: ssa työn seurannan ja tehtävän seurannan päälle. Työnseurannan ja tehtäväseurannan sovelluksen sijaan päällikkö tulee kuvaan.MR1: n aikaisemmassa versiossa lankaa ei ole siellä. Langan sijasta oli työpaikkaseuranta ja tehtäväseuranta, jotka auttavat sovelluksen tai töiden suorittamisessa
JoustavuusLanka on eristyneempi ja skaalautuvampiVähemmän skaalautuva verrattuna lankaan.
DaemonsYARN: llä on nimi Solmu, datasolmu, toissijainen nimissolmu, Resurssienhallinta ja Solmun hallinta.Map Reduce -sovelluksessa on nimi-solmu, datasolmu, toissijainen nimi -solmu, työ- ja tehtäväseuranta.
rajoitusYARNissa ei ole käsitettä yhdestä viallisesta kohdasta, koska siinä on useita päälliköitä, joten jos joku epäonnistui, toinen isäntä poimii sen ja jatkaa suoritusta.Yksi vikakohta, matala resurssien käyttö (enintään 4200 klusteria YAHOO) ja vähemmän skaalautuvuus verrattuna lankaan
KokoOletuksena YARN-tietosolmun koko on 128 MtKarttasuunnan datasolmun koko on oletuksena 64 Mt.

Johtopäätös - MapReduce vs Lanka

Hadoop 1: ssä, joka perustuu Map Reduce -sovellukseen, on useita ongelmia, jotka voitetaan Hadoop 2: ssa langan avulla. Kuten Hadoop 1: ssä, työpaikkaseurantaja on vastuussa resurssien hallinnasta, mutta YARNilla on resurssienhallinnan käsite sekä solmujen hallinta, joka vastaa resurssien hallinnasta. Kartan pienentämisessä on yksi vikakohta, ts. Työn seuranta, jos työn jäljitys lakkaa toimimasta, meidän on käynnistettävä koko klusterimme uudelleen ja suoritettava tehtävämme uudelleen alkuperäisestä. Oikeassa tilanteessa mikään organisaatio ei halua ottaa tällaista riskiä, ​​etenkin pankkien puolustusalalla. Sellainen organisaatio, joka toimii tietojen virtaviivaistamiseksi, ei ole valmis ottamaan tällaista riskiä. Muutaman minuutin kuluttua he menettävät tietonsa ja saattavat vaikuttaa kriittisesti liiketoimintaan. Joten lanka on parempi tulos kuin Map-csökkent.

Suositeltava artikkeli

Tämä on opas MapReduce vs Lanka -peliin, niiden merkitykseen, Head to Head -vertailuun, avainerot, vertailutaulukko ja johtopäätökset. Voit myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -

  1. 15 parasta tietää, mitä MapReduce vs Spark tarjoaa
  2. Paras 5 eroa Hadoopin ja MapReducen välillä
  3. 10 hyödyllistä eroa Hadoop vs. Redshift välillä
  4. Apache Hadoop vs Apache Spark | 10 parasta vertailua, jotka sinun on tiedettävä!
  5. Kuinka MapReduce toimii?