Johdatus Hbase-haastatteluun liittyviin kysymyksiin ja vastauksiin

HBase on suosittu sarakekeskeinen NoSQL-tietokannanhallintajärjestelmä, joka toimii Hadoopin hajautetun tiedostojärjestelmän (HDFS) päällä. Se sopii hyvin harvoihin tietokokonaisuuksiin, jotka ovat yleisiä monissa ison tiedonkäytön tapauksissa.

Tässä on kymmenen eniten kysyttyä 2019 HBase -haastatteluun liittyvää kysymystä ja vastausta: Joten olet vihdoin löytänyt unelmistyösi HBase-palvelusta, mutta mietit miten Hbase-haastattelu halkaistaan ​​ja mitkä voisivat olla todennäköiset 2019 Hbase -haastattelukysymykset. Jokainen haastattelu on erilainen ja myös työn laajuus on erilainen. Pitäen tämän mielessä olemme suunnitelleet yleisimmät Hbase-haastatteluun liittyvät kysymykset ja vastaukset auttaaksesi sinua menestymään haastattelussa. Nämä kysymykset on jaettu kahteen osaan, jotka ovat seuraavat:

Osa 1 - HBase-haastattelukysymykset (perus)

Tämä ensimmäinen osa kattaa HBase-haastattelun peruskysymykset ja vastaukset.

1. Milloin sinun pitäisi käyttää HBasea?

Vastaus:
Hbase ei sovellu kaikkiin käyttötapauksiin. Paras sopiva skenaario voidaan tunnistaa seuraavilla tarkistuksilla -
i.Datavolyymi: Pitäisi olla petatavuja tietoja käsiteltäväksi hajautetussa ympäristössä.
ii.Sovellus: HBase ei sovellu OLTP (Online Transaction Processing) -järjestelmiin, jotka vaativat monimutkaisia monilausumaisia tapahtumia.Siltä puuttuu myös monimutkaista SQL-tukea, jota vaaditaan relaatioanalytiikkaan. On suositeltavaa, kun sinulla on valtava määrä tietoa hieman erilainen kaavio.
iii.Klusterilaitteisto: HBase toimii HDFS: n päällä. Ja HDFS toimii tehokkaasti useiden solmujen (vähintään 5) kanssa. Joten HBase voi olla hyvä valinta vain hyvällä laitteistotuella.
iv.Ei perinteinen RDBMS: Hbase ei tue mitään käyttötapausta, joka vaatii perinteisiä ominaisuuksia, kuten Liity useisiin taulukoihin, Monimutkaiset SQ-tiedostot sisäkkäisillä tai ikkunatoiminnoilla jne.
v.Nopea tiedon satunnainen käyttö: Jos tarvitset satunnaista ja reaaliaikaista pääsyä tietoihisi, niin HBase on sopiva ehdokas. Se sopii erinomaisesti myös suurten taulukoiden, joihin sisältyy monirakenteinen tieto, varastointiin.

2. Mitä eroa Cassandra ja HBase ovat?

Vastaus:
Sekä HBase että Cassandra ovat jakaneet NoSQL-tietokantaa Hadoop-ekosysteemin suurille tiedoille. Molemmat on rakennettu erilaisiin käyttötarkoituksiin.
HBaseella on eräänlainen isäntä-orja-arkkitehtuuri, jossa on useita komponentteja, kuten Zookeeper, Namenode, HBase Master (Hmaster) ja datasolmut jne. Cassandra käsittelee kaikkia solmuja isäntinä, mikä tarkoittaa, että kaikki solmut ovat tasa-arvoiset ja suorittavat kaikki toiminnot.
HBase on optimoitu lukemiseen, kirjoittaminen tapahtuu vain isäntäsolmulle ja sillä on vahva johdonmukaisuus lukemisen jälkeen kirjoittamiseen. Cassandralla on erinomainen yksirivinen lukuteho, jos lopullinen johdonmukaisuus valitaan.
Hbase ei tue natiivisti toissijaisia ​​indeksejä, Cassandra tukee toissijaisia ​​indeksejä sarakeperheissä, joissa sarakkeen nimi on tiedossa.
Aluksi Hbase luotiin Googlessa ja he panivat sen nimeksi BigTable. Jo nyt Bigtable- ja HBase-sovellusliittymät ovat yhteensopivia. Cassandra on peräisin DynamoDB: n paperista, joka on AWS: n NoSQL-tietokanta.

Siirrytään seuraavaan HBase-haastattelukysymykseen.

3. Mitkä ovat Hbase: n tärkeimmät komponentit?

Vastaus:
HBase a: lla on kolme tärkeää komponenttia - HMaster, Region Server ja ZooKeeper.
i.HBase Master - HBase-taulukot on jaettu alueisiin. Samalla kun käynnistyspäällikkö päättää minkä alueen alueelle osoitetaan (aluepalvelin on klusterin solmu). Se käsittelee myös taulukon metatiedot -toimintoja, kuten luo tai muuta kaavaa. Tällä komponentilla on myös tärkeä rooli vian palautuksessa
ii. Aluepalvelin - Kuten edellä mainittiin, tässä tapahtuu todellisen datan kirjoittaminen ja lukeminen. Nämä ovat todellisia klusterisolmuja. Siinä on monien taulukoiden alueita, joista päätetään aloittamalla ja lopettamalla rivinäppäimet. Tyypillinen aluepalvelin voi palvella jopa tuhatta aluetta
iii.ZooKeeper - ZooKeeper on klusterien koordinointikehys, jota käytetään laajasti Hadoopin ekosysteemissä. Zookeeper seuraa kaikkia klusterin HMaster-yhteyshenkilöiden (pää- ja aluepalvelimia) ZooMeeter-yhteyshenkilöitä. ZooKeeper tuottaa ilmoituksia ja ilmoittaa virheistä.

4. Mikä on HBase Bloom Filter?

Vastaus:
Tämä on yleinen HBase-haastattelukysymys, jota haastattelussa esitetään. HBase Bloom -suodatin on tehokas mekanismi testata onko tallennustiedosto (Kun jotain kirjoitetaan HBaseelle, se kirjoitetaan ensin muistilaitteeseen, kun tämä muisti on saavuttanut tietyn koon, se huuhdellaan levylle tallennustiedostoon. ) sisältää tietyn rivin tai rivin sarakkeen solun. Normaalisti ainoa tapa päättää, onko rivinäppäin läsnä myymälätiedostossa, on tarkistaa tiedoston lohkoindeksi, jolla on kunkin tallennustiedoston lohkon aloitusrivinäppäin. Bloom-suodattimet toimivat muistin sisäisenä tietorakenteena, joka auttaa vähentämään levyn lukemista vain tiedostoihin, jotka todennäköisesti sisältävät kyseisen rivin - Kaikkia tiedostoja ei tallenneta. Joten se toimii kuin muistissa oleva hakemisto osoittaen todennäköisyyttä löytää rivi tietystä myymälätiedostosta.

5. Mikä on tiivistys? Selitä sen eri tyypit.

Vastaus:
HBase tallentaa kaikki vastaanotetut toiminnot muistimoduulialueelleen. Kun muistipuskuri on täynnä, se tyhjennetään levylle. Koska tämä voi luoda monia pieniä tiedostoja HDFS: ssä, HBase voi ajoittain valita tiedostoja, jotka tiivistetään yhdeksi suuremmaksi. Tiivistystä kutsutaan pieneksi, kun HBase valitsee vain joitain tiivistettävistä HFiles-tiedostoista, mutta ei kaikkia. Suurimmassa tiivistyksessä kaikki tiedostot valitaan tiivistettäviksi yhdessä. Suuri tiivistys toimii kuin pieni, paitsi että poistomerkit voidaan poistaa, kun ne on asennettu kaikkiin vastaaviin soluihin, ja myös kaikki saman solun ylimääräiset versiot hylätään.

Osa 2 - HBase-haastattelukysymykset (Advanced)

Katsokaamme nyt edistyneitä HBase-haastattelukysymyksiä.

6.Miten HBase-version tiedot?

Vastaus:
Kun dataosa lisätään / päivitetään / poistetaan, HBase luo uuden version sarakkeesta. Todellinen poistaminen tapahtuu vain tiivistyksen aikana. Jos tietty solu ylitti sallitut versiot, ylimääräiset versiot hylätään tiivistyksen aikana

7. Mikä on ero hakemisen ja skannauksen välillä?

Vastaus:
Get palauttaa vain yhden rivin Hbase-taulukosta annetun rivinäppäimen perusteella. Skannauskomento palauttaa rivijoukon annetusta hakuehdosta riippuen. Yleensä saat nopeammin kuin skannaus. Joten pitäisi mieluummin käyttää sitä jos mahdollista.

Siirrytään seuraavaan HBase-haastattelukysymykseen.

8. Mitä tapahtuu rivin poistamiselle?

Vastaus:
Poiston aikana komentodataa ei fyysisesti poisteta tiedostojärjestelmästä, vaan tehdään näkymättömäksi asettamalla merkki. Fysikaalinen poisto tapahtuu tiivistyksen aikana
Sarakkeen, version ja perheen poistomerkit ovat kolmen tyyppisiä merkkejä, jotka merkitsevät vastaavasti sarakkeen, sarakkeen version ja sarakeperheen poistoa.

9. Selitä ero HBase: n ja Hive: n välillä.

Vastaus:
Tämä on edistyksellinen HBase -haastattelukysymys, jota kysyttiin haastattelussa. HBase ja Hive ovat molemmat täysin erilaisia ​​Hadoop-pohjaisia ​​tekniikoita tietojenkäsittelyä varten. Hive on relaatiomainen SQL-yhteensopiva hajautettu tallennuskehys, kun taas HBase on NoSQL-avain-arvovarasto. Hive toimii abstraktiokerroksena Hadoopin päällä SQL-tuella. HBase-tiedonkäyttömalli on erittäin rajallinen kahdella päätoiminnolla - saat ja skannaa. HBase on ihanteellinen reaaliaikaiseen tietojenkäsittelyyn, missä Hive on ihanteellinen valinta eräajotietojen käsittelyyn.

10. Mitä ovat Hlog ja HFile?

Vastaus:
HLog on korvaava lokitiedosto, joka tunnetaan myös nimellä WAL ja HFile on todellinen tietojen tallennustiedosto. Tiedot kirjoitetaan ensin eteenkirjauslokitiedostoon ja kirjoitetaan myös MemStore-sovellukseen. Kun MemStore on täynnä, MemStoren sisältö huuhdellaan levylle HFiles-tiedostoon.

Suositeltava artikkeli

Tämä on opas luetteloon Hbase-haastattelua koskevista kysymyksistä ja vastauksista, jotta hakija voi helposti puuttua näihin Hbase-haastatteluun liittyviin kysymyksiin. Voit myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -

  1. Hyödyllisiä ryhmähaastattelukysymyksiä
  2. Tärkeitä perushaastatteluvihjeitä
  3. Haastattelun välttämättömät vaiheet Prep
  4. Haastattelukysymykset rahoituskandidaatilta