Johdanto pesän haastatteluun liittyviin kysymyksiin ja vastauksiin

Uudella datan aikakaudella Hive on avoimen lähdekoodin petabata-mittakaavan ETL- ja tietovarastoinfrastruktuurityökalupaketti, joka tallentaa jäsenneltyä ja jäsentämätöntä tietoa, joka perustuu hajautettuun tiedostojärjestelmään (HDFS).
valtavien tilavuustietojen analysointiin, kyselyyn ja louhintaan mahdollistamalla SQL-tyyppinen kieli nimeltään HiveQL (HQL) ja helppo kyselyn suorittaminen suunnittelemalla Hadoop MapReduce.

Hive on rakennettu Hadoopin päälle käsittelemään ja analysoimaan suuria tietoja ja tekee kyselyistä helppoja.
Pous on alun perin Facebookin luoma, myöhemmin Apache Software Foundation kehitti sitä edelleen ja kehitti sitä avoimeksi lähteeksi ja nimitti sen Apache Hiveksi. Nykyään on monia yrityksiä, jotka käyttävät Apache Hiveä Big Data -ratkaisuihinsa.

Jos etsit Hiveen liittyvää työtä, sinun on varauduttava 2018 Hive -haastattelukysymyksiin. Vaikka jokainen haastattelu on erilainen ja työn laajuus on myös erilainen, voimme auttaa sinua 2018 suosituimmissa pesien haastatteluun liittyvissä kysymyksissä ja vastauksissa, jotka auttavat sinua tekemään harppauksen ja saavuttamaan menestyksen haastattelussa.

Alla on luettelo pesien haastattelukysymyksistä, joita kysytään enimmäkseen haastattelussa. Nämä kysymykset on jaettu kahteen osaan, jotka ovat seuraavat:

Osa 1 - pesän haastattelua koskevat kysymykset (perus)

Tämä ensimmäinen osa kattaa perustiedot pesän haastatteluun liittyvistä kysymyksistä ja vastauksista.

1. Luettele pesän arkkitehtuurin eri komponentit?

Vastaus:
Hive-arkkitehtuurissa on viisi ydinosaa:
• Käyttöliittymä (UI): Se toimii kommunikaattorina käyttäjien ja ohjainten välillä, kun käyttäjä kirjoittaa kyselyt, jotka käyttöliittymä hyväksyy ja ajaa sitä ohjaimessa. Käytettävissä on kahta tyyppiä rajapintoja, joita ovat komentorivi ja GUI-rajapinta.
• Ohjain: Se ylläpitää HiveQL-kyselyn elinkaarta. Se vastaanottaa kyselyt käyttöliittymältä ja luo istunnon kyselyn käsittelemiseksi.
• Kääntäjä: Se vastaanottaa kyselysuunnitelmat ohjaimelta ja saa tarvittavat tiedot Metastoresta suunnitelman toteuttamiseksi.
• Metastore: Se tallentaa tiedot tiedoista taulukkona; se voi olla sisäinen tai ulkoinen pöytä. Se lähettää metatietotiedot kääntäjälle kyselyn suorittamiseksi.
• Suorita moottori: pesän palvelu suorittaa tuloksen suoritusmoottorissa; se suorittaa kyselyn MapReduce-prosessissa tietojen käsittelemiseksi. Se vastaa kaikkien näiden komponenttien kunkin vaiheen ohjaamisesta.

2. Mitä erityyppisiä tiloja Hive voi käyttää?

Vastaus:
Tämä on yleinen Hive-haastattelukysymys, jota haastattelussa esitetään. Pesä voi toimia kahdessa tilassa datan koon perusteella,
Nämä tilat ovat:
• Kartta vähentää -tila
• Paikallinen tila

3. Mitkä ovat skenaariot, joissa pesää voidaan käyttää eikä sitä voida käyttää?

Vastaus :
Kun luot tietovarastosovelluksia, kun tietosi ovat staattisia, kun sovelluksesi ei tarvitse suurta vasteaikaa, kun tietomäärä on valtava, kun tiedot eivät muutu nopeasti ja kun käytät kyselyjä komentosarjojen sijasta. Pesä tukee vain OLAP-tapahtumia, se ei sovellu OLTP-tapahtumiin.

Siirrytään seuraavaan pesän haastatteluun liittyviin kysymyksiin.

4. Mitä tiedostomuotoja Hive tukee? Luettele sovellustyypit, joita HIVE tukee?

Vastaus:
Oletuksena Hive tukee tekstitiedostomuotoa ja tukee myös binaaritiedostomuotoa, kuten sekvenssitiedosto, ORC-tiedostot, parketitiedostot, Avro-tiedostot.
• Sekvenssitiedosto: Se on yleensä binaarimuotoinen tiedosto, joka voidaan pakata ja on jaettavissa.
• ORC-tiedosto: Optimoitu rivisarakkotiedosto tallennetaan sarakepohjaiseen tiedostoon ja sarakekeskeiseen tallennustiedostoon.
• Parketitiedosto: Se on sarakekeskeinen binaaritiedosto, joka on erittäin tehokas suurten kyselyiden yhteydessä.
• Avro-tiedostot: Se on sama kuin sekvenssitiedostomuoto, joka on jaettavissa oleva, pakattava ja rivisuuntainen tiedosto.
Hivessä sallittu merkkijonotietojen enimmäiskoko on 2 Gt.

Hive on tietovarastokehys, joka soveltuu Java-, C ++-, PHP-, Python- tai Ruby-kirjoitettuihin sovelluksiin.

5. Mitä erityyppisiä taulukkoja on saatavana Hivessä?

Vastaus:
Hive-sovelluksessa on kahden tyyppisiä taulukoita:
• Hallitut taulukot: Tiedot ja kaaviot hallitsevat pesää.
• Ulkoiset taulukot: Ainoastaan ​​kaavio hallitsee pesää.

Osa 2 - pesän haastattelua koskevat kysymykset (Advanced)

Katsokaamme nyt edistyneempiä pesänhaastattelukysymyksiä.

6. Mikä on Metastore pesässä? Luetteloi ja selitä Hive Metastores -konfiguraation erityypit?

Vastaus:
Metan myymälää Hivessä käytetään metatietojen tallentamiseen, se on Hivessä oleva keskitetty arkisto. Se mahdollistaa metatietojen tallentamisen ulkoiseen tietokantaan. Oletuksena Hive tallentaa metatiedot Derby-tietokantaan, mutta niitä voidaan tallentaa myös muihin tietokantoihin, kuten Oracle, MySql jne.
Metastore-määrityksiä on kolme tyyppiä:
• Sulautettu metastore: Se on oletustila; se voi käyttää paikallisesti pesän kirjastoa, kaikki komentorivitoiminnot suoritetaan sulautetussa tilassa. Hive-palvelu, metastore-palvelu ja tietokanta toimivat samassa JVM: ssä.
• Paikallinen metastore: Se tallentaa tiedot ulkoiseen tietokantaan, kuten MySql tai Oracle. Hive-palvelu ja metastore-palvelu toimivat samassa JVM: ssä, se muodostaa yhteyden tietokantaan, joka on käynnissä erillisessä JVM: ssä.
• Etäinen metastore: Se käyttää etämoodia kyselyiden suorittamiseen, tässä metastore-palvelu ja pesäpalvelu suoritetaan erillisessä JVM: ssä. Sinulla voi olla useita metastore-palvelimia saatavuuden lisäämiseksi.

7. Mikä on pesän kyselyprosessori? Mitkä ovat pesän kyselyprosessorin eri komponentit?

Vastaus:
Tämä on haastattelussa usein kysyttyjä pesänhaastattelukysymyksiä. Hive Query Processor -sovellusta käytetään SQL: n muuntamiseen MapReduce-töihin. Työt suoritetaan riippuvuusjärjestyksen perusteella.
Hive Query Processor -komponentit on lueteltu alla:
• Semanttinen analysaattori
• UDF ja UDAF
• Optimizer
• Operaattori
• Parser
• Suoritusmoottori
• Tyyppitarkistus
• Loogisen suunnitelman luominen
• Fyysisen suunnitelman luominen

8. Mikä on Object-Inspectorin toiminnot pesässä?

Vastaus:
Se koostuu pesästä, jota käytetään tunnistamaan yksittäisten sarakkeiden rakenne ja riviobjektien sisäinen rakenne. Monimutkaisiin objekteihin, jotka on tallennettu useisiin muotoihin, pääsee Object-Inspector -ohjelmalla.
Object-Inspector tunnistaa objektin rakenteen ja tapoja käyttää objektin sisäisiä kenttiä.

Siirrytään seuraavaan pesän haastatteluun liittyviin kysymyksiin.

9. Millä tavoin sovellukset voidaan yhdistää Hive Server -palvelimeen?

Vastaus:
Sovelluksia voidaan yhdistää Hive-palvelimeen kolmella tavalla:
• Säästöasiakas: Tätä käytetään kaikkien pesän komentojen suorittamiseen eri ohjelmointikielellä, kuten Java, C ++, PHP, Python tai Ruby.
• ODBC-ohjain: Tämä tukee ODBC-protokollaa
• JDBC-ohjain: Tämä tukee JDBC-protokollaa

10. Mikä on oletuksena luku- ja kirjoitusluokat Hivessä?

Vastaus:
Alla on Hivessä käytettävissä olevat luku- ja kirjoituskurssit:
• TextInputFormat - Tätä luokkaa käytetään tietojen lukemiseen selkeästi.
• HiveIgnoreKeyTextOutputFormat - Tätä luokkaa käytetään tietojen kirjoittamiseen selkeässä muodossa.
• SequenceFileInputFormat - Tätä luokkaa käytetään tietojen lukemiseen Hadoop Sequence-tiedostomuodossa.
• SequenceFileOutputFormat - Tätä luokkaa käytetään tietojen kirjoittamiseen Hadoop Sequence-tiedostomuodossa.

Suositeltava artikkeli

Tämä on opas luetteloon pesän haastattelua koskevista kysymyksistä ja vastauksista, jotta hakija voi helposti torjua nämä pesän haastattelua koskevat kysymykset. Voit myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -

  1. 5 suosituinta DBA-haastattelua koskevaa kysymystä ja vastausta
  2. 12 upeinta GitHub -haastattelukysymystä ja -vastausta
  3. 15 tärkeintä Ruby -haastattelua koskevaa kysymystä ja vastausta
  4. 10 suosituinta HBase-haastattelua koskevaa kysymystä