HBase-arkkitehtuuri - Konsepti ja komponentit - Ominaisuudet ja edut

Sisällysluettelo:

Anonim

Johdatus HBase-arkkitehtuuriin

HBase on avoimen lähdekoodin hajautettu avainarvon mukainen tiedontallennusjärjestelmä ja sarakekeskeinen tietokanta, jolla on korkea kirjoituslähtö ja matala viiveaikainen satunnainen luku. HBasea käyttämällä voimme suorittaa online-reaaliaikaista analysointia. HBase-arkkitehtuurilla on vahva satunnainen luettavuus. HBase-ohjelmistossa data hajautetaan fyysisesti niin kutsuttuihin alueisiin. Jokaista aluetta isännöi yksi aluepalvelin, ja yksi tai useampi alue on vastuussa jokaisesta aluepalvelimesta. HBase-arkkitehtuuri koostuu isäntä-orja-palvelimista. Ryhmässä HBase on yksi isäntäsolmu nimeltä HMaster ja useita aluepalvelimia nimeltään HRegion Server (HRegion Server). Jokaisessa alueellisessa palvelimessa on useita alueita - alueita.

HDFS-tallennusmekanismi

HDFS: ssä tiedot tallennetaan taulukkoon yllä esitetyllä tavalla.

Jokaisessa rivissä on avain.

Sarake: Se on kokoelma tietoja, jotka kuuluvat yhteen sarakeperheeseen ja sisältyvät rivin sisään.

Sarakeperhe: Jokainen sarakeperhe koostuu yhdestä tai useammasta sarakkeesta.

Jokainen taulukko sisältää kokoelman sarakeperheistä. Nämä sarakkeet eivät ole osa järjestelmää.

HBaseessa on dynaamiset sarakkeet. Eri soluissa voi olla erilaisia ​​sarakkeita, koska sarakkeiden nimet koodataan solujen sisälle

Sarakkeen pätevyysvaatimukset: Sarakkeen nimi tunnetaan sarakkeen myöntäjänä.

HBase -arkkitehtuurikomponentit

HBase-arkkitehtuurissa on pääelementtejä: HMaster ja Region Server. Alueellinen HBase-tietojen tallennus.

1. HMaster

HMaster-solmu on kevyt ja sitä käytetään alueen määrittämiseen palvelinalueelle.

Hmasterilla on joitain päävastuuta, jotka ovat:

  • Joidenkin hallintotehtävien suorittaminen, kuten lataus, tasapainotus, datan luominen, päivittäminen, poistaminen jne.

Vastuu muutoksista kaavassa tai META-tietojen muutoksista asiakassovelluksen suunnan mukaan

  • HMaster hoitaa suuren osan DDL-työstä HBase-taulukoissa.

Jotkut menetelmistä, jotka HMaster Interface paljastaa, ovat pääasiassa. META-datakeskeiset menetelmät.

  • Taulukko (luo, poista, ota käyttöön, poista käytöstä, poista taulukko)
  • ColumnFamily (lisää sarake, muuta saraketta)
  • Alue (siirrä, määritä)

Asiakas kommunikoi sekä HMasterin että ZooKeeperin kanssa kaksisuuntaisesti. Se ottaa suoraan yhteyttä HRegion-palvelimiin lukea ja kirjoittaa toimintoja. HMaster määrittelee alueet alueen palvelimille ja puolestaan ​​tarkistaa alueellisten palvelimien terveydentilan.

2. Aluepalvelin

Voimme saada karkean kuvan aluepalvelimesta alla olevan kaavion avulla.

Aluepalvelimet ovat työskenteleviä solmuja, jotka käsittelevät asiakkaiden lukemista, kirjoittamista, päivittämistä ja poistamista koskevat pyynnöt. Region Server on kevyt, se toimii kaikissa Hadoop-klusterin solmuissa. Aluepalvelimen päätehtävänä on tallentaa tiedot alueille ja suorittaa asiakaspyyntöjä. Toinen HBase Region Server -palvelimen tärkeä tehtävä on käyttää automaattisen sharding-menetelmän avulla kuormituksen tasapainotusta jakamalla HBase-taulukko dynaamisesti, kun se tulee liian suureksi datan lisäämisen jälkeen.

HMaster voi ottaa yhteyttä useisiin HRegion-palvelimiin ja suorittaa seuraavat toiminnot:

  • Johtaminen ja alueiden isäntä
  • Jakaa alueet automaattisesti
  • Lukemista ja kirjoittamista koskevien pyyntöjen käsittely
  • Suora asiakasviestintä

3. HDFS

HDFS tarkoittaa Hadoop Distributed File -järjestelmää. Se tallentaa jokaisen tiedoston useisiin lohkoihin ja toistaa lohkot Hadoop-klusterin läpi vikasietoisuuden ylläpitämiseksi. HDFS tarjoaa korkean vikasietoisuuden ja toimii halpojen materiaalien kanssa. Käyttämällä halpoja raaka-ainelaitteita solmujen lisäämiseen klusteriin ja käsittelemällä ja tallentamalla se antaa asiakkaalle parempia tuloksia kuin nykyisellä laitteistolla. HDFS ottaa yhteyttä HBase-komponentteihin ja tallentaa paljon tietoa hajautetulla tavalla.

4. Eläintarhanhoitaja

Eläintarhanhoitaja on avoimen lähdekoodin projekti. HMaster ja HRegionServers rekisteröivät itsensä ZooKeeperiin.
Se tarjoaa erilaisia ​​palveluja, kuten kokoonpanotietojen ylläpitämistä, nimeämistä, hajautetun synkronoinnin tarjoamista jne. Hajautettu synkronointi on prosessi, jolla tarjotaan solmupisteiden välisiä koordinointipalveluita pääsemään käynnissä oleviin sovelluksiin. Siinä on lyhytaikaiset solmut, jotka edustavat aluepalvelimia. Pääpalvelimet etsivät näitä solmuja käytettävissä olevista palvelimista.

Näitä solmuja käytetään myös verkon osioiden ja palvelinvikojen seuraamiseen. Eläintarhanhoitaja on vuorovaikutteinen väline asiakasalueen palvelimen välillä. Jos asiakas haluaa kommunikoida aluepalvelimen kanssa, eläintarhanhoitaja on heidän välinen viestintäväline.

Kuinka haku alkaa HBase-arkkitehtuurissa

Kuten tiedät, ZooAn tallentaa META-pöydän sijainnin. Aina kun asiakas lähestyy tai kirjoittaa HBase-pyyntöjä, menettely on seuraava.

Asiakas selvittää ZooKeeperistä, kuinka sijoittaa heille META-pöytä. Sitten asiakas pyytää heiltä asianmukaista riviavainta META-taulukosta aluepalvelimen sijaintiin pääsemiseksi. Kun META-taulukko sijaitsee, asiakas tallentaa nämä tiedot välimuistiin. Asiakas ei saa viitata heihin META-taulukkoon, ennen kuin ja jos aluetta siirretään tai siirretään. Sitten META-palvelinta pyydetään uudestaan ​​ja välimuisti päivitetään. Kuten aina, asiakkaat eivät tuhlaa aikaa aluepalvelimen sijainnin löytämiseen META-palvelimella, joten se säästää aikaa ja nopeuttaa hakua.

ominaisuudet

Hadoopin kanssa on helppo integroida lähteestä samoin kuin määränpäähän.

Hajautettua tallennustilaa, kuten HDFS, tuetaan.

Siinä on hajasaantiominaisuus käyttämällä sisäistä Hash-taulukkoa tietojen tallentamiseksi nopeampia hakuja varten HDFS-tiedostoihin.

HBase-arkkitehtuurin edut

  • Ne voivat tallentaa suuria tietojoukkoja
  • Voimme jakaa tietokannan
  • Gigatavuista petatavuihin kustannustehokas
  • Suuri käytettävyys replikoinnin ja epäonnistumisen kautta

HBase-arkkitehtuurin haitat

  • SQL-rakenne ei tue
  • Ei tue tapahtumaa
  • Vain avaimella lajiteltu
  • Klusterin muistiongelmat

johtopäätös

HBase on yksi nonSql-sarakekeskeisestä hajautetusta tietokannasta apachessa. Kun verrataan Hadoopiin tai Hiveen, HBase toimii paremmin, kun haetaan vähemmän tietueita. Joten tässä artikkelissa keskustelimme HBase-arkkitehtuurista ja sen tärkeistä komponenteista.

Suositellut artikkelit

Tämä on ollut opas HBase-arkkitehtuuriin. Tässä keskustelimme käsitteestä, komponenteista, ominaisuuksista, eduista ja haitoista. Voit myös käydä läpi muiden ehdotettujen artikkeleidemme saadaksesi lisätietoja -

  1. Mikä on Big Data Technology?
  2. HDFS vs HBase mikä on parempi
  3. Mikä on kokouskieli?
  4. Johdanto HTML: ään