Johdanto ETL-haastatteluun liittyviin kysymyksiin ja vastauksiin

ETL tarkoittaa Extract-Transform-Load. Se on tietovaraston järjestelmäpohja, jossa tiedot uutetaan eri lähteistä ja sitten tiedot muutetaan, missä tiedot pannaan täytäntöön tai käsitellään, jotta saadaan laatu, tietojen yhdenmukaisuus asianmukaisessa esitysmuodossa ja lopulta Tiedot ladataan Data Varastoon esitysmuodossa, jotta se voi auttaa loppukäyttäjää saamaan tietoja helposti ja päättämään.

Alla on 2019. vuoden suosituimmat ETL-haastattelukysymykset, joita kysytään usein haastattelussa

Jos etsit työtä, joka liittyy ETL: ään, sinun on varauduttava 2019: n ETL: n haastattelukysymyksiin. Vaikka jokainen haastattelu on erilainen ja työn laajuus on myös erilainen, voimme auttaa sinua ETL-haastatteluun liittyvissä kysymyksissä ja vastauksissa, jotka auttavat sinua tekemään harppauksen ja saamaan menestyksen haastattelussa.

Osa 1 - ETL-haastattelukysymykset (perus)

Tämä ensimmäinen osa kattaa ETL-haastattelun peruskysymykset ja vastaukset

1. Laajenna tietovarasto ETL-järjestelmää? Selittää

Vastaus:
Extract-Transform-Load (ETL) -järjestelmä on tietovaraston perusta. Oikein suunniteltu ETL-järjestelmä poimii tiedot lähdejärjestelmistä, valvoo tietojen laatu- ja johdonmukaisuusstandardeja, vahvistaa tiedot siten, että erillisiä lähteitä voidaan käyttää yhdessä, ja toimittaa lopulta tiedot esitysvalmiissa muodossa, jotta sovelluskehittäjät voivat rakentaa sovelluksia ja loppukäyttäjiä osaa tehdä päätöksiä.

2. ETL-järjestelmän merkitys tietovarastossa?

Vastaus :
Poistaa virheet ja korjaa puuttuvat tiedot. Se tarjoaa dokumentoidut mitat luotettavuuteen tietoihin. Kaappaa valtioiden rajat ylittävän tiedon kulun säilyttämistä varten. Säätää useiden lähteiden tietoja käytettäväksi yhdessä. Rakentaa tiedot loppukäyttäjän työkalujen käytettäväksi.

3. Mikä on päivittäinen prosessi ETL-järjestelmässä?

Vastaus :
Luo ETL-prosessien kehitys-, testi- ja tuotantosarja. Ymmärrä erilaisten takahuoneen tietorakenteiden, mukaan lukien litteät tiedostot, normalisoidut skeemit, XML-skeemat ja tähtien liittymis (kaavamaiset) kaaviot, vaihto. Analysoi ja ota lähdetiedot. Rakenna kattava tietojen puhdistusosajärjestelmä. Yhdistä tiedot ulottuvuusskeemiin tehokkaimmalle toimitukselle loppukäyttäjille, yritystiedon työkaluille, tiedon louhintatyökaluille, OLAP-kuutioille ja analyyttisille sovelluksille. Toimita tietoja tehokkaasti sekä keskitetysti että syvällisesti hajautettuihin tietovarastoihin käyttämällä samoja tekniikoita. Viritä koko ETL-prosessi parhaan mahdollisen suorituskyvyn saavuttamiseksi.

Siirrytään seuraavaan ETL-haastatteluun liittyviin kysymyksiin.

4. Tietomuodot ETL-järjestelmässä?

Vastaus :
ETL: ssä on erilaisia ​​tietomuotoja, joista jotkut ovat tasotiedostoja, XML-tietojoukkoja, riippumattomia DBMS-työtaulukoita, normalisoituja olosuhteita (E / R) -malleja ja mittatietomalleja.

5. Tietojen profilointi ETL-järjestelmässä?

Vastaus :
Datan profilointi on tietolähteen laadun, laajuuden ja kontekstin systemaattinen tutkiminen, jotta ETL-järjestelmä voidaan rakentaa. Yhdessä ääripäässä erittäin puhdas tietolähde, joka on ylläpidetty hyvin ennen sen saapumista tietovarastoon, vaatii minimaalisen muutoksen ja ihmisen väliintulon lataamiseksi suoraan lopullisiin mittataulukoihin ja tietotaulukoihin.

6. Mikä on ETL-validoija?

Vastaus :
ETL Validator on tietojen testaustyökalu, joka yksinkertaistaa huomattavasti tietojen integrointi-, tietovarasto- ja tiedonsiirtohankkeiden testausta. Se käyttää patentoitua ELV-arkkitehtuuriamme tietojen purkamiseen, lataamiseen ja validointiin tietolähteistä, kuten tietokannoista, tasotiedostoista, XML-, Hadoop- ja BI-järjestelmistä.

Osa 2 - ETL-haastattelut (Advanced)

Katsokaamme nyt edistyneitä ETL-haastattelukysymyksiä.

7. Mitkä ovat ETL-järjestelmän toiminnot?

Vastaus :
Seuraavat kolme toimintoa: Poistaa tiedot kansainvälisestä järjestelmästäsi, joka voi olla Oracle, Microsoft tai mikä tahansa muu relaatiotietokanta, Muuntaa tiedot suorittamalla tietojen puhdistustoimenpiteitä. Lataus on prosessi, jolla tietoja kirjoitetaan kohdetietokantaan.

8. Nimeä joitain markkinoilla eniten käytettyjä ETL-työkaluja?

Vastaus:
Markkinoilla käytetään erilaisia ​​ETL-työkaluja, mutta jotkut kosteasti suosituista ETL-työkaluista
• Oracle Warehouse Builder (OWB)
• SAP-datapalvelut.
• IBM Infosphere Information Server.
• SAS-tietojen hallinta.
• Power Center Informatica.
• Elixir-ohjelmisto Data ETL: lle.
• Tietojen siirtäjä (IBI)
• SQL-palvelimen integrointipalvelut (SSIS)

9. Mitkä ovat ETL-ryhmän roolit ja vastuut?

Vastaus:
ETL-ryhmän korkeimmalla tasolla tehtävänä on rakentaa tietovaraston takahuone.
• Toimita tiedot tehokkaimmin loppukäyttäjän työkaluille
• Lisää arvoa puhdistuksen ja vastaavien vaiheiden tietoihin
• Suojaa ja dokumentoi tietolähde
• Tietojen poimiminen alkuperäisistä lähteistä
• Laadunvarmistus- ja puhdistustiedot
• Tunnisteiden ja saavutettavien tietojen mittojen yhdenmukaistaminen
• johdonmukaisuus alkuperäisten lähteiden välillä
• Tietojen toimittaminen fyysisessä muodossa, jota kyselytyökalut voivat käyttää,
• Raportoi kirjoittajia ja kojetauluja.

Siirrytään seuraavaan ETL-haastatteluun liittyviin kysymyksiin.

10. Mikä on vaikutusanalyysin rooli ETL-järjestelmässä?

Vastaus:
Vaikutusanalyysi tutkii objektiin liittyviä metatietoja (tässä tapauksessa taulukko tai sarake) ja määrittää, mihin vaikuttaa rakenteen tai sisällön muutos. Tietojen vaiheistusobjektien muuttaminen voi rikkoa prosessit, jotka ovat välttämättömiä tietovaraston oikean lataamisen kannalta. Ad-hoc-muutosten salliminen tiedonsiirto-objekteihin on haitallinen projektin onnistumiselle. Kun taulukko on luotu vaiheistusalueelle, sinun on suoritettava vaikutusanalyysi ennen siihen tehtäviä muutoksia. Monet ETL-työkalujen myyjät tarjoavat vaikutusanalyysitoiminnot, mutta tämä toiminto jätetään usein huomiotta ETL-tuotteen konseptikuvauksen aikana, koska se on takahuone-toiminto ja
Ei oikeastaan ​​tärkeätä, ennen kuin tietovarasto on valmis ja käynnissä ja alkaa kehittyä.

11. Kuinka käsittelet kiinteän pituisen litteän tiedoston?

Vastaus:
Kiinteän pituisen tiedostoasettelun tulisi sisältää tiedostonimi kentän alkamiskohdasta; sen pituus; ja sen tietotyyppi (yleensä teksti tai numero). Joskus pääteasento toimitetaan. Jos ei, sinun on laskettava kunkin kentän loppusijainti sen alkamisaseman ja pituuden perusteella, jos sitä vaatii ETL-työkalusi. Useimmissa ETL-työkaluissa sinun on todennäköisesti kirjoitettava manuaalisesti kiinteän tiedoston tiedostoasettelu kerran. Kun asettelu on annettu, työkalu muistaa asettelun ja odottaa saman asettelun joka kerta kun se toimii todellisen litteän tiedoston kanssa. Jos tiedoston asettelu muuttuu tai data siirtyy pois osoitetuista sijainneista, ETL-prosessi on ohjelmoitava epäonnistumaan. Kun käsittelet kiinteän pituisia litteitä tiedostoja, yritä varmistaa, että tiedostossa olevien tietojen sijainnit ovat oikeat. Nopea tarkistus paikkojen vahvistamiseksi on testata mikä tahansa päivämäärä- (tai aika) -kenttä varmistaaksesi, että se on kelvollinen päivämäärä. Jos paikkoja siirretään, päivämääräkenttä sisältää todennäköisesti aakkosmerkkejä tai epäloogisia numeroita. Muut kentät, joissa on hyvin erityisiä verkkotunnuksia, voidaan testata samalla tavalla. XML tarjoaa konkreettisempia validointikykyjä. Jos tietojen validointi tai johdonmukaisuus on ongelma, yritä vakuuttaa tietojen toimittaja toimittamaan tiedot XML-muodossa.

12.Miksi reaaliaikainen ETL tietovarastoissa?

Vastaus:
Tietovarasto tarvitsi horjumattoman tietosarjan tarjoamisen liiketoiminnan päättäjille tarjoamalla luotettavan tietopohjan, jolla seistä. Ajankohtaista raportointia tuikottavan tietokannan avulla yrityskäyttäjät ohjattiin tuotantosovelluksiin, jotka johtavat yritystä. Siksi käyttäjien piti mennä tietovarastoon historiallisen kuvan siitä, mitä liiketoiminnassa tapahtui eilen, ja heidän täytyi etsiä monia OLTP-järjestelmiä saadakseen kuvan tänään tapahtuvasta. Liiketoiminnan käyttäjät eivät koskaan hyväksyneet tätä eroa täysin. Tietovarastot tietysti tarvitsevat ehdottomasti jatkuvia asiakasinformaatioita toiminnasta, mutta yhä enemmän operatiiviset järjestelmät luottavat myös tietovarastojen rikastumiseen asiakastietojen kanssa. Siksi on ennustettavissa, että organisaatiot ovat alkaneet tutkia arkkitehtuurivaihtoehtoja, jotka voivat tukea yleisempiä integraatioskenaarioita, jotka liikuttavat operatiivista dataa sovellusten välillä ja samanaikaisesti varastoon ja varastosta yhä kiireellisemmällä tavalla.

Suositellut artikkelit

Tämä on ollut opas luetteloon ETL: n haastattelua koskevista kysymyksistä ja vastauksista, jotta hakija voi helposti torjua näitä ETL: n haastattelukysymyksiä. Voit myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -

  1. Azure Paas vs Iaas - Ominaisuudet
  2. 9 hämmästyttävää MapReduce -haastattelua koskevia kysymyksiä ja vastauksia
  3. 11 suosituinta RDBMS-haastattelua koskevaa kysymystä ja vastausta
  4. 10 upeinta PHP-haastattelukysymystä kokeneille
  5. Tutustu 5 suosituimpaan DBA-haastatteluun liittyvään kysymykseen ja vastaukseen

Luokka: