10 olennaista data-analyyttistä haastattelua koskevaa kysymystä (päivitetty vuodelle 2019)

Sisällysluettelo:

Anonim

Johdanto Data Analytics -haastatteluun liittyviin kysymyksiin ja vastauksiin

Joten olet vihdoin löytänyt unelmatyösi Data Analyticsissa, mutta ihmettelet, kuinka murtaa 2019 Data Analytics -haastattelu ja mitkä voisivat olla todennäköisiä Data Analytics -haastattelukysymyksiä. Jokainen Data Analytics -haastattelu on erilainen ja myös työn laajuus on erilainen. Pitäen tämän mielessä olemme suunnitelleet yleisimmät Data Analytics -haastattelukysymykset ja -vastaukset, joiden avulla voit menestyä Data Analytics -haastattelussa.

Alla on 2019 suosituinta dataanalytiikkahaastattelukysymystä, joita kysytään enimmäkseen haastattelussa

1. Mitä eroa tiedon louhinnan ja datan analysoinnin välillä on?

Vastaus:

Tietojen louhintaTietojen analysointi
Data Mining ei edellytä hypoteesiaTietoanalyysi alkaa hypoteesilla.
Data Mining vaatii puhdasta ja hyvin dokumentoitua tietoa.Tietojen analysointi sisältää tietojen puhdistamisen.
Tiedon louhinnan tuloksia ei aina ole helppo tulkita.Tietoanalyytikot tulkitsevat tulokset ja esittävät ne sidosryhmille.
Tietojen louhinnan algoritmit kehittävät automaattisesti yhtälöt.Tietoanalyytikkojen on kehitettävä omat yhtälönsä.

2. Mainitse mitkä ovat analyysiprojektin eri vaiheet?

Vastaus:
Tietoanalytiikka käsittelee tietojen keräämistä, puhdistamista, muuntamista ja mallinnusta arvokkaiden käsitysten saamiseksi ja paremman päätöksenteon tueksi organisaatiossa. Tietojen analysointiprosessiin osallistuvat seuraavat vaiheet -

Tietojen etsintä - Tutkittuaan yritysongelman, data-analyytikon on analysoitava ongelman perimmäinen syy.
Tietojen valmistelu - Tässä data-analyysiprosessin vaiheessa löydämme datan poikkeamia, kuten puuttuvat arvot tiedoista.
Datan mallintaminen - Mallintamisvaihe alkaa, kun data on valmisteltu. Mallintaminen on iteratiivinen prosessi, jossa mallia ajetaan toistuvasti parannuksia varten. Tietojen mallinnus varmistaa parhaan mahdollisen tuloksen liiketoimintaongelmaan.
Validointi - Tässä vaiheessa validoidaan asiakkaan tarjoama malli ja data-analyytikon kehittämä malli toisiaan vastaan ​​saadakseen selville, vastaako kehitetty malli liiketoiminnan vaatimuksia.
Mallin toteutus ja seuranta - Tässä data-analyysin viimeisessä vaiheessa toteutetaan malli ja sen jälkeen tehdään seuranta sen varmistamiseksi, että malli toteutetaan oikein vai ei?

3.Mikä dataanalyytikko vastaa?

Vastaus:
• Ratkaise asiakkaiden liiketoimintaan liittyvät ongelmat ja suorita tietojen tarkastustoimet.
• Tulkitse tietoa tilastollisin tekniikoin.
• Tunnista parannusmahdollisuuksien alueet.
• Analysoi, tunnista ja tulkitse monimutkaisten tietojoukkojen suuntauksia tai malleja.
• Hanki tietoja ensisijaisista tai toissijaisista tietolähteistä.
• Ylläpidä tietokantoja / tietojärjestelmiä.
• Etsi ja korjaa koodiongelmat suorituskykyindikaattoreiden avulla.
• Tietokannan suojaaminen käyttöjärjestelmää kehittämällä.

4.Mitä ovat hash-taulukon törmäykset? Kuinka sitä vältetään?

Vastaus:
Hajapöytätörmäys tapahtuu, kun kahdella eri avaimella on sama arvo. On olemassa monia tekniikoita, joilla vältetään hash-pöydän törmäykset, tässä luetellaan kaksi:
Erillinen ketjutus: Se käyttää tietorakennetta, joka hajautuu samaan paikkaan, useiden kohteiden tallentamiseksi.
Avoin osoittaminen: Se etsii muita lähtökohtia käyttämällä toista toimintoa ja tallentaa kohteen ensimmäiseen tyhjään paikkaan.

5. Luettelo parhaista työkaluista, jotka voivat olla hyödyllisiä tietojen analysoinnissa?

Vastaus:
•Kuvaelma
• RapidMiner
• OpenRefine
• KNIME
• Google-hakuoperaattorit
• Ratkaisin
• NodeXL
• io
• Wolfram Alfa
• Google Fusion Tables

6.Mitä eroa tiedon louhinnan ja tietojen profiloinnin välillä on?

Vastaus:
Ero datan louhinnan ja tietojen profiloinnin välillä on seuraava -
• Tietojen profilointi: Se kohdistaa yksittäisten ominaisuuksien, kuten hinnanvaihteluiden, erillisen hinnan ja niiden esiintymistiheyden, nolla-arvojen, tietotyypin, pituuden, välittömän analyysin.
• Tietojen louhinta: Se keskittyy riippuvuuksiin, sekvenssien löytämiseen, suhteiden pitämiseen useiden ominaisuuksien välillä, klusterianalyysiin, epätavallisten tietueiden havaitsemiseen jne.

7. Selitä K-keskimääräinen algoritmi ja hierarkkinen ryhmittelyalgoritmi?

Vastaus:
K-Mean Algorithm - K-keskiarvo on kuuluisa ositusmenetelmä. K-keskimääräisessä algoritmissa klusterit ovat pallomaisia, eli klusterin datapisteet ovat keskittyneet siihen klusteriin. Myös klusterien varianssi on samanlainen, eli kukin datapiste kuuluu lähimpään klusteriin
Hierarkkinen klusterointialgoritmi - Hierarkkinen klusterointialgoritmi yhdistää ja jakaa olemassa olevat ryhmät luomalla heille hierarkkisen rakenteen ryhmien jakamisjärjestyksen osoittamiseksi.

8.Mikä on tietojen puhdistus? Mainitse muutamia parhaita käytäntöjä, joita sinun on noudatettava tietojen puhdistamisen yhteydessä?

Vastaus:
Tietystä aineistosta on erittäin tärkeää lajitella tietojen analysointiin tarvittavat tiedot. Tietojen puhdistus on ratkaiseva vaihe, jossa dataa tarkastellaan poikkeamien löytämiseksi, toistuvien ja väärien tietojen poistamiseksi jne. Tietojen puhdistamiseen ei liity olemassa olevan tiedon poistamista tietokannasta, vaan se vain parantaa tiedon laatua, jotta sitä voidaan käyttää analyyseihin .
Joitakin tietojen puhdistamisen parhaita käytäntöjä ovat -
• Tietojen laadintasuunnitelman kehittäminen tunnistamaan, missä maksimaaliset tiedonlaatuvirheet tapahtuvat, jotta voit arvioida perussyy ja suunnitella sen mukaan.
• Noudata tavanomaista tapaa todistaa tarvittavat tiedot ennen tietojen syöttämistä.
• Tunnista kaikki päällekkäiset tiedot ja tarkista tietojen tarkkuus, koska se säästää paljon aikaa analyysin aikana.
• Kaikkien tietoihin suoritettujen parannustoimintojen seuraaminen on uskomattoman välttämätöntä, jotta voit toistaa tai poistaa kaikki tarvittavat toimenpiteet.

9.Mitä ovat tilastollisista menetelmistä, jotka ovat hyödyllisiä data-analyytikoille?

Vastaus:
Tietotieteilijälle hyödyllisiä tilastollisia menetelmiä ovat
• Bayesin menetelmä
• Markovin prosessi
• Spatiaaliset ja klusteriprosessit
• Sijoitustilastot, prosenttipiste, ulkopuolisten havaitseminen
• Laskentatekniikat jne.
• Yksinkertainen algoritmi
• Matemaattinen optimointi

10. Selitä, mikä on imputointia? Luettele erityyppiset imputointitekniikat? Mikä imputaatiomenetelmä on edullisempi?

Vastaus:
Imputoinnin aikana meillä on taipumus korvata puuttuva tieto korvatuilla arvoilla. Tällaisia ​​imputaatiotekniikoita ovat -
• Yksittäinen imputointi: Yksittäinen imputointi tarkoittaa, että puuttuva arvo korvataan arvolla. Tässä menetelmässä näytteen koko saadaan.
• Kuumakannen imputointi: Puuttuva arvo lasketaan satunnaisesti valitusta samanlaisesta tietueesta käyttämällä rei'ityskorttia
• Kylmäkannen imputtointi: Se toimii samalla tavalla kuin kuumakannen imputtointi, mutta hieman edistyneempi ja valitsee luovuttajat muista tietojoukoista
• Keskimääräinen imputointi: Tähän sisältyy puuttuvan arvon korvaaminen muiden muuttujien ennustetuilla arvoilla.
• Regression imputtaatio: Se tarkoittaa, että puuttuva arvo korvataan tietyn arvon ennustetuilla arvoilla muista muuttujista riippuen.
• Stokastinen regressio: Se on sama kuin regression imputtaatio, mutta se lisää yhteisen regressiovarianssin regression imputtaatioon
• Useita imputointeja: Toisin kuin yksi imputointi, useat imputoinnit arvioivat arvot useita kertoja

Vaikka yksittäistä imputointia käytetään laajalti, se ei heijasta epävarmuutta, joka puuttuu satunnaisesti puuttuvista tiedoista. Joten useat imputoinnit ovat edullisempia kuin yksittäiset imputoinnit, jos tiedot puuttuvat satunnaisesti.

Suositellut artikkelit

Tämä on ollut kattava opas Data Analytics -haastattelukysymyksiin ja vastauksiin, jotta ehdokas voi helposti hakea nämä Data Analytics -haastattelukysymykset. Voit myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -

  1. 10 hyödyllistä ketterää haastattelua koskevia kysymyksiä ja vastauksia
  2. 8 mahtavaa algoritmihaastattelukysymystä
  3. 25 tärkeintä tietotekniikan haastattelua koskevaa kysymystä
  4. 10 hämmästyttävää Data Engineer -haastattelua koskevaa kysymystä ja vastausta