Johdatus Data Martiin
Maailmasta on tulossa digitaalisempi ja jokainen organisaatio tuottaa useita petatavuja dataa. Data Mart on yksi tällainen tietojen luokittelu tietovarastoista, joissa keskittymä on yhteen aiheeseen.
Voimme sanoa, että kyseessä ovat tietyn osaston tai luokan tiedot, kuten myynti, rahoitus tai markkinointi jne. Periaatteessa se on tietovarastojen osajoukko. Koska keskitytään tiettyihin aiheisiin tai osastoihin, voidaan sanoa, että niiden lähde on rajoitettu tai se riippuu hyvin harvoista lähteistä.
Data Mart vs. Data Warehouse
Tietovarasto on varasto, jossa on kokoelma tietoja useista aiheen virroista. Ylläpito- ja valvontaosaa, kuten raakadatan keräämistä ja käsittelemistä, hoitavat pääasiassa yritystietotekniikan tietotekniikkaryhmät, jotka tarjoavat erilaisia palveluja emoyhtiöille.
Tietovarastoon viitataan myös keskus- tai yritystietovarastona. Joten tietovaraston lähde on useita, toisin kuin data mart, joka on joissain tapauksissa tietovaraston osajoukko.
Tyypit tiedot Mart
Tietomerkkejä on tyypiltään kolme. He ovat:
1. Riippuvainen tietovarasto
Riippuvainen tieto on puhtaasti tietovarastosta ja kaikki ryhmitetyt riippuvaiset muodostavat yrityksen tietovaraston. Se on puhtaasti tietovarastojen osajoukko, koska se on luotu keskus DW: stä.
Koska puhdasta ja tiivisteltyä tietoa on jo läsnä keskusvarastoissa, ETT-prosessi tai poimintamuunnos ja kuljetus on yksinkertaistettu. Meidän on vain tunnistettava tietty alajoukko täällä ja suoritettava ETT sen päällä.
Nämä datakartat on tyypillisesti rakennettu saavuttamaan parempi saatavuus ja paljon parempaa suorituskykyä paremmalla hallinnalla ja tehokkuudella.
2. Itsenäinen data Mart
Tätä ei luoda keskusdatasta, ja lähde tähän voi olla erilainen. Koska tiedot ovat muusta kuin DW ETT -prosessista, on hiukan erilainen.
Suurinta osaa riippumattomasta tiedonkäsittelyjärjestelmästä käyttää pienempi organisaatioiden ryhmä, ja myös tämän lähde on rajoitettu. Independent data mart luodaan yleensä, kun tarvitsemme ratkaisun suhteellisen lyhyessä ajassa.
3. Hybrididata Mart
Hybrididata mart antaa sinun ryhmitellä tiedot kaikista muista lähteistä kuin keskusdatasta DW. Kun käsittelemme ad hoc -integraatiota, siitä on paljon hyötyä kaikkien niiden tuotteiden huipputyöstä, jotka on lisätty organisaatioihin ulkoisesti.
Data Mart
Alla on joitain ominaisuuksia data mart:
- Koska tietolähde on keskitetty aiheeseen, käyttäjän vasteaikaa pidennetään sitä käyttämällä.
- Usein vaadittavissa tiedoissa datakarttojen käyttäminen on hyödyllistä, koska se on osa DW: n keskijohtoa ja siten datan koko on pienempi.
- Koska datan määrä on rajoitettu, prosessointiaika lyhenee melko keskimääräiseen DW-arvoon verrattuna.
- Ne ovat periaatteessa ketteriä ja ne voivat mukauttaa mallin muutokset melko nopeasti ja tehokkaasti verrattuna tietovarastoon.
- Datamart vaatii yhden aiheen asiantuntijan käsittelemään varastotietoihin verrattuna asiantuntemusta, jota vaadimme useissa aihevarastoissa. Tämän vuoksi sanomme, että data mart on ketterämpi.
- Voimme erotella pääsykategoriat matalaan tasoon ositetun datan avulla ja dat mart -menetelmällä, se on paljon helppoa.
- Infrastruktuuririippuvuus on melko vähäinen, ja tietoja voidaan tallentaa eri laitteistoalustoille segmentoinnin yhteydessä.
Vaiheet Data Martin toteuttamiseen
Alla on vaiheet, joita tarvitaan sen toteuttamiseen.
1. Suunnittelu
Tämä on ensimmäinen askel toteutuksessa, jossa kaikki tarvittavat tehtävät ja lähteet yksilöidään teknisen ja yritystiedon keräämistä varten. Myöhemmin looginen suunnitelma toteutetaan ja tarkastelun jälkeen se muunnetaan fyysiseksi suunnitelmaksi. Tässä päätetään myös datan loogisesta ja fyysisestä rakenteesta, kuten kuinka osioida data ja osiokenttä, kuten päivämäärä tai mikä tahansa muu tiedosto.
2. Rakentaminen
Tämä on toinen toteutusvaihe, jossa fyysiset tietokannat luotiin RDBMS: n avulla, joka määritettiin osana suunnitteluprosessia ja loogisia rakenteita. Kaikki objektit, kuten kaavio, hakemistot, taulukot, näkymät jne. Luodaan.
3. Väestö
Tämä on kolmas vaihe, ja tässä tietoja lisätään siinä tiedon hankkimisen yhteydessä. Kaikki vaaditut muunnokset toteutetaan ennen sen tietojen täyttöä.
4. Pääsy
Tämä on seuraava toteutusvaihe, jossa käytämme asuttuja tietoja kyselyihin raporttien luomiseen. Loppukäyttäjä käyttää tätä vaihetta ymmärtääksesi tiedot kyselyillä.
5. Toiminnanjohtaminen
Tämä on viimeinen vaihe tiedonhallinnan toteuttamisessa, ja tässä hoidetaan erilaisia tehtäviä, kuten pääsyn hallinta, järjestelmän optimointi ja tuoreen datan virittäminen, hallinta ja lisääminen data mart -sovellukseen ja suunnitelma palautusskenaarioihin mahdollisten vikatilanteiden hoitamiseksi.
Data Martin edut
Seuraavassa on joitain käytön eduista.
- Se on yksi parhaimmista kustannustehokkaista vaihtoehdoista tietovarastoon, jossa sinun on työskenneltävä vain pienen segmentin tietojen suhteen.
- Tietojen erottaminen lähteistä tekee dat mart -tehokasta, koska tietty ihmisryhmä voi käyttää tietyn lähteen tietoja sen sijaan, että käyttäisi kaikkia tietovarastoja.
- Nopeampi pääsy tietoihin on mahdollista käyttämällä data mart -sovellusta, jos tiedämme, mihin alajoukkoon tarvitsemme pääsyä.
- Datamart on paljon helpompi käyttää, jotta loppukäyttäjät voivat helposti kysyä päällekkäin.
- Toteutusajan saavuttaminen data mart vaatii vähemmän aikaa verrattuna tietovarastoon, koska tiedot on erotettu ryhmiin.
- Tietyn kohteen historiallisia tietoja voidaan käyttää helpoaseen trendianalyysiin.
johtopäätös
Koska se on keskittynyt yhdelle toiminnalliselle alueelle, siinä on lukuisia etuja sekä prosessin toteuttajalle että loppukäyttäjälle. Siksi tarvitaan tehokasta marts-toteutusta yhdessä organisaation tietovaraston kanssa.
Suositellut artikkelit
Tämä on opas Mikä on Data Mart. Tässä keskustellaan johdannosta, ominaisuuksista ja 3 tärkeimmästä tyypistä sekä sen ominaisuuksista ja vaiheista. Voit myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -
- Oracle-tietovarastointi
- R-tietotyypit
- Python-tietotyypit
- Cassandran datan mallintaminen
- Täydellinen opas tietomalliin Cassandrassa