Johdanto tiedonlouhintaan

Tässä artikkelissa aiomme oppia tiedonkeruun johdannosta, koska ihmiset ovat kaivanneet maata vuosisatojen ajan saadakseen kaikenlaisia ​​arvokkaita materiaaleja. Joskus kaivostoiminnan aikana maasta löydetään asioita, joita kukaan ei odottanut löytävänsä ensisijaisesti. Esimerkiksi vuonna 1898 Egyptin Saqqarassa sijaitsevan haudan löytön yhteydessä muumioiden löytämiseksi löydettiin puinen esine, joka muistutti tarkalleen lentokoneita. Se oli päivätty 200 eKr., Noin 2200 vuotta sitten! Mutta mitä mahdollisia tietoja voisimme saada suuresta joukosta tietoja? Ja vaikka aloitamme sen louhinnan, onko mahdollisuuksia saada odottamattomia tuloksia tietojoukosta? Ennen sitä katsotaanpa mitä tarkalleen on Data Mining.

Mikä on tiedon louhinta?

  • Pohjimmiltaan se on elintärkeän tiedon / tiedon poimiminen suuresta joukosta tietoja.
  • Ajattele tietoja suurena maanpinnanä / kallioisena pintana. Emme tiedä, mikä sen sisällä on, emme tiedä, onko kallioiden alla jotain hyödyllistä.
  • Tässä tiedonhankinnan johdannossa etsimme piilotettuja tietoja, mutta meillä ei ole käsitystä siitä, minkä tyyppisiä tietoja haluamme löytää ja mitä aiomme käyttää kerralla, löydämme ne.
  • Kuten konseptin perinteisessä louhinnassa, myös tiedon louhinnassa on erilaisia ​​tekniikoita ja työkaluja, jotka vaihtelevat louhittavan tietotyypin mukaan, joten olemme selvittäneet, mikä on tiedon louhinta tämän tiedon louhinnan johdanto-aiheen kautta.

Esimerkki tietojen louhinnasta

Olemme oppineet tiedon louhinnan perusteista yllä olevassa osassa ja jatkamme nyt tiedon louhinnan esimerkkejä, jotka on lueteltu alla:

  • Joten on olemassa mobiiliverkko-operaattori. He pyytävät Data Mineriä kaivaamaan operaattorin puhelutiedot. Data Minerille ei anneta erityisiä tavoitteita.
  • Annetaan määrällinen tavoite löytää vähintään 2 uutta mallia kuukaudessa.
  • Kun tiedonhakija alkaa kaivaa tietoja, hän löytää kuvion, että keskiviikkona kansainvälisiä puheluita on vähemmän kuin muina päivinä.
  • Tiedot jaetaan johdon kanssa, ja he laativat suunnitelman vähentää kansainvälisten puhelujen hinnat keskiviikkoisin ja käynnistää kampanjan.
  • Puheluhinnat nousevat, asiakkaat ovat tyytyväisiä alhaiseen puheluhintaan, enemmän asiakkaita ilmoittautuu ja yritys ansaitsee enemmän rahaa! Win-Win-tilanne!

Pitämällä yllä oleva esimerkki mielessä nyt tutkia tiedon louhinnan eri vaiheita.

Tietojen louhintaan liittyvät vaiheet

Olemme oppineet tiedon louhinnan perusteista yllä olevassa osassa ja siirrymme nyt eteenpäin tiedon louhintaan liittyvien vaiheiden kanssa, jotka luetellaan alla:

  • Liiketoiminnan ymmärtäminen

Tässä tiedonhankinnan johdannossa ymmärrämme liiketoiminnan tavoitteiden ja tarpeiden kaikki näkökohdat. Nykyistä tilannetta arvioidaan etsimällä resurssit, oletukset ja muut tärkeät tekijät. Siksi laaditaan hyvä johdatus tiedon louhintasuunnitelmaan sekä liiketoiminnan että tiedon louhinnan tavoitteiden saavuttamiseksi.

  • Tietojen ymmärtäminen

Aluksi tiedot kerätään kaikista käytettävissä olevista lähteistä. Sitten valitsemme parhaan tietojoukon, josta voimme poimia tiedot, mikä voisi olla hyödyllisempi.

  • Tietojen valmistelu

Kun tietojoukko on tunnistettu, se valitaan, puhdistetaan, rakennetaan ja muotoillaan haluttuun muotoon.

  • Tietojen mallintaminen

Se on prosessia annetun tiedon uudelleenmuokkaamiseksi käyttäjän vaatimusten mukaisesti. yksi tai useampi malli voitaisiin luoda valmisteltuun tietojoukkoon, ja lopuksi malleja on arvioitava huolellisesti ottamalla sidosryhmät mukaan varmistaakseen, että luodut mallit vastaavat liiketoiminnan aloitteita.

  • arviointi

Tämä on välttämätöntä prosessi tietojen louhinnassa. Se sisältää prosessin kaikkien osien läpikäynnin mahdollisten vikojen tai tietojen vuotojen tarkistamiseksi prosessissa. Myös uusia liiketoimintavaatimuksia voitaisiin nostaa löydettyjen uusien mallien takia.

  • käyttöönotto

Se tarkoittaa yksinkertaisesti tiedon esittämistä siten, että sidosryhmät voivat käyttää sitä halutessaan. Yllä olevassa esimerkissä havaittiin, että ulkomaanpuhelut olivat vähemmän keskiviikkoisin, joten nämä tiedot esiteltiin sidosryhmille, jotka puolestaan ​​käyttivät näitä tietoja etunaan ja kasvattivat voittojaan.

Tietojen louhintaan käytetyt tekniikat

Yllä olevassa osassa olemme oppineet tiedon louhinnan perusteista, nyt jatkamme tiedon louhinnassa käytettyjä tekniikoita, jotka on lueteltu alla:

  • Ryhmäanalyysi

Klusterianalyysi mahdollistaa tietyn käyttäjäryhmän tunnistamisen tietokannan yleisten ominaisuuksien mukaan. Näitä ominaisuuksia voisivat olla ikä, maantieteellinen sijainti, koulutustaso ja niin edelleen.

  • Poikkeamien havaitseminen

Sitä käytetään määrittämään, kun jokin eroaa huomattavasti normaalista kuviosta. Sitä käytetään poistamaan kaikki tietokannan epäjohdonmukaisuudet tai poikkeamat lähteellä.

  • Taantumisanalyysi

Tätä tekniikkaa käytetään ennusteiden tekemiseen tietojoukon sisäisten suhteiden perusteella. Esimerkiksi tietyn tuotteen osakekurssi voidaan ennustaa analysoimalla aiempaa kurssia ja ottamalla myös huomioon eri tekijät, jotka määräävät osakekurssin. Tai kuten alla esitetään, jos meillä on tietoja eri henkilöiden pituudesta ja painosta, voimme määrittää toisen arvon minkä tahansa pituuden tai painon perusteella.

  • Luokittelu

Tämä koskee asioita, joissa on etiketit. Huomaa klustereiden havainnoinnissa, että asioissa ei ollut merkintää siinä ja käyttämällä tietojen louhintaa meidän piti merkitä ja muotoilla klusteriksi, mutta luokittelussa on olemassa tietoa, joka voidaan helposti luokitella algoritmin avulla. Esimerkki on sähköpostin roskapostisuodattimet. Roskapostisuodatin toimitetaan sekä asiaankuuluvilla että roskapostisanomilla (Training Data). Molempien väliset erot tunnistetaan, jolloin se pystyy luokittelemaan tulevat sähköpostit oikein.

  • Yhdistävä oppiminen

Sitä käytetään analysoimaan, mitkä asiat yleensä tapahtuvat yhdessä joko pareittain tai suurempina ryhminä. Esimerkiksi ihmiset, joilla on taipumus ostaa sitruunoita, ostaa myös appelsiineja, ihmiset, jotka yleensä haluavat ostaa leipää, ostaa myös maitoa ja niin edelleen. Joten kaikkien asiakkaiden tekemät ostot analysoidaan ja yhdessä tapahtuvat asiat sijoitetaan lähellä toisiaan myynnin kasvattamiseksi. Joten maito sijoitetaan leivän lähelle, sitruunat asetetaan appelsiinien rinnalle ja niin edelleen.

Onko tiedon louhinta eettistä?

Joten suunnittelen viikonloppumatkaa Goaan ystävän kanssa, etsin internetistä hyviä käyntikohteita Goaan. Seuraavan kerran kun avaan Internetin, löydän mainoksia eri Goa-hotelleista oleskelua varten.

  • Hyvä asia?

Kyllä, Internet on auttanut minua yksinkertaistamaan matkaa. Loppujen lopuksi, jos päätin käydä Goassa, minun pitäisi nukkua jonnekin, ja hotelliin osoittava mainos on paljon hyödyllisempi kuin mainos, joka näyttää minulle satunnaisia ​​vaatteita ostaa.

  • Huono juttu?

Joo! Miksi tietokaivosyritys, jota en ole koskaan ennen kuullut, tietäisi mihin lomalla olen. Entä jos en ole kertonut kenellekään tästä matkasta, mutta täällä internet yhtäkkiä tietää, että menen sinne. Totuus on, että tiedonkaivosyrityksen liiketoimintamalli riippuu tästä. He keräävät nämä tiedot evästeiden ja komentosarjojen kautta, sitten myyvät ne mainostajille, jotka puolestaan ​​yrittävät myydä minulle jotain muuta (tässä tapauksessa hotellihuone).

Joten se voi olla hyvä tai huono riippuen siitä, kuinka katsomme sitä. Voimme myös poistaa kaikki evästeet käytöstä tai siirtyä incognito-tapaukseksi edellä mainitussa tapauksessa. Yksi asia on varma kaikesta huolimatta. Tietojen louhinta on täällä jäädäkseen.

Suositellut artikkelit

Tämä on opas tiedonkeruun perusteisiin. Tässä keskustellaan sen merkityksestä, tekniikoista ja vaiheista, jotka liittyvät tiedon louhinnan johdantoon esimerkillä ymmärtää paremmin. Voit myös tarkastella seuraavia artikkeleita saadaksesi lisätietoja -

  1. Tietojen louhinnan haastattelua koskevat kysymykset
  2. Ennustava analyysi vs. tiedon louhinta
  3. Tietojenkäsittelytieteen perusteet
  4. Mikä on regressioanalyysi?

Luokka: