Ero datatieteen ja tiedon louhinnan välillä
Tietojen louhinta tarkoittaa trendejen löytämistä tietojoukosta. Ja näiden suuntausten avulla tunnistetaan tulevat mallit. Se on tärkeä askel tietämyksen löytämisprosessissa. Siihen sisältyy usein valtavan määrän historiallisten tietojen analysointia, joka aiemmin jätettiin huomiotta. Data Science on tutkimusala, joka sisältää kaiken Big Data Analyticsista, Data Miningista, ennakoivasta mallinnuksesta, datan visualisoinnista, matematiikasta ja tilastoista. Datatieteelle on viitattu tieteen neljäntenä mallina. (muut kolme ovat teoreettinen, empiirinen ja laskennallinen). Akatemia tekee usein ainutlaatuista datatieteen tutkimusta.
Historiallinen näkökulma
Ennen kuin siirrymme teknisiin kuvauksiin, katsotaanpa termien kehitystä. Historiallinen tutkimus selventää, kuinka termejä käytetään tällä hetkellä.
- Sana 'Data Science' on ollut noin 1960-luvulla, mutta tuolloin sitä käytettiin vaihtoehtona 'Computer Science'. Tällä hetkellä sillä on täysin erilainen merkitys.
- Vuonna 2008 DJ Patil ja Jeff Hammerbacher tulivat ensimmäisinä henkilöiksi, jotka kutsuivat itseään Data Scientistsiksi kuvailemaan rooliaan LinkedInissä ja Facebookissa.
- Vuonna 2012 Harvard Business Review -artikkelissa mainitaan Data Scientist "2000-luvun seksikkäimmäksi työpaikaksi".
- Termi Data Mining on kehittynyt samanaikaisesti. Se tuli yleiseksi tietokantayhteisöissä 1990-luvulla.
- Data Mining velkaa sen alkuperän KDD: lle (tietokantojen tietokannat). KDD on prosessi, jolla etsitään tietoa tietokannoissa olevasta tiedosta. Ja Data Mining on tärkeä osaprosessia KDD: ssä.
- Tietojen louhinta käytetään usein vaihtokelpoisesti yhdessä KDD: n kanssa.
Vaikka nämä nimet ovat tulleet kuvaan itsenäisesti, ne tulevat usein esiin toisiaan täydentävinä, koska ne liittyvät loppujen lopuksi läheisesti tietoanalyysiin.
Head to Head -vertailu Data Science vs. Data Mining (Infographics)
Alla on Data Science Vs Data Mining -sovelluksen 9 parhainta vertailua
Esimerkki käyttötapaus
Mieti tilannetta, jossa olet merkittävä vähittäiskauppa Intiassa. Sinulla on 50 myymälää, jotka toimivat 10 suuressa Intian kaupungissa ja olet ollut toiminnassa 10 vuotta.
Oletetaan, että haluat tutkia viimeisen 8 vuoden tiedot löytääksesi makeisten myynnin määrän 3 kaupungin juhlakaudella. Jos se on tavoitteesi, suosittelen palkkaamaan henkilöä, jolla on Data Mining -osaamista. Data Miner todennäköisesti käyisi läpi vanhoihin järjestelmiin tallennetun historiallisen tiedon ja käyttäisi algoritmeja trendien purkamiseen.
Harkitse toista tapausta, jossa haluat tietää, mitkä makeiset ovat saaneet enemmän positiivisia arvosteluja. Tietolähteesi eivät välttämättä rajoitu tietokantoihin, ne voivat ulottua sosiaalisiin verkkosivustoihin tai asiakaspalauteviesteihin. Tässä tapauksessa ehdotukseni sinulle olisi palkata Data Scientist. Datatutkijana työskentelevä henkilö soveltuu paremmin algoritmien soveltamiseen ja tämän sosiaalis-laskennallisen analyysin suorittamiseen.
Tietotekniikan ja tiedon louhinnan tärkeimmät erot
Alla on ero tietotieteen ja tiedon louhinnan välillä
- Tietojen louhinta on toimintaa, joka on osa laajempaa tietopohjaista tietokantaprosessia (KDD), kun taas tietotekniikka on tutkimusala, aivan kuten sovellettava matematiikka tai tietotekniikka.
- Tietojenkäsittelyä tarkastellaan usein laajassa merkityksessä, kun taas tiedon louhintaa pidetään markkinarakona.
- Jotkin Data Mining -toiminnot, kuten tilastollinen analyysi, tietovirtojen kirjoittaminen ja kuvioiden tunnistaminen, voivat olla ristiriidassa Data Science: n kanssa. Siksi Data Miningista tulee tietotieteen osajoukko.
- Tietojen louhinnan koneoppimista käytetään enemmän kuvioiden tunnistukseen, kun taas datatieteessä sitä käytetään yleisemmin.
Huomautus
- Tietotiedettä ja tiedon louhintaa ei pidä sekoittaa Big Data Analyticsiin, ja sekä kaivostyöläiset että tutkijat voivat työskennellä isojen tietojoukkojen parissa.
Data Science Vs Data Mining -vertailutaulukko
Vertailun perusteet | Tietojen louhinta | Data Science |
Mikä se on? | Tekniikka | Alue |
fokus | Liiketoimintaprosessi | Tieteellinen tutkimus |
Päämäärä | Tee tiedoista käyttökelpoisempia | Tietokeskeisten tuotteiden rakentaminen organisaatiolle |
ulostulo | Kuviot | vaihteleva |
Tarkoitus | Aikaisemmin tuntemattomien suuntausten löytäminen | Sosiaalinen analyysi, ennustavien mallien rakentaminen, tuntemattomien tosiasioiden löytäminen ja paljon muuta |
Ammatillinen näkökulma | Joku, jolla on tietämys tietojen selaamisesta ja tilastollisesta ymmärtämisestä, voi suorittaa tiedon louhinnan | Ihmisen on ymmärrettävä koneoppiminen, ohjelmointi, tietografiikkatekniikat ja oltava verkkotunnustiedot tullakseen tietotieteilijäksi |
Laajuus | Tiedon louhinta voi olla osa tietotiedettä, koska kaivostoiminta on osa Data Science -hanketta | Monitieteinen - Tietotekniikka koostuu tiedon visualisoinnista, laskennallisesta yhteiskuntatieteestä, tilastoinnista, tiedonloukaisusta, luonnollisen kielen käsittelystä jne. |
Tarjoaa (tietotyyppi) | Enimmäkseen jäsennelty | Kaikentyyppiset tiedot - jäsennelty, osittain jäsentämätön ja jäsentämätön |
Muut vähemmän suositut nimet | Tietoarkeologia, tiedonkeruu, tiedonhaku, tiedonkeruu | Tietopohjainen tiede |
Johtopäätös - Data Science vs. Data Mining
Joten täällä! Olen varma, että nyt tiedät paremmin, mitkä ovat näiden kahden väliset keskeiset erot ja missä yhteydessä näitä kahta tulisi hyödyntää. Yksi asia, joka sinun tulee muistaa, ei ole tietotieteen ja tiedon louhinnan virallisia ja tarkkoja määritelmiä. Akateemisen ja teollisuuden keskuudessa käydään vielä keskustelua siitä, mikä on tarkka määritelmä. Kaikki ovat kuitenkin samalla sivulla korkean tason erojen ja kuvausten suhteen tässä artikkelissa tutkittuihin kahteen termiin.
Suositeltava artikkeli
Tämä on ollut opas Data Science Vs Data Mining -ohjelmaan, niiden merkitykseen, Head to Head -vertailuun, avainerot, vertailutaulukko ja johtopäätökset. Voit myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -
- Tietotiede ja sen kasvava merkitys
- 7 tärkeätä tiedon louhintatekniikkaa parhaan tuloksen saavuttamiseksi
- Ennustava analyysi vs. tietotiede - Opi 8 hyödyllistä vertailua
- 8 tärkeätä tietojen kaivostekniikkaa menestyvälle liiketoiminnalle