Johdanto ohjaamattomaan koneoppimiseen

Oletko koskaan miettinyt, kuinka lapsi pystyy erottamaan omenat ja appelsiinit, kun hän ei tiedä, millaiset ne ovat, mistä maistuu, mutta värin ja koon perusteella hän voi jakaa ne kahteen ryhmään ilman ennakkotietoja? Voimmeko odottaa samaa segmentointia kuin lapsi koneista, jos väri- ja kokotiedot annetaan? Katsotaan kuinka voimme tehdä sen! Tässä aiheesta aiomme oppia valvomattomasta koneoppimisesta.

Koneoppiminen, kuten termi viittaa, opetamme koneita tekemään ihmisen kaltaisia ​​tehtäviä ja kuinka ihmiset oppivat joko jollekulta tai havainnoimalla. Kuten ihmiset, tapa, jolla kone oppii.

Koneoppiminen voidaan jakaa kolmeen osaan: -

  1. Ohjattu oppiminen
  2. Ohjaamaton oppiminen
  3. Vahvistusoppiminen

Koneoppimisen tyypit

Vahvistusoppiminen on edustajapohjaista oppimista, johon sisältyy palkitseminen ja rankaiseminen edustajan tekemistä toimista. Lopputavoitteena on maksimoida yleinen hyöty ympäristöstä oppimisprosessissa.

Kun sinulla on tulo- ja lähtödataa, lyhyesti sanottuna, merkittyjä tietoja, esimerkiksi annettu pituus ja paino sen määrittämiseksi, onko henkilö mies vai nainen, voidaan pitää valvotuina oppimistehtävinä (jonkun toimesta ihmisissä).

Mutta monissa tosielämän skenaarioissa tämä merkitty tai merkitty tieto ei ole aina saatavissa. Usein kohtaamme ongelmia objektien segmentoinnissa niiden ominaisuuksien perusteella, joita ei nimenomaisesti mainita. Kuinka ratkaista tämä ongelma? No, ohjaamaton oppiminen on ratkaisu.

Wikipedia kertoo, että ohjaamaton oppiminen on eräänlainen itse organisoitu hebbilainen oppiminen, joka auttaa löytämään aiemmin tuntemattomia malleja tietojoukosta ilman aiempia merkintöjä. Valvomattomassa oppimisessa meillä ei ole merkintätietoja, mutta haluamme silti saada tietoa tiedoista sen eri ominaisuuksien perusteella.

Tyypit ohjaamattomasta koneoppimisesta

Ohjaamattomat oppimistehtävät voidaan jakaa laajasti kolmeen luokkaan:

  1. Yhdistyssääntöjen louhinta
  2. klustereiden
  3. Suositusjärjestelmä

1. Yhdistyssääntöjen louhinta

Kun meillä on jonkin kaupan tietoja, se voi olla myytyjen tuotteiden kohdalla tai mitä tahansa asiaan liittyviä transaktiotietoja, haluan tietää, onko ostajan ja tuotteiden tai tuotteiden välillä piilotettu suhde, jotta voin jollain tavalla hyödyntää näitä tietoja lisätä myyntiäni. Näiden suhteiden purkaminen on Association Rule Mining -toiminnan ydin. Voimme käyttää AIS-, SETM-, Apriori-, FP-kasvualgoritmeja suhteiden purkamiseen.

2. Klusterointi

Ryhmittelyyn voidaan tehdä mitä tahansa tietoa, jos meillä ei ole luokka- tai etikettitietoja. Haluamme ryhmitellä tiedot siten, että havainnot, joilla on samanlaiset ominaisuudet, kuuluvat samaan klusteriin / ryhmään ja klusterien välisen etäisyyden tulisi olla suurin. Klusterien sisäisen etäisyyden tulisi olla vähimmäis. Voimme ryhmitellä äänestäjien tiedot selvittääksemme mielipiteen hallituksesta tai klusterituotteista niiden ominaisuuksien ja käytön perusteella. Segmentoi populaatio tulojen perusteella tai käytä klusterointia myynnissä ja markkinoinnissa.

Voimme käyttää K-välineitä, K-välineitä ++, K-Medoideja, sumeaa C-välinettä (FCM),

Odotukset-maksimointi (EM), agglomeratiivinen klusterointi, DBSCAN, hierarkkisen klusteroinnin tyypit yhtenä linkityksenä, täydellinen linkitys, mediaaniyhteys, Wardin menetelmäalgoritmit klusterointiin.

3. Suositusjärjestelmä

Suositusjärjestelmä on periaatteessa jatko assosiaatiosääntöjen louhinnalle siinä mielessä, että ARM: ssä puretaan suhteita ja suositusjärjestelmässä käytämme näitä suhteita suosittelemaan jotain, jolla loppukäyttäjällä on suuremmat hyväksymismahdollisuudet. Suositusjärjestelmät ovat saaneet suosiota sen jälkeen, kun Netflix julkisti 1 000 000 dollarin palkinnon vuonna 2009.

Suositusjärjestelmät toimivat transaktiotietoihin, olivatpa ne sitten finanssitapahtumia, verkkokauppaa tai ruokakauppoja. Nykyään verkkokaupan jättiläispelaajat houkuttelevat asiakkaita antamalla räätälöityjä suosituksia jokaiselle käyttäjälle heidän aiemman ostohistoriansa ja vastaavien käyttäytymistietojensa perusteella muilta käyttäjiltä.

Menetelmät suositusjärjestelmien kehittämiseksi voidaan jakaa laajasti yhteistyösuodatukseen ja sisältöpohjaiseen suodatukseen. Yhteistyöllisessä suodatuksessa meillä on jälleen kerran käyttäjän ja käyttäjän yhteistyösuodatus ja tuote-esineyhteistyösuodatus, jotka ovat muistipohjaisia ​​lähestymistapoja. Matriisin tekijämääritys ja Singular Value Decomposition (SVD) ovat mallipohjaisia ​​lähestymistapoja.

Ohjaamattoman oppimisen sovellukset

Koska maailman tieto kasvaa valtavasti päivä päivältä, ohjaamattomalla oppimisella on monia sovelluksia. Luomme tietoja aina sosiaalisen median alustoilla tai jollain videosisällöllä YouTubessa. Usein emme edes tee tietoisesti. Kaikki tämä tieto on jäsentämätöntä, ja sen merkitseminen valvottuihin oppimistehtäviin on väsyttävää ja kallista.

Seuraavassa on joitain hienoja sovelluksia ohjaamattomasta koneoppimisesta.

  1. Ruokakauppa tai verkkokauppa / kauppapaikka: Pura Association -säännöt asiakkaiden transaktiotiedoista ja suositukset kuluttajille tuotteiden ostamiseksi.
  2. Sosiaalisen median alusta: Pura suhteet eri käyttäjiin ehdottaa tuotteita tai palveluita. Suosittele uusia ihmisiä sosiaaliseen yhteyteen.
  3. Palvelut: Matkapalveluiden suositukset, talojen vuokraussuositukset tai matchmaker-palvelut.
  4. Pankkitoiminta: Ryhmäasiakkaat rahoitustransaktioidensa perusteella. Klusterin petollinen tapahtuma petosten havaitsemiseksi.
  5. Politiikka: Klusterin äänestäjien mielipiteet voiton mahdollisuuksista tietylle puolueelle.
  6. Tietojen visualisointi: Ryhmittelyllä ja t-hajautetulla stokastisella naapurien upottamisella (t-SNE) voimme visualisoida korkeaulotteisen datan. Tätä voidaan käyttää myös ulottuvuuden pienentämiseen.
  7. Viihde: Suositukset elokuville, musiikille, kuten Netflix ja Amazon tekevät.
  8. Kuvan segmentointi: Ryhmäkuvien osat lähimpien pikseliarvojen perusteella.
  9. Sisältö: henkilökohtaiset sanomalehdet, verkkosivujen suositukset, e-oppimissovellukset ja sähköpostisuodattimet.
  10. Rakenteellinen löytö: Klusteroinnin avulla voimme löytää kaikki piilotetut rakenteet tiedoista.Klusterin twitter-tiedot sentimenttianalyysiä varten.

johtopäätös

Ohjaamaton koneoppiminen ei ole liian mitattavissa, mutta se voi ratkaista monia ongelmia, joissa valvotut algoritmit epäonnistuvat. Valvomattomaan oppimiseen on monia sovelluksia monilla aloilla, joilla meillä on jäsentämätöntä ja merkitsemätöntä tietoa. Voimme käyttää valvomattomia oppimistekniikoita opettamaan koneitamme tekemään paremman työn kuin me. Viime vuosina koneet ovat menestyneet paremmin ihmisissä tehtävissä, joita ihmisten katsotaan ratkaisevan vuosisatojen ajan. Toivon, että tämän artikkelin avulla ymmärsit, mikä on ja kuinka valvomattomia koneoppimistekniikoita voidaan käyttää reaalimaailman ongelmien ratkaisemiseen.

Suositellut artikkelit

Tämä on opas ohjaamattomaan koneoppimiseen. Tässä keskustellaan koneoppimisen tyypeistä ja valvomattomien koneoppimisen tyypeistä sekä sen sovelluksista. Saatat myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -

  1. Koneoppimisen algoritmit
  2. Mikä on koneoppiminen?
  3. Johdanto koneoppimiseen
  4. Konetyökalut
  5. Klusterointi koneoppimisessa
  6. Hyperparametrinen koneoppiminen
  7. Hierarkkinen klusterointialgoritmi
  8. Hierarkkinen ryhmittely | Agglomeratiivinen ja jakautuva klusterointi
  9. Koneoppimisen elinkaaren kahdeksan tärkeintä vaihetta

Luokka: