Johdatus ohjattavaan oppimiseen

Ohjattu oppiminen on koneoppimisen alue, jossa työskentelemme ennustamaan arvoja merkittyjen tietojoukkojen avulla. Leimattuja syöttötietojoukkoja kutsutaan itsenäisiksi muuttujiksi, kun taas ennustettuja tuloksia kutsutaan riippuvaisiksi muuttujiksi, koska ne riippuvat tuloksistaan ​​riippumattomasta muuttujasta. Esimerkiksi meillä kaikilla on roskapostikansio sähköpostitilillämme (esim. Gmail), joka havaitsee automaattisesti suurimman osan roskapostista / petoksista sinulle yli 95% tarkkuudella. Se perustuu valvottuun oppimismalliin, jossa meillä on koulutussarja merkittyjä tietoja, jotka ovat tässä tapauksessa käyttäjien ilmoittamat spam-sähköpostit. Näitä koulutusjoukkoja käytetään oppimiseen, joita käytetään myöhemmin luokittelemaan uudet sähköpostiviestit roskapostiksi, jos se sopii luokkaan.

Työskentely ohjatussa koneoppimisessa

Ymmärtäkäämme valvotun koneoppimisen esimerkin avulla. Oletetaan, että meillä on hedelmäkori, joka on täynnä erilaisia ​​hedelmälajeja. Meidän tehtävämme on luokitella hedelmät kategoriansa perusteella.

Tapauksessamme olemme harkinneet neljä hedelmätyyppiä, ja ne ovat omena, banaani, viinirypäleet ja appelsiinit.

Nyt yritämme mainita joitain näiden hedelmien ainutlaatuisista ominaisuuksista, jotka tekevät heistä ainutlaatuisia.

S Ei.

Koko Väri Muoto

Etunimi

1

Pieni Vihreä Pyöreä ja soikea, nipun muotoinen lieriömäinen

viinirypäle

2

Iso Punainen Pyöreä muoto, yläosassa syvennys

Omena

3

Iso Keltainen Pitkä kaareva sylinteri

Banaani

4 Iso Oranssi Pyöristetty muoto

Oranssi

Sanotaan nyt, että olet noudettu hedelmä hedelmäkorista, tarkastelit sen ominaisuuksia, esimerkiksi sen muotoa, kokoa ja väriä, ja päätät sitten, että hedelmän väri on punainen, koko, jos se on iso, muoto on pyöristetty ja yläosassa on syvennys, joten se on omena.

  • Samoin teet saman myös kaikille muille jäljellä oleville hedelmille.
  • Oikein oikeanpuoleinen sarake (”Hedelmän nimi”) tunnetaan vastemuuttujana.
  • Näin muotoilemme valvotun oppimismallin, nyt jokaiselle uudelle (sanotaan robotti tai muukalainen), jolla on tietyt ominaisuudet, on melko helppoa ryhmitellä samantyyppiset hedelmät helposti.

Ohjatun koneoppimisalgoritmin tyypit

Katsotaanpa erityyppisiä koneoppimisalgoritmeja:

Regressio:

Regressiota käytetään ennustamaan yksittäisen arvon ulostulo harjoitustietojoukon avulla. Lähtöarvoa kutsutaan aina riippuvaiseksi muuttujaksi, kun syötöt tunnetaan riippumattomana muuttujana. Esimerkiksi ohjatussa oppimisessa on erityyppisiä regressioita,

  • Lineaarinen regressio - Täällä meillä on vain yksi riippumaton muuttuja, jota käytetään lähtön ennustamiseen eli riippuvainen muuttuja.
  • Moninkertainen regressio - Täällä on enemmän kuin yksi riippumaton muuttuja, jota käytetään lähtön ennustamiseen eli riippuvainen muuttuja.
  • Polynominen regressio - Tässä riippuvaisten ja riippumattomien muuttujien välinen kuvaaja seuraa polynomifunktiota. Esimerkiksi aluksi muisti kasvaa iän myötä, sitten se saavuttaa kynnyksen tietyssä iässä ja sitten alkaa vähentyä vanhetessamme.

Luokittelu:

Ohjattujen oppimisalgoritmien luokitusta käytetään ryhmittelemään samanlaisia ​​kohteita yksilöllisiin luokkiin.

  • Binaariluokitus - Jos algoritmi yrittää ryhmitellä 2 erillistä luokaryhmää, sitä kutsutaan binaariluokitukseksi.
  • Moniluokkainen luokittelu - Jos algoritmi yrittää ryhmitellä kohteita useampaan kuin kahteen ryhmään, niin sitä kutsutaan moniluokkaiseksi luokitukseksi.
  • Vahvuus - Luokittelualgoritmit toimivat yleensä erittäin hyvin.
  • Puutteet - taipumus liialliseen asennukseen ja voivat olla rajoittamattomia. Esimerkki - sähköpostin roskapostin luokittelu
  • Logistinen regressio / luokittelu - Kun Y-muuttuja on binaariluokka (eli 0 tai 1), käytämme ennustamiseen logistista regressiota. Esimerkki - Ennustetaan, onko tietty luottokorttitapahtuma petollinen vai ei.
  • Naiivien Bayes-luokittelijat - Naiivien Bayes-luokittelija perustuu Bayesin lauseeseen. Tämä algoritmi soveltuu yleensä parhaiten, kun tulojen mitat ovat suuret. Se koostuu asyklisistä kaavioista, joissa on yksi vanhemmista ja monista lapsista. Lapsi solmut ovat riippumattomia toisistaan.
  • Päätöksipuut - Päätöspuu on puukarttamainen rakenne, joka koostuu sisäisestä solmusta (ominaisuuden testi), haarasta, joka osoittaa testin tuloksen, ja lehden solmuista, jotka edustavat luokkien jakautumista. Juurisolmu on ylin solmu. Se on erittäin laajalti käytetty tekniikka, jota käytetään luokitukseen.
  • Tukivektorikone - Tukivektorikone on tai SVM tekee luokittelutyön etsimällä hypertaso, jonka pitäisi maksimoida marginaali 2 luokan välillä. Nämä SVM-koneet on kytketty ytimen toimintoihin. Kentät, joissa SVM: ää käytetään laajasti, ovat biometriset tiedot, kuvion tunnistus jne.

edut

Seuraavassa on joitain valvottujen koneoppimismallien eduista:

  1. Mallien suorituskyky voidaan optimoida käyttökokemuksen avulla.
  2. Ohjattu oppiminen tuottaa tuotoksia aikaisemman kokemuksen avulla ja antaa myös mahdollisuuden kerätä tietoja.
  3. Ohjattuja koneoppimisalgoritmeja voidaan käyttää toteuttamaan useita reaalimaailman ongelmia.

haitat

Ohjatun oppimisen haitat ovat seuraavat:

  • Ohjattujen koneoppimallien kouluttaminen voi viedä paljon aikaa, jos aineisto on suurempi.
  • Suurten tietojen luokittelu on joskus suurempi haaste.
  • Yksilaitteiden ongelmat on ehkä käsiteltävä.
  • Tarvitsemme paljon hyviä esimerkkejä, jos haluamme mallin toimivan hyvin, kun koulutamme luokittelijaa.

Hyvät käytännöt oppimismallien luomisessa

Se on hyvä käytäntö rakennettaessa ohjattuja oppimiskoneita: -

  1. Ennen hyvän koneoppimismallin rakentamista on suoritettava tietojen esikäsittelyprosessi.
  2. On valittava algoritmi, joka sopii parhaiten tiettyyn ongelmaan.
  3. Meidän on päätettävä, minkä tyyppisiä tietoja käytetään harjoitusjoukkoon.
  4. Tarvitsee päättää algoritmin ja funktion rakenteesta.

johtopäätös

Artikkelissamme olemme oppineet, mitä on ohjattu oppiminen, ja huomasimme, että täällä koulutamme mallia merkittyjen tietojen avulla. Sitten tutkittiin mallien ja niiden erityyppien työskentelyä. Viimeinkin näimme näiden valvottujen koneoppimisalgoritmien edut ja haitat.

Suositellut artikkelit

Tämä on opas mitä on Ohjattu oppiminen ?. Tässä keskustellaan ohjatun oppimisen käsitteistä, sen toiminnasta, tyypeistä, eduista ja haitoista. Voit myös käydä läpi muiden ehdotettujen artikkeleidemme saadaksesi lisätietoja -

  1. Mikä on syvä oppiminen
  2. Ohjattu oppiminen vs. syväoppiminen
  3. Mitä Java-synkronointi on?
  4. Mikä on web hosting?
  5. Tapoja luoda päätöksentekopuu etuineen
  6. Polynominen regressio | Käyttö ja ominaisuudet

Luokka: