Mikä on koneoppiminen?
Koneoppiminen on pieni keinotekoisen älykkyyden sovellusalue, jossa koneet oppivat automaattisesti toiminnoista ja hienovaraisuudesta antamaan paremman tuloksen. Kerättyjen tietojen perusteella koneilla on taipumus pyrkiä parantamaan tietokoneohjelmia vaaditun tuotoksen mukaisiksi. Koska kone pystyy oppimaan itse, näiden tietokoneiden nimenomaista ohjelmointia ei tarvita. Se on jo tunkeutunut elämäämme kaikkialla, ilman että meitä tiedämme. Käytännössä jokainen käyttämämme kone ja viimeisen vuosikymmenen aikana havaitsemiemme edistyksellisten tekniikoiden koneet ovat sisällyttäneet koneoppimisen tuotteiden laadun parantamiseksi. Joitakin esimerkkejä koneoppimisesta ovat itse ajavat autot, edistyneet verkkohaut, puheentunnistus.
Ihmisten päätavoite on kehittää koneiden oppimisalgoritmi tavalla, joka auttaa koneita oppimaan automaattisesti ilman minkäänlaista ihmisen puuttumista. Oppiminen riippuu syötettävistä tiedoista, joissa koneet tarkkailevat ja tunnistavat joitain malleja ja suuntauksia. Jokaisen uuden tietopisteen myötä koneen ymmärtäminen paranee ja lähtö on paremmin kohdistettu ja luotettava. Tiedot voivat olla numeerisia arvoja, suoria kokemuksia, kuvia jne., Mikä myös osaltaan auttaa meitä lähestymään kaikkia ongelmia, jotka halusimme korjata koneoppimisen avulla. Lisäksi on olemassa erityyppisiä koneoppimismenetelmiä tarvittavan tulostyypin perusteella.
Ero perinteisen ohjelmoinnin ja koneoppimisen välillä
Tavanomainen ohjelmointi = Logic on ohjelmoitu + Data syötetään + Logic ajaa dataa + Lähtö
Koneoppiminen = Tiedot syötetään + Odotettu lähtö syötetään + Suorita se koneella algoritmin kouluttamiseksi tulosta ulostuloon. Lyhyesti sanottuna, anna sen luoda oman logiikan päästäkseen tulosta tulosteen + Koulutettuun algoritmiin, jota käytetään testitietoihin ennustamiseen
Koneoppimismenetelmät
Meillä on neljä päätyyppiä koneoppimismenetelmiä, jotka perustuvat sellaiseen oppimiseen, jota odotamme algoritmeilta:
1. Ohjattu koneoppiminen
Ohjattuja oppimisalgoritmeja käytetään, kun tuotos luokitellaan tai merkitään. Nämä algoritmit oppivat syötetystä aikaisemmasta tiedosta, jota kutsutaan harjoitustiedoksi, suorittaa analyysin ja käyttää tätä analyysiä ennustamaan uusien tietojen tulevia tapahtumia tunnetuissa luokituksissa. Testitietojen tarkka ennustaminen vaatii suuria tietoja, jotta kaavoista olisi riittävä käsitys. Algoritmia voidaan kouluttaa edelleen vertaamalla koulutuksen tuotoksia todellisiin ja käyttämällä virheitä algoritmien modifiointiin.
Esimerkki tosielämästä:
- Kuvien luokittelu - algoritmi saadaan syöttämällä merkittyjä kuvatietoja. Algoritmi on koulutettu ja odotetaan, että uuden kuvan tapauksessa algoritmi luokittelee sen oikein.
- Markkinaennuste - Sitä kutsutaan myös regressioksi. Historialliset markkinatiedot syötetään tietokoneelle. Analyysi- ja regressioalgoritmilla ennustetaan tulevaisuuden uusi hinta muuttujista riippuen.
Siirrytään seuraavaan koneoppimismenetelmien päätyyppiin.
2. Ohjaamaton koneoppiminen
Valvomattomia oppimisalgoritmeja käytetään, kun emme ole tietoisia lopputuloksista ja luokittelua tai merkittyjä tuotoksia ei ole käytettävissä. Nämä algoritmit tutkivat ja luovat funktion kuvaamaan täysin piilotetut ja merkitsemättömät kuviot. Siksi ei ole oikeaa tulosta, mutta se tutkii tietoja saadakseen tuntemattomia rakenteita leimaamattomasta tiedosta.
Esimerkki tosielämästä:
- Klusterointi - Data, jolla on samanlaisia piirteitä, pyydetään ryhmittelemään algoritmin avulla, tätä ryhmittelyä kutsutaan klusteriksi. Ne osoittautuvat hyödyllisiksi näiden ryhmien tutkimuksessa, joita voidaan soveltaa kokonaan klusterin tietoihin enemmän tai vähemmän.
- Korkean ulottuvuuden tiedot - Korkean ulottuvuuden tietojen käsittely ei yleensä ole helppoa. Valvomattoman oppimisen avulla korkean ulottuvuuden datan visualisointi on mahdollista
- Generatiiviset mallit - Kun algoritmi analysoi ja tulostaa todennäköisyyden jakauman, sitä voidaan käyttää uuden tiedon tuottamiseen. Tämä osoittautuu erittäin hyödylliseksi tapauksissa, joissa puuttuu tietoja.
3. Vahvistuskoneiden oppiminen
Tämäntyyppiset koneoppimisalgoritmit käyttävät kokeilu- ja virhemenetelmää tulosteen vaihtamiseen funktion suurimman hyötysuhteen perusteella. Tulosta verrataan virheiden ja palautteen selvittämiseen, jotka palautetaan järjestelmään järjestelmän suorituskyvyn parantamiseksi tai maksimoimiseksi. Malli on varustettu palkinnoilla, jotka ovat periaatteessa palautetta ja rangaistuksia sen toiminnassa suorittaessaan tiettyä tavoitetta.
4. Puolivalvottu koneoppiminen
Nämä algoritmit suorittavat normaalisti leimattua ja leimatonta dataa, kun leimaamattoman datan määrä on suuri verrattuna leimattuun tietoon. Koska se toimii sekä valvottujen että valvomattomien oppimisalgoritmien kanssa ja niiden välillä, sitä kutsutaan siksi puoliohjattuksi koneoppimiseksi. Näitä malleja käyttävien järjestelmien nähdään parantaneen oppimisen tarkkuutta.
Esimerkki - Kuva-arkisto voi sisältää vain osan sen merkinnöistä, esim. Koiran, kissan, hiiren ja suuren osan kuvia ei ole merkitty.
Algoritmien tuotoksen tyyppiin perustuvat mallit
Alla on tyyppisiä koneoppimismalleja, jotka perustuvat sellaisiin tuloksiin, joita odotamme algoritmeilta:
1. Luokittelu
Tulojen luokat on jaettu, järjestelmä tuottaa harjoitustiedoista mallin, jossa se osoittaa uudet tulot yhdelle näistä luokista
Se kuuluu ohjatun oppimisen alaan. Tosielämän esimerkki voi olla roskapostisuodatus, jossa sähköpostit ovat syötettä, joka luokitellaan ”roskapostiksi” tai “ei roskapostiksi”.
2. Regressio
Regressioalgoritmi on myös osa ohjattua oppimista, mutta ero on siinä, että tulosteet ovat jatkuvia muuttujia eivätkä erillisiä.
Esimerkki - Asuntojen hintojen ennustaminen aiempien tietojen perusteella
3. Mitat pienentäminen
Tämäntyyppinen koneoppiminen liittyy panosten analysointiin ja niiden pelkistämiseen vain merkityksellisiin, joita käytetään mallin kehittämiseen. Ominaisuuksien valinta, ts. Syöttövalinta ja ominaisuuksien poimiminen, ovat lisäaiheita, joita on harkittava ymmärtääksesi paremmin ulottuvuuden vähentämistä.
Edellä esitettyjen eri lähestymistapojen perusteella on olemassa useita algoritmeja, jotka on otettava huomioon. Jotkut erittäin yleiset algoritmit ovat lineaarinen ja logistinen regressio, K-lähimmät naapurit, päätöksentekopuut, tukivektorikoneet, Random Forest jne. Näiden algoritmien avulla monimutkaisilla päätöksenteko-ongelmilla voi olla suunnatunne, joka perustuu valtavaan määrään dataa . Tämän tarkkuuden ja mahdollisuuksien saavuttamiseksi tarvitaan lisäresursseja sekä aikaa. Keinotekoisen älykkyyden ja muun tekniikan ohella käytetty koneoppiminen on tehokkaampaa tietojen käsittelyssä.
Suositellut artikkelit
Tämä on ollut opas koneoppintyypeille. Tässä keskustelimme käsitteestä, erilaisesta menetelmästä ja erilaisesta mallista algoritmeille. Voit myös käydä läpi muiden ehdotettujen artikkeleidemme saadaksesi lisätietoja -
- Koneoppimistekniikat
- Mikä on syvä oppiminen
- Mikä on koneoppiminen?
- Johdanto koneoppimiseen
- Hyperparametrinen koneoppiminen