Johdatus koneoppimisalgoritmien tyyppeihin

Koneoppimisen algoritmityypit tai AI-laskelmat ovat ohjelmia (matematiikka ja perusteet), jotka modifioivat itsensä toimimaan paremmin, koska ne esitetään lisätietoon. Jonkin osan AI: n ”mukauttaminen” merkitsee sitä, että nämä projektit muuttavat tapaa, jolla he käsittelevät tietoja jonkin ajan kuluttua, samoin kuin ihmiset muuttavat sitä, miten he käsittelevät tietoja oppimalla. Joten koneoppiminen tai AI-laskenta on ohjelma, jolla on tietty menetelmä muuttaa sen omia parametreja, kun kritisoidaan aiempia näyttely-odotuksia tietojoukolle.

Kaikentyyppiset koneoppimisalgoritmit

Heidän tietyt lajit, joilla voidaan kuvata koneoppimisen algoritmityyppejä, mutta yleensä ne voidaan jakaa luokkiin motivaationsa perusteella, ja perusluokitukset ovat mukana:

  1. Ohjattu oppiminen
  2. Ohjaamaton oppiminen
  3. Puolivalvottu oppiminen
  4. Vahvistusoppiminen

Mikä on ohjattu oppiminen

Ohjattu oppiminen on paikka, jossa voit harkita oppimisen ohjausta. Meillä on tietojoukko, joka jatkaa kouluttajana, ja sen tehtävänä on mallin tai koneen valmistelu. Kun malli valmistautuu, se voi alkaa asettua odotukseen tai valintaan, kun sille annetaan uutta tietoa.

Esimerkki ohjatusta oppimisesta:

  1. Saat paljon valokuvia tiedoilla siitä, mitä niissä on ja sen jälkeen koulutat mallin havaitsemaan uusia valokuvia.
  2. Sinulla on paljon tietoa asuntojen hinnoista niiden koon ja sijainnin perusteella ja syötät mallin ja koulutat sitä, niin voit ennustaa muiden talojen hinnat syöttämiesi tietojen perusteella.
  3. Jos haluat ennustaa, että viestisi on roskapostia tai ei perustu vanhempana viestisi, voit ennustaa, että uusi viesti on roskapostia.

Ohjattu oppimisalgoritmi on seuraava:

1) Lineaarinen regressio

lineaarinen regressio on arvokas löydettäessä yhteys kahden pysyvän tekijän välillä. Yksi on ennustaja tai autonominen muuttuja ja toinen on reaktion tai seurauksen muuttuja. Se etsii mitattavaa suhdetta, mutta ei determinististä suhdetta. Kahden tekijän välisen yhteyden sanotaan olevan deterministinen siitä mahdollisuudesta, että toinen muuttuja voidaan viestiä tarkasti toisella. Esimerkiksi lämpötilaa Celsius-asteessa käytettäessä on mahdollista ajatella Fahrenheit täsmällisesti. Tosiasiallinen suhde ei ole tarkka päätettäessä yhteydestä kahden tekijän välillä. Esimerkiksi kytkentä jonnekin pituuden ja painon välillä. Keskeisenä ajatuksena on saada rivi, joka sopii parhaiten tietoon. Paras sovituslinja on linja, jolle kaikki ennustevirheet (kaikki tietokeskittymät) ovat niin pieniä kuin olosuhteissa voidaan odottaa. Virhe on pisteen erottaminen regressioviivaan.

2) päätöspuut

Päätöspuu on päätöksenteon apuväline, joka käyttää puumaista kaaviota tai mallia päätöksistä ja niiden mahdollisista tuloksista, mukaan lukien sattuma-tapahtumien tulokset, resurssikustannukset ja apuohjelma. Tutki kuvaa saadaksesi tunteen siitä, miltä se muistuttaa.

3) Naiivi Bayes -luokitus

Naive Bayes luokittelee ryhmän perustana olevista todennäköisyysluokittelijoista riippuen siitä, kuinka Bayesin teoriaa sovelletaan vahvalla (hienostumattomalla) itsehallinnolla, ja Naive Bayesin piirteistä. Tämä luokitus Jotkut todistettavissa olevat mallit ovat:

Leimataan sähköposti roskapostiksi tai ei roskapostiksi

Tilaa uutiset innovaatioista, hallituskysymyksistä tai urheilusta

Tarkista ripaus ainetta, joka antaa positiivisia tunteita tai negatiivisia tunteita?

Käytetään kasvojen kuittausohjelmointiin.

4) Logistinen regressio

Logistinen regressio on uraauurtava tosiasiallinen menetelmä binomituloksen osoittamiseksi ainakin yhdellä informatiivisella tekijällä. Se määrittelee yhteyden absoluuttisen osastomuuttujan ja ainakin yhden vapaan tekijän välillä arvioimalla todennäköisyydet logistista kapasiteettia käyttämällä, joka on yhdistetty logistinen allokaatio.

Normaalisti regressioita voidaan käyttää tosielämässä kuten:

Luottopiste

Mitta markkinoiden tai yrityksen menestysasteesta

Voit ennustaa minkä tahansa yrityksen tai minkä tahansa tuotteen tuloja

Tuleeko maanjäristys mille tahansa päivälle?

5) Tavallinen vähiten ruutujen regressio

Pienimmät neliöt on strategia suoran regression suorittamiseksi. suora regressio on yritys sovittaa linja monien painopisteiden läpi. Tätä varten on olemassa useita potentiaalisia menettelytapoja, ja ”tavalliset pienimmän neliösumman” järjestelmät menevät näin - Voit piirtää viivan ja sen jälkeen kaikille datakeskuksille mitata pisteen ja viivan välinen pystysuuntainen irrottautuminen ja sisällyttää nämä up; sovitettu linja olisi paikka, jossa tämä väliseinäkokonaisuus on niin vähäinen, kuin se voisi olla normaalia nykytilanteen valossa.

Mikä on valvomaton oppiminen?

Malli oppii havainnon kautta ja havaitsee tiedon rakenteet. Kun mallille annetaan tietojoukko, se löytää näin ollen esimerkkejä ja yhteyksiä tietojoukosta tekemällä kimppuja siihen. Mitä se ei voi tehdä, on lisätä merkintöjä kimppuun, samoin kuin siinä ei voida todeta, että tämä on omenoiden tai mangojen keräys, mutta se eristää jokaisen omenan mangoista.

Oletetaan, että näytimme malleille kuvia omenoista, banaaneista ja mangoista, joten mitä se tekee, tiettyjen esimerkkien ja yhteyksien valossa, se tekee kimppuista ja osioida tietojoukon näihin ryhmiin. Tällä hetkellä, jos malliin lisätään muuta tietoa, se lisää sen yhteen valmistettuihin kimppuihin.

Esimerkki ohjaamattomasta oppimisesta

  1. Sinulla on paljon valokuvia 6 henkilöstä, mutta ilman tietoja siitä, kuka kenellä on, ja sinun on eristettävä tämä tietojoukko 6 kasaan, jokaisessa on yhden henkilön valokuvat.
  2. Sinulla on hiukkasia, osa niistä on lääkkeitä ja osa ei ole kuitenkaan et tiedä mikä on mikä ja tarvitset laskelman lääkkeiden löytämiseksi.

Ohjaamaton oppimisalgoritmi on seuraava

klustereiden

Klusterointi on merkittävä idea avustamattoman oppimisen kannalta. Sillä suurin osa onnistuu löytämään rakenne tai esimerkki luokittelemattoman tiedon keräämisessä. Klusterointilaskelmat käsittelevät tietosi ja löytävät karakteristiset klusterit (ryhmät) siinä tapauksessa, että ne ovat tiedossa. Voit myös muuttaa kuinka monta kimppua laskelmien tulisi erottaa. Sen avulla voit muuttaa näiden kokoontumisten rakeisuutta.

Voit käyttää erilaisia ​​klusterointeja

  1. Valikoiva (jakaminen)
  2. Malli: K-tarkoittaa
  3. agglomeratiivinen
  4. Malli: Hierarkkinen klusterointi
  5. Päällyste
  6. Malli: sumea C-merkki
  7. todennäköisyyspohjainen

Rypytysalgoritmityypit

  1. Hierarkkinen klusterointi
  2. K-tarkoittaa klusterointia
  3. K-NN (k lähinta naapuria)
  4. Pääkomponenttianalyysi
  5. Yksinäinen arvon hajoaminen
  6. Riippumaton komponenttianalyysi
  7. Hierarkkinen klusterointi
Hierarkkinen klusterointi

Hierarkkinen klusterointi on laskelma, joka muodostaa ryhmien nokkimisjärjestyksen. Se alkaa jokaisesta tiedosta, joka on poistettu heidän koko joukkoon. Täällä kaksi läheistä ryhmää on samassa ryhmässä. Tämä laskelma sulkeutuu, kun jäljellä on vain yksi ryhmä.

K-tarkoittaa klusterointia

K tarkoittaa, että se on toistuva klusterointilaskelma, joka rohkaisee sinua löytämään merkittävimmät kannustimet jokaiselle painotukselle. Aluksi valitaan ihanteellinen joukko ryhmiä. Tässä klusterointitekniikassa sinun on niputettava tietoa, joka keskittyy k kokoonpanoon. Suurempi k tarkoittaa pienempiä kokoontumisia, joilla on suurempi rakeisuus samoin. Matalampi k tarkoittaa suurempia kokoontumisia vähemmän yksityiskohtaisesti.

Laskelman tuotto on "nimien" kerääminen. Sen avulla tieto voidaan osoittaa yhteen k: n kokoelmasta. K-tarkoittaa klusterointia, jokaiselle keräämiselle on tunnusomaista, että tehdään keskipiste jokaiselle keräämiselle. Centroidit ovat kuin ryhmän ydin, joka tarttuu lähinnä oleviin keskittymiin ja lisää ne ryhmään.

K-keskittyminen luonnehtii edelleen kahta alaryhmää

  1. Agglomeratiivinen klusterointi
  2. dendrogrammia
Agglomeratiivinen klusterointi

Tällainen K-välineiden ryhmittely alkaa kiinteällä lukumäärällä kimppuja. Se määrittelee kaikki tiedot tarkkaan joukkoon ryhmiä. Tämä klusterointistrategia ei vaadi ryhmien K lukumäärää informaationa. Agglomerointimenettely alkaa muotoilemalla jokainen nollapiste yksinäiseksi ryhmäksi.

Tämä strategia hyödyntää erottelumittausta, vähentää kimppujen määrää (yksi jokaisessa painotuksessa) yhdistämällä prosessia. Yhteenvetona voidaan todeta, että meillä on yksi suuri ryhmä, joka sisältää kaikki artikkelit.

dendrogrammia

Dendrogram-klusterointitekniikassa kukin taso puhuu mahdolliselle joukolle. Dendrogrammin korkeus osoittaa samanlaisuusasteen kahden liitosjoukon välillä. Lähemmäksi prosessin perustaa ne ovat asteittain verrattavissa oleva joukko, joka on dendrogrammista keräämisen havainto, joka ei ole ominaista ja suurimmaksi osaksi abstrakti.

K-Lähin naapurit

K-lähin naapuri on yksinkertaisin kaikista AI-luokittelijoista. Se eroaa muista AI-menettelyistä siinä mielessä, että se ei tuota mallia. Se on suoraviivainen laskelma, joka tallentaa kaikki saatavilla olevat tapaukset ja kuvaa uusia esimerkkejä, jotka riippuvat samankaltaisuusmittauksesta.

Se toimii erittäin hyvin, kun mallit erotetaan toisistaan. Oppimisaste on maltillinen, kun valmistelusarja on valtava ja erotuskuvio on ei-triviaali.

Pääkomponenttien analyysi

On mahdollista, että tarvitset korkeamman ulottuvuuden tilaa. Sinun on valittava syy siihen tilaan ja vain 200 oleellisinta pistettä tuosta oletuksesta. Tätä emästä tunnetaan pääkomponenttina. Valitsemasi alajoukko on toinen tila, jonka koko on pieni, vastakohtana ainutlaatuiselle tilalle. Se pitää kuitenkin yllä suuren osan tiedon monipuolisuudesta, kuten voidaan odottaa.

Mikä on vahvistusoppiminen?

Asiantuntijan kyky on tehdä yhteistyötä maan kanssa ja löytää mikä on paras tulos. Se jatkaa ajatusta osuma- ja alustavasta tekniikasta. Operaattorille maksetaan palkka tai rangaistaan ​​pisteellä oikeasta tai muusta vastauksesta, ja positiivisen palkkion perusteella valitsemansa mallit itse kouluttavat. Lisäksi se valmistautuu jälleen valmistautuessaan ennakoimaan sille esitettyä uutta tietoa.

Esimerkki vahvistusoppimisesta

  1. Mainosten näyttäminen käyttäjien mieltymyksien mukaan optimoi pitkän ajanjakson
  2. Tietää reaaliajassa käytettyä mainosbudjettia
  3. käänteinen vahvistus oppiminen tuntemaan asiakkaat pitämättömyydestä

Mikä on puoliohjattu oppiminen?

Puolivalvotun tyyppinen oppiminen, laskelma laaditaan sekoitettuna nimettyä ja merkitsemätöntä tietoa. Normaalisti tämä sekoitus sisältää rajoitetun määrän nimettyä tietoa ja paljon merkitsemätöntä tietoa. Menetelmässä mukana oleva periaate on, että ensin ohjelmistosuunnittelija ryhmittelee vertailukelpoiset tiedot käyttämällä apua ilman laskentatapaa ja käyttää sitten nykyistä nimettyä informaatiota jäljellä olevan leimaamattoman tiedon nimeämiseen. Tällaisen laskennan tavallisilla käyttötapauksilla on tyypillinen ominaisuus - Leimaamattoman tiedon hankkiminen on yleensä vaatimatonta, kun taas mainitun tiedon nimeäminen on kalliimpaa. Luonnollisesti voidaan kuvitella kolmen tyyppisiä oppimislaskelmia valvottuina toteutuksina, joissa alaopinto on ohjaajan valvonnassa sekä kotona että koulussa, ilman valvontaa toteutettaessa silloin, kun alaopiskelijan on ymmärrettävä idea itse ja puolivalvotusti toteutettaessa missä. opettaja näyttää pari ideaa luokassa ja antaa tiedusteluja kouluteoksina, jotka riippuvat vertailukelpoisista ideoista.

Esimerkki puoliohjatusta oppimisesta

On hienoa, että enemmän tietoa = parempaa laatua olevia malleja syvällisessä oppimisessa (tiettyyn synnytykseen asti selvästi, mutta useimmiten meillä ei ole niin paljon tietoa.) Olkoon niin, merkityn tiedon hankkiminen on kallista. Siinä tapauksessa, että joudut valmistelemaan mallin siivekkäiden eläinten erottamiseksi, voit asentaa paljon kameroita kanojen kuvaamiseksi. Se on yleensä vaatimatonta. Yksilöiden tekeminen valokuvien merkitsemisestä on kallista. Harkitse mahdollisuutta, että sinulla on valtava määrä kuvia siivekäsistä eläimistä, mutta tee vain sopimuksia yksilöiden merkitsemiseksi pieni osa valokuvista. Kuten kävi ilmi, sen sijaan, että harjoittaisit vain malleja merkittyyn osajoukkoon, voit harjoitella mallia koko harjoittelujoukolla, ennen kuin mukautat sitä nimetyllä alajoukolla, ja näet parannuksen merkkejä näillä linjoilla. Se on osittain ohjattua oppimista. Se varaa käteisen.

johtopäätös

Siellä on monen tyyppisiä koneoppimisalgoritmeja, ja erilaisiin olosuhteisiin perustuen meidän on käytettävä parhaiten sopivaa algoritmia parhaan tuloksen saavuttamiseksi. On monia algoritmeja, jotka löytävät parhaan tarkkuuden jokaisesta koneoppimisalgoritmityypistä ja mikä on erittäin tarkka, mitä meidän on käytettävä kyseistä algoritmia. Voimme minimoida kunkin algoritmin virheen vähentämällä datan kohinaa. Vihdoin sanon, että ei ole yhtä koneoppimisalgoritmia, joka voi antaa sinulle 100-prosenttisen tarkkuuden, vaikka ihmisen aivot eivät pystyisi tekemään niin, joten löydä paras tietosi algoritmi.

Suositellut artikkelit

Tämä on opas koneoppimisen algoritmeihin. Tässä keskustellaan siitä, mikä on koneoppimisen algoritmi ?, ja sen tyyppeihin kuuluvat ohjattu oppiminen, ohjaamaton oppiminen, osittain ohjattu oppiminen, vahvistusoppiminen. Voit myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -

  1. Koneoppimismenetelmät
  2. Koneoppimiskirjastot
  3. Koneoppimallit
  4. Koneoppiminen
  5. Hyperparametrinen koneoppiminen
  6. Hierarkkinen ryhmittely | Agglomeratiivinen ja jakautuva klusterointi
  7. Luo päätöksentekopuu | Kuinka luoda | edut
  8. Koneoppimisen elinkaari | 8 parasta vaihetta

Luokka: