Johdanto ytimen menetelmiin

Ytimet tai ytimen menetelmät (joita kutsutaan myös ytimen toimintoiksi) ovat erityyppisiä algoritmeja, joita käytetään kuvioanalyysiin. Niitä käytetään ratkaisemaan epälineaarinen ongelma käyttämällä lineaarista luokitinta. Ytimen menetelmiä käytetään SVM: ssä (Support Vector Machines), joita käytetään luokittelu- ja regressio-ongelmiin. SVM käyttää niin kutsuttua "ytimen temppua", jossa tiedot muunnetaan ja mahdollisille ulostuloille löydetään optimaalinen raja.

Ytimen menetelmän tarve ja sen toiminta

Ennen kuin siirrymme ytimetodien toimintaan, on tärkeämpää ymmärtää tukivektorikoneet tai SVM: t, koska ytimet on toteutettu SVM-malleissa. Joten tukivektorikoneet ovat ohjattuja koneoppimisalgoritmeja, joita käytetään luokittelu- ja regressio-ongelmissa, kuten omenan luokittelu hedelmien luokkaan, kun taas leijona luokkaeläin.

Seuraavassa esitetään, millaiset tukivektorikoneet näyttävät:

Täällä voimme nähdä hyperkoneen, joka erottaa vihreät pisteet sinisistä. Hyper-taso on yhtä ulottuvuutta pienempi kuin ympäröivä taso. Esimerkiksi yllä olevassa kuvassa meillä on 2 ulottuvuutta, joka edustaa ympäröivää tilaa, mutta tila, joka jakaa tai luokittelee tilan, on yhtä ulottuvuutta pienempi kuin ympäröivä tila, ja sitä kutsutaan hypertasoksi.

Mutta entä jos meillä on tällainen panos:

Tätä luokitusta on erittäin vaikea ratkaista käyttämällä lineaarista luokitinta, koska ei ole hyvää lineaarista viivaa, jonka pitäisi pystyä luokittelemaan punaiset ja vihreät pisteet pisteiden jakautuessa satunnaisesti. Tässä tulee ydinfunktion käyttö, joka vie kohdat korkeampiin mittoihin, ratkaisee ongelman siellä ja palauttaa tulosteen. Ajattele tätä tällä tavalla, niin näemme, että vihreät pisteet ovat suljettuina jollakin kehäalueella, kun taas punaiset ovat sen ulkopuolella, samoin, voi olla myös muita skenaarioita, joissa vihreät pisteet voivat jakaa puolisuunnikkaan muotoisella alueella.

Joten mitä teemme, on muuntaa kaksiulotteinen taso, jonka ensin luokitteli yksiulotteinen hypertaso (”tai suora viiva”) kolmiulotteiseksi alueeksi, ja tässä luokittelijamme, ts. Hypertaso, ei ole suora, vaan kaksi -dimensionaalitaso, joka leikkaa alueen.

Ytimen matemaattisen ymmärtämisen saamiseksi ymmärretään Lili Jiangin ydinyhtälö, joka on:

K (x, y) = missä,
K on ytimen funktio,
X ja Y ovat mittatulot,
f on kartta n-ulotteisesta m-ulotteiseen avaruuteen ja,
on pistetuote.

Kuva esimerkin avulla.

Sanotaan, että meillä on kaksi pistettä, x = (2, 3, 4) ja y = (3, 4, 5)

Kuten olemme nähneet, K (x, y) =.

Lasketaan ensin

f (x) = (x1x1, x1x2, x1x3, x2x1, x2x2, x2x3, x3x1, x3x2, x3x3)
f (y) = (y1y1, y1y2, y1y3, y2y1, y2y2, y2y3, y3y1, y3y2, y3y3)
niin,
f (2, 3, 4) = (4, 6, 8, 6, 9, 12, 8, 12, 16) ja
f (3, 4, 5) = (9, 12, 15, 12, 16, 20, 15, 20, 25)
joten pistetuote,
f (x). f (y) = f (2, 3, 4). f (3, 4, 5) =
(36 + 72 + 120 + 72 +144 + 240 + 120 + 240 + 400) =
1444
Ja,
K (x, y) = (2 * 3 + 3 * 4 + 4 * 5) 2 = (6 + 12 + 20) 2 = 38 * 38 = 1444.

Tämä, kuten olemme selvittäneet, f (x) .f (y) ja K (x, y) antavat meille saman tuloksen, mutta entinen menetelmä vaati paljon laskelmia (koska 3 mittaa projisoitiin yhdeksi ulottuvuudeksi) samalla kun ydin, se oli paljon helpompaa.

Ytintyypit ja menetelmät SVM: ssä

Katsotaanpa joitain ytimen toimintoja tai tyyppejä, joita käytetään SVM: ssä:

1. Liner-ydin - Sanotaan, että meillä on kaksi vektoria nimillä x1 ja Y1, sitten lineaarinen ydin määritellään näiden kahden vektorin pistetuotteella:

K (x1, x2) = x1. x2

2. Polynominen ydin - Polynomiydin määritellään seuraavalla yhtälöllä:

K (x1, x2) = (x1. X2 + 1) d,

Missä,

d on polynomin aste ja x1 ja x2 ovat vektoreita

3. Gaussian-ydin - Tämä ydin on esimerkki radiaalipohjaisesta ytimestä. Alla on yhtälö tälle:

Annetulla sigmalla on erittäin tärkeä rooli Gaussin ytimen suorituksessa. Sitä ei pidä yliarvioida eikä aliarvioida, se tulisi virittää huolellisesti ongelman mukaan.

4. Eksponentiaalinen ydin - Tämä on läheisessä yhteydessä edelliseen ytimeen, ts. Gaussin ytimeen, ainoa ero on - normin neliö poistetaan.

Eksponentiaalifunktio on:


Tämä on myös radiaalinen ydinfunktio.

5. Laplacian-ydin - Tämän tyyppinen ydin on vähemmän altis muutoksille ja on täysin yhtä suuri kuin aiemmin käsitelty eksponentiaalinen funktioydin, Laplacian-ytimen yhtälö esitetään seuraavasti:

6. Hyperbolinen tai Sigmoid-ydin - Tätä ydintä käytetään koneoppimisen hermoverkkoalueilla. Sigmoid-ytimen aktivointitoiminto on bipolaarinen sigmoid-funktio. Hyperbolisen ytimen toiminnon yhtälö on:

Tämä ydin on hyvin käytetty ja suosittu tukivektorikoneiden keskuudessa.

7. Anova-säteittäinen ydin - Tämän ytimen tiedetään toimivan erittäin hyvin moniulotteisissa regressio-ongelmissa, kuten Gaussin ja Laplacian-ytimet. Tämä kuuluu myös säteittäisen ytimen luokkaan.

Anova-ytimen yhtälö on:

Ytimen menetelmiä on paljon enemmän ja olemme keskustelleet enimmäkseen käytetyistä ytimistä. Se riippuu puhtaasti ongelman tyypistä, joka päättää käytettävän ytimen toiminnon.

johtopäätös

Tässä osassa olemme nähneet ytimen määritelmän ja sen toiminnan. Yritimme kaavioiden avulla selittää ytimien toimintaa. Sitten olemme yrittäneet antaa yksinkertaisen kuvan matematiikan avulla ytimen toiminnasta. Viimeisessä osassa olemme nähneet erityyppisiä ytimen toimintoja, joita käytetään nykyään laajalti.

Suositellut artikkelit

Tämä on opas ytimen menetelmiin. Tässä keskustellaan johdannosta, tarpeesta, sen toiminnasta ja ytimen menetelmätyypeistä sopivalla yhtälöllä. Voit myös käydä läpi muiden ehdotettujen artikkeleidemme saadaksesi lisätietoja -

  1. Tietojen louhinnan algoritmit
  2. K- tarkoittaa ryhmittelyalgoritmia
  3. Brute Force -algoritmi
  4. Päätöksen puun algoritmi
  5. Ytimen menetelmät koneoppimisessa
  6. Päätöspuu koneoppimisessa

Luokka: