Johdatus rajoitettuun Boltzmann-koneeseen

Rajoitettu Boltzmann-kone on menetelmä, joka löytää automaattisesti kuviot tiedoista rekonstruoimalla syötteemme. Geoff Hinton on syvän oppimisen perustaja. RBM on pinnallinen kaksikerroksinen verkko, jossa ensimmäinen on näkyvä ja seuraava on piilotettu kerros. Jokainen näkyvän kerroksen solmu liitetään jokaiseen piilotetun kerroksen solmuun. Rajoitettua Boltzmann-konetta pidetään rajoitettuna, koska saman kerroksen kaksi solmua eivät muodosta yhteyttä. RBM on kaksisuuntaisen kääntäjän numeerinen vastine. Eteenpäin suuntautuvalla reitillä, RBM vastaanottaa tulon ja muuntaa sen numerojoukkoon, joka koodaa tuloa. Taaksepäin suuntautuvassa polussa se vie tämän tuloksena ja käsittelee tämän sisääntulosarjan ja kääntää ne käänteisesti sisäänvedettyjen tulojen muodostamiseksi. Superkoulutettu verkko pystyy suorittamaan tämän käänteisen muutoksen erittäin todenmukaisella tavalla. Kahdessa vaiheessa painolla ja arvoilla on erittäin tärkeä rooli. Ne antavat RBM: lle dekoodata sisääntulojen väliset suhteet ja auttavat myös RBM: ää päättämään, mitkä tuloarvot ovat tärkeimpiä oikeiden lähtöjen havaitsemiseksi.

Rajoitetun Boltzmann-koneen toiminta

Jokainen näkyvä solmu vastaanottaa matalan tason arvon tietojoukon solmulta. Näkymättömän kerroksen ensimmäisessä solmussa X muodostuu painotuotteesta ja lisätään esijännitteeseen. Tämän prosessin tulos syötetään aktivointiin, joka tuottaa annetun tulosignaalin tai solmun ulostulon tehon.

Seuraavassa prosessissa useita tuloja liittyisi yhteen piilotettuun solmuun. Jokainen X yhdistetään yksilöllisen painon avulla, tuotteen lisäys kerrotaan arvoihin ja jälleen tulos johdetaan aktivoinnin kautta solmun tuotoksen saamiseksi. Jokaisessa näkymättömässä solmussa jokaista sisääntuloa X yhdistää yksilöllinen paino W. Tulolla X on täällä kolme painoa, mikä tekee niistä kaksitoista yhdessä. Kerroksen väliin muodostuvasta painosta tulee taulukko, jossa rivit ovat tarkkoja syöttösolmuille ja sarakkeet tyytyväisiä lähtösolmuihin.

Jokainen näkymätön solmu saa neljä vastausta kerrottuna niiden painolla. Tämän vaikutuksen lisääminen lisää jälleen arvoa. Tämä toimii katalysaattorina jonkin aktivointiprosessin tapahtumiseksi ja tulos syötetään jälleen aktivointialgoritmiin, joka tuottaa jokaisen yksittäisen ulostulon jokaiselle näkymättömälle tulolle.

Ensimmäinen tästä johdettu malli on energiapohjainen malli. Tämä malli yhdistää skalaarienergian muuttujan jokaiseen konfiguraatioon. Tämä malli määrittelee todennäköisyysjakauman energiafunktion kautta seuraavasti:

(1)

Tässä Z on normalisointikerroin. Se on fyysisten järjestelmien kannalta osiointitoiminto

Tässä energiapohjaisessa toiminnossa seuraa logistinen regressio, että ensimmäinen askel määrittelee login. todennäköisyys ja seuraava määrittelevät tappiofunktion negatiivisena todennäköisyytenä.

käyttämällä stokastista gradienttia, missä ovat parametrit,

energiapohjainen malli piilotetulla yksiköllä on määritelty 'h'

Havaittu osa merkitään nimellä "x"

Yhtälöstä (1) vapaan energian yhtälö F (x) määritetään seuraavasti

(2)

(3)

Negatiivisella gradientilla on seuraava muoto,

(4)

Yllä olevalla yhtälöllä on kaksi muotoa, positiivinen ja negatiivinen muoto. Termiä positiivinen ja negatiivinen ei edusta yhtälöiden merkkejä. Ne osoittavat todennäköisyystiheyden vaikutuksen. Ensimmäinen osa osoittaa vastaavan vapaan energian vähentämisen todennäköisyyden. Toinen osa näyttää vähentävän luotujen näytteiden todennäköisyyttä. Sitten kaltevuus määritetään seuraavasti:

(5)

Tässä N on negatiiviset hiukkaset. Tässä energiapohjaisessa mallissa on vaikea tunnistaa gradienttia analyyttisesti, koska se sisältää laskennan

Siksi tässä EBM-mallissa meillä on lineaarinen havainto, joka ei pysty kuvaamaan tietoja oikein. Joten seuraavassa Rajoitetussa Boltzmann-koneessa piilotetulla kerroksella on enemmän tarkkuutta ja tietojen menetyksen estäminen. RBM-energiatoiminto määritetään seuraavasti:

(6)

Tässä W on paino, joka yhdistää näkyvien ja piilotettujen kerrosten välillä. b on näkyvän kerroksen offset.c on piilotetun kerroksen offset. muuntamalla vapaaksi energiaksi,

RBM: ssä näkyvän ja piilotetun kerroksen yksiköt ovat täysin riippumattomia, jotka voidaan kirjoittaa seuraavasti:

Yhtälöiden 6 ja 2 perusteella neuronien aktivointitoiminnon todennäköisyysversio,

(7)

(8)

Sitä yksinkertaistetaan edelleen

(9)

Yhdistämällä yhtälöt 5 ja 9,

(10)

Näytteenotto rajoitetussa Boltzmann-koneessa

Gibbs-näytteenotto N satunnaismuuttujan liitoksesta suoritetaan lomakkeen N näytteenottoalivaiheiden sekvenssin avulla missä

sisältää muut satunnaismuuttujat lukuun ottamatta.

RBM: ssä S on joukko näkyviä ja piilotettuja yksiköitä. Nämä kaksi osaa ovat itsenäisiä, jotka voivat suorittaa tai estää Gibbs-näytteenoton. Tässä näkyvä yksikkö suorittaa näytteenoton ja antaa kiinteän arvon piilotetuille yksiköille. Samanaikaisesti piilotetut yksiköt tarjosivat kiinteät arvot näkyvälle yksikölle näytteenotolla

tässä, on joukko kaikkia piilotettuja yksiköitä. Esimerkki on satunnaisesti valittu yhdeksi (verrattuna 0) todennäköisyydellä, ja vastaavasti on satunnaisesti valittu todennäköisyydellä 1 (verrattuna 0)

Kontrastiivinen ero

Sitä käytetään katalysaattorina näytteenottoprosessin nopeuttamiseksi
Koska odotamme olevan totta, odotamme jakautumisarvon on oltava lähellä P: tä, jotta se muodostaa lähentymisen P: n lopulliseen jakautumiseen

Mutta kontrastinen ero ei odota ketjun lähentymistä. Näyte saadaan vasta Gibbin prosessin jälkeen, joten asetamme tähän k = 1, missä se toimii yllättävän hyvin.

Jatkuva kontrastiivinen ero

Tämä on toinen menetelmä näytteenottolomakkeen lähentämiseksi. Se on pysyvä tila jokaiselle näytteenottomenetelmälle, ja se erottaa uudet näytteet yksinkertaisesti muuttamalla K: n parametreja.

Rajoitetun Boltzmann-koneen kerrokset

Rajoitetussa Boltzmann-koneessa on kaksi kerrosta, matalia hermoverkkoja, jotka yhdistyvät muodostaen lohkon syviä uskomusverkkoja. Ensimmäinen kerros on näkyvä kerros ja toinen kerros on piilotettu kerros. Jokainen yksikkö viittaa neuronin kaltaiseen ympyrään, jota kutsutaan solmuksi. Piilotetun kerroksen solmut on kytketty näkyvän kerroksen solmuihin. Mutta saman solun kahta solmua ei ole kytketty toisiinsa. Termi Rajoitettu viittaa tässä ei kerroksen sisäiseen viestintään. Jokainen solmu prosessoi tuloa ja tekee stokastisen päätöksen, lähettääkö tulo vai ei.

esimerkit

RBM: n tärkeä rooli on todennäköisyysjakauma. Kielet ovat ainutlaatuisia kirjaimillaan ja äänillään. Kirjeen todennäköisyysjakauma voi olla korkea tai matala. Englanniksi kirjaimia T, E ja A käytetään laajalti. Islannin kielellä yleiset kirjaimet ovat A ja N. Emme kuitenkaan voi yrittää rekonstruoida islannin kieltä englanniksi painotettuina. Se johtaa eroihin.

Seuraava esimerkki on kuvat. Niiden pikseliarvon todennäköisyysjakauma vaihtelee kunkin kuvan tyypin osalta. Voimme harkita, että elefantti- ja koiran kuvia on kaksi vetosyöttösolmuille. RBM: n eteenpäin suuntautuminen luo kysymyksen, pitäisikö minun luoda vahva pikselisolmu elefanttisolmulle tai koirasolmulle ?. Sitten taaksepäin siirtäminen tuottaa kysymyksiä kuten norsu, miten pikselien jakautumista pitäisi odottaa? Sitten solmujen tuottaman yhteisen todennäköisyyden ja aktivoinnin avulla ne rakentavat verkon, jolla on yhteisiä esiintymiä, kun suuret korvat, harmaat epälineaariset putket, levykekorvat, ryppy ovat elefantti. Siksi RBM on syvän oppimisen ja visualisoinnin prosessi, joka muodostaa kaksi suurta harhaa ja vaikuttaa heidän aktivointi- ja jälleenrakennustunteeseensa.

Rajoitetun Boltzmann-koneen edut

  • Rajoitetussa Boltzmann-koneessa käytetään algoritmia luokitteluun, regressioon, aiheen mallintamiseen, yhteistyölliseen suodattamiseen ja ominaisuuksien oppimiseen.
  • Rajoitettua Boltzmann -konetta käytetään neurokuvaukseen, harvan kuvan jälleenrakentamiseen miinan suunnittelussa ja myös tutkakohteiden tunnistukseen
  • RBM pystyy ratkaisemaan epätasapainoisen dataongelman SMOTE-menettelyllä
  • RBM löytää puuttuvat arvot Gibbin otannalla, jota käytetään kattamaan tuntemattomat arvot
  • RBM voittaa meluisien tarrojen ongelman korjaamattomien tarratietojen ja niiden rekonstruointivirheiden avulla
  • Strukturoimaton ongelma korjataan ominaisuuksien poistolla, joka muuntaa raakatiedot piilotettuihin yksiköihin.

johtopäätös

Syväoppiminen on erittäin tehokasta, ja se on taite monimutkaisten ongelmien ratkaisemiseksi, se on silti parannustila ja monimutkainen toteuttaa. Vapaat muuttujat on määritettävä huolellisesti. Neuroverkon ideat olivat aikaisemmin vaikeat, mutta nykyään syväoppiminen on koneoppimisen ja tekoälyn jalkaa. Siksi RBM antaa käsityksen valtavista syvän oppimisen algoritmeista. Se käsittelee koostumuksen perusyksikköä, joka kasvoi asteittain moniksi suosituiksi arkkitehtuureiksi ja jota käytettiin laajasti monilla suurilla teollisuudenaloilla.

Suositeltava artikkeli

Tämä on opas rajoitetulle Boltzmann-koneelle. Tässä keskustellaan sen toiminnasta, näytteenotosta, rajoitetun Boltzmann-koneen eduista ja kerroksista. Voit myös käydä läpi muut ehdotetut artikkelimme saadaksesi lisätietoja _

  1. Koneoppimisen algoritmit
  2. Koneoppimisarkkitehtuuri
  3. Koneoppimisen tyypit
  4. Konetyökalut
  5. Neuraaliverkkojen toteutus

Luokka: