Johdatus hermoverkon luokitteluun

Neuraaliverkot ovat tehokkain tapa (kyllä, luit oikein) reaalimaailman ongelmien ratkaisemiseksi tekoälyssä. Tällä hetkellä se on myös yksi tietokonetekniikan paljon tutkituista alueista, että uusi hermostoverkon muoto olisi kehitetty, kun luet tätä artikkelia. Siellä on satoja neuroverkkoja eri aloille ominaisten ongelmien ratkaisemiseksi. Tässä käydään läpi sinut erityyppisten hermoverkkojen läpi kasvavan monimutkaisuuden järjestyksessä.

Erityyppiset perusteet hermoverkkojen luokittelussa

1. Matalat hermoverkot (yhteistyösuodatus)

Neuraaliverkot tehdään Perceptron-ryhmistä ihmisen aivojen hermorakenteen simuloimiseksi. Matalaisissa hermoverkoissa on yksi piilotettu kerros perceptronista. Yksi yleisimmistä esimerkeistä matalista hermoverkoista on yhteistyösuodatus. Perceptronin piilotettu kerros koulutetaan edustamaan entiteettien välisiä yhtäläisyyksiä suositusten tuottamiseksi. Suositusjärjestelmä Netflixissä, Amazonissa, YouTubessa jne. Käyttää Yhteistoiminnallisen suodatuksen versiota suositellakseen tuotteitaan käyttäjän kiinnostuksen mukaan.

2. Monikerros Perceptron (syvät hermostoverkot)

Neuroverkkoja, joissa on enemmän kuin yksi piilotettu kerros, kutsutaan syväksi neuroverkoksi. Spoilerihälytys! Kaikki seuraavat hermostoverkot ovat syvän hermoverkon muotoa, jota on parannettu / parannettu toimialuekohtaisten ongelmien ratkaisemiseksi. Yleensä ne auttavat meitä saavuttamaan yleismaailmallisuuden. Koska neuronin piilotettuja kerroksia on riittävästi, syvä hermoverkko voi arvioida eli ratkaista kaikki monimutkaiset reaalimaailman ongelmat.

Universaalinen lähentämislause on syvien hermoverkkojen ydin, jotta voidaan kouluttaa ja sopia mihin tahansa malliin. Jokaisen syvän hermoverkon version kehittää täysin kytketty matriisin kertolaskutuloksen kerros, joka on optimoitu vastapropagaatioalgoritmeilla. Opimme jatkossakin parannuksia, jotka johtavat erilaisiin syvien hermoverkkojen muotoihin.

3. Konvoluutiohermoverkko (CNN)

CNN: t ovat kypsimpien muodossa syviä hermoverkkoja tuottamaan tarkimman, ts. Paremmat kuin ihmisen tulokset tietokoneenäköalalla. CNN: t on tehty rakennekerroksista, jotka on luotu skannaamalla jokainen kuvapiste kuva-aineistossa. Kun tiedot saavat likimääräisen kerros kerrallaan, CNN alkaa tunnistaa kuviot ja tunnistaa siten kuvissa olevat kohteet. Näitä esineitä käytetään laajasti erilaisissa sovelluksissa tunnistamiseen, luokitteluun jne. Viimeaikaiset käytännöt, kuten siirto-oppiminen CNN: ssä, ovat parantaneet huomattavasti mallien epätarkkuutta. Google-kääntäjä ja Google-objektiivi ovat kaikkein uusin esimerkki CNN: stä.

CNN: ien käyttö on eksponentiaalista, koska niitä käytetään jopa sellaisten ongelmien ratkaisemiseen, jotka eivät ensisijaisesti liity tietokoneen visioon. Hyvin yksinkertainen, mutta intuitiivinen selitys CNN: istä löytyy täältä.

4. Toistuva hermoverkko (RNN)

RNN: t ovat viimeisin syvän hermoverkon muoto NLP: n ongelmien ratkaisemiseksi. Yksinkertaisesti sanottuna, RNN: t syöttävät muutamien piilotettujen kerrosten tuotoksen takaisin syöttökerrokseen yhdistääkseen ja siirtääkseen lähentämisen syöttötietojoukon seuraavaan iterointiin (aikakauteen). Se auttaa myös mallia itseoppimisessa ja korjaa ennusteet nopeammin jossain määrin. Tällaiset mallit auttavat ymmärtämään tekstin semantiikkaa NLP-toiminnoissa. RNN: istä on erilaisia ​​variantteja, kuten pitkäaikainen muisti (LSTM), porteitettu toistuva yksikkö (GRU) jne. Alla olevassa kaaviossa aktivointi h1: stä ja h2: sta syötetään vastaavasti tuloilla x2 ja x3.

5. Pitkäaikainen muisti (LSTM)

LSTM: t on suunniteltu vastaamaan RNN: n häviävän kaltevuusongelman ratkaisemiseen. Häviävät gradientit tapahtuvat suurilla hermoverkoilla, joissa häviöfunktioiden gradienteilla on taipumus siirtyä lähemmäksi nollaa aiheuttaen hermostoverkkojen keskeyttämisen oppimiseen. LSTM ratkaisee tämän ongelman estämällä aktivointitoiminnot toistuvissa komponenteissaan ja pitämällä varastoidut arvot muuntamatta. Tämä pieni muutos antoi suuria parannuksia lopulliseen malliin, minkä seurauksena tekniikan jättiläiset mukauttivat LSTM: ää ratkaisuihinsa. LSTM: n "yksinkertaisimpaan itsensä selittävään" esimerkkiin,

6. Huomiopohjaiset verkot

Huomiomallit ottavat hitaasti käyttöön myös uudet RNN: t käytännössä. Huomio-mallit on rakennettu keskittymällä osaan annettujen tietojen osajoukkoa, mikä eliminoi ylivoimaisen määrän taustatietoja, joita ei tarvita käsiteltävänä olevassa tehtävässä. Huomiomallit on rakennettu yhdistämällä pehmeä ja kova huomio ja sopiva lisäämällä pehmeää huomiota taaksepäin. Useita hierarkkisesti pinottuja huomiomalleja kutsutaan muuntajaksi. Nämä muuntajat ovat tehokkaampia ajamaan pinoja rinnakkain siten, että ne tuottavat tekniikan tason tuloksia suhteellisen pienellä datalla ja mallin kouluttamiseen kuluvalla ajalla. Huomionjakautumisesta tulee erittäin voimakas, kun sitä käytetään CNN / RNN: n kanssa, ja se voi tuottaa tekstin kuvauksen kuvalle seuraavasti.

Tech-jättiläiset, kuten Google, Facebook, jne., Mukauttavat nopeasti huomion malleja ratkaisujensa rakentamiseen.

7. Generatiivinen kilpaileva verkosto (GAN)

Vaikka syvän oppimisen mallit tarjoavat uusinta tulosta, paljon älykkäämmät ihmisparit voivat hämätä niitä lisäämällä melua reaalimaailman tietoihin. GAN: t ovat syvällisen oppimisen viimeisin kehitys tällaisten skenaarioiden käsittelemiseksi. GAN: t käyttävät ohjaamatonta oppimista, jossa syvät hermoverkot koulutetaan AI-mallin tuottaman tiedon kanssa todellisen tietoaineiston kanssa mallin tarkkuuden ja tehokkuuden parantamiseksi. Näitä kilpailutietoja käytetään useimmiten syrjivän mallin huijaamiseen optimaalisen mallin luomiseksi. Tuloksena oleva malli pyrkii olemaan parempi vertailu kuin pystyy selittämään tällaisen melun. Tutkimuksen kiinnostus GAN: iin on johtanut kehittyneempiin toteutuksiin, kuten Conditional GAN ​​(CGAN), Laplacian Pyramid GAN (LAPGAN), Super Resolution GAN (SRGAN) jne.

Johtopäätös - hermoverkon luokittelu

Syvät hermoverkot ovat ajaneet tietokoneiden rajoja. Ne eivät rajoitu pelkästään luokitukseen (CNN, RNN) tai ennusteisiin (yhteistyöhön perustuva suodatus), vaan jopa datan tuottamiseen (GAN). Nämä tiedot voivat vaihdella kauniista taiteen muodosta kiistanalaisissa syvän väärennöksissä, mutta silti ne ylittävät ihmiset tehtävällä joka päivä. Siksi meidän on myös harkittava AI: n etiikkaa ja vaikutuksia työskennellessään ahkerasti tehokkaan hermoverkkomallin rakentamiseksi. Aika huolelliseen neuroverkkojen infografiaan.

Suositellut artikkelit

Tämä on opas hermoverkon luokitukseen. Tässä keskustelimme erityyppisistä hermoverkoista. Voit myös käydä annettujen artikkeleidemme läpi oppiaksesi lisää-

  1. Mikä on hermoverkot?
  2. Neuraaliverkon algoritmit
  3. Verkkoskannaustyökalut
  4. Toistuvat hermoverkot (RNN)
  5. Kuusi parhainta vertailua CNN: n ja RNN: n välillä

Luokka: