Johdatus konvoluutiohermoihin

Konvoluutiohermostoverkot, tunnetaan myös nimellä CNN tai ConvNet, kuuluvat keinotekoisten hermoverkkojen luokkaan, joita käytetään kuvankäsittelyyn ja visualisointiin. Tekoäly käyttää syvää oppimista tehtävän suorittamiseen. Neuraaliverkot ovat joko laitteistoja tai ohjelmistoja, jotka on ohjelmoitu ihmisen aivojen neuroneiksi. Perinteinen hermoverkko ottaa tuloina vain pienennetyn resoluution kuvia. CNN ratkaisee tämän ongelman järjestämällä heidän neuroninsa ihmisen aivojen etuosaksi. Esikäsittely CNN: ssä on hyvin vähemmän verrattuna muihin algoritmeihin. Konvoluutio, CNN: ssä käytetään lineaarista matemaattista operaatiota. Se käyttää konvoluutiota yleisen matriisikertolaskun sijasta yhdessä sen kerroksessa.

Kerrokset konvoluutiohermoverkoissa

Alla on konvoluutiohermoverkkojen kerrokset:

1. Kuvasyöttökerros

Tulokerros antaa tuloja (enimmäkseen kuvia) ja normalisointi suoritetaan. Tulon koko on mainittava tässä.

2. Konvoluutiokerros

Konvoluutio suoritetaan tässä kerroksessa ja kuva jaetaan perceptroneihin (algoritmi), luodaan paikalliset kentät, jotka johtavat perceptronien pakkaamiseen ominaisuuskarttoiksi matriisina, jonka koko on mx n.

3. Epälineaarisuuskerros

Tässä ominaisuuskartat otetaan tuloiksi ja aktivointikartat annetaan tuotoksina aktivointitoiminnon avulla. Aktivointitoiminto toteutetaan yleensä sigmoidina tai hyperbolisena tangenttitoimintona.

4. Korjauskerros

CNN: n tärkeä osa, tämä kerros suorittaa harjoituksen nopeammin vähentämättä tarkkuutta. Se suorittaa elementtipohjaisen absoluuttisen arvon toiminnan aktivointikartoilla.

5. Tasasuunnatut lineaariset yksiköt (ReLU)

ReLU yhdistää epälineaariset ja tasasuuntauskerrokset CNN: ssä. Tämä suorittaa kynnystoiminnan, jossa negatiiviset arvot muutetaan nollaksi. ReLU ei kuitenkaan muuta tulon kokoa.

6. Yhdistämiskerros

Yhdistämiskerrosta kutsutaan myös pienentäväksi kerrokseksi, koska tämä on vastuussa aktivointikarttojen koon pienentämisestä. Syöttötilavuuteen lisätään samanpituinen suodatin ja juova. Tämä kerros jättää huomioimatta vähemmän merkittävän datan, joten kuvan tunnistus tehdään pienemmässä esityksessä. Tämä kerros vähentää ylimääräistä asennusta. Koska parametrien määrää pienennetään yhdistävällä kerroksella, myös kustannukset vähenevät. Tulo jaetaan suorakaiteen muotoisiin yhdistämisalueisiin ja lasketaan joko maksimiarvo tai keskiarvo, joka vastaa vastaavasti maksimiarvoa tai keskiarvoa. Max Pooling on suosittu.

7. Katkaiseva kerros

Tämä kerros asettaa tulokerroksen satunnaisesti nollaan tietyllä todennäköisyydellä. Lisää tuloksia eri elementeissä pudotetaan tämän toimenpiteen jälkeen. Tämä kerros auttaa myös vähentämään ylimääräistä asennusta. Se tekee verkosta tarpeettoman. Tässä kerroksessa ei tapahdu oppimista. Tämä toimenpide suoritetaan vain harjoituksen aikana.

8. Täysin kytketty kerros

Aktivointikartat, jotka ovat aikaisempien kerrosten lähtö, muunnetaan luokan todennäköisyysjakaumaksi tässä kerroksessa. FC-kerros kertoo syötteen painomatriisilla ja lisää bias-vektorin.

9. Tulostuskerros

FC-kerrosta seuraa softmax- ja luokittelukerrokset. Softmax-toimintoa käytetään tuloon. Luokittelukerros laskee ristin entropian ja häviöfunktion luokitteluongelmiin.

10. Regressiokerros

Tässä kerroksessa lasketaan puolivälin neliövirhe. Tämän kerroksen tulisi noudattaa FC-kerrosta.

Konvoluutiohermoverkon arkkitehtuuri

Alla on konvoluutiohermoverkkojen arkkitehtuuri:

1. LeNet

LeNet esiteltiin optiikkaan ja merkkien tunnistamiseen asiakirjoissa vuonna 1998. Se on pieni ja täydellinen suorittamiseen keskusyksikössä. LeNet on pieni ja helppo tarttua. Tämä rakennetaan kolmella pääidealla: paikallisilla vastaanottavaisilla kentillä jaetut painot ja alueellinen alinäytteenotto. Verkko näyttää raa'iden kuvien parhaan sisäisen esityksen. Siinä on kolme konvoluutiokerrosta, kaksi yhdistämiskerrosta, yksi täysin kytketty kerros ja yksi lähtökerros. Yhtä konvoluutiokerrosta seurasi välittömästi yhdistävä kerros. Kaikki kerrokset on selitetty yllä.

2. AlexNet

AlexNet kehitettiin vuonna 2012. Tämä arkkitehtuuri popularisoi CNN: ää tietokoneen visiossa. Siinä on viisi konvoluutiokerrosta ja kolme täysin kytkettyä kerrosta, joihin ReLU lisätään jokaisen kerroksen jälkeen. Se käyttää molempien kerrosten etuja, koska konvoluutiokerroksella on vähän parametreja ja pitkä laskenta, ja se on päinvastainen täysin kytketylle kerrokselle. Tietojen lisääminen ja keskeyttäminen vähensivät huomattavasti ylimääräistä asennusta. AlexNet oli syvempi, isompia ja konvoluutiokerroksia ei ole erotettu yhdistävällä kerroksella verrattuna LeNetiin.

3. ZF Net

ZF Net kehitettiin vuonna 2013, joka oli muokattu versio AlexNetistä. Keskimmäisen konvoluutiokerroksen kokoa laajennettiin ja ensimmäisen konvoluutiokerroksen askeleen ja suodattimen kokoa pienennettiin. Se vain tunnisti AlexNetin puutteet ja kehitti paremman. Kaikki kerrokset ovat samat kuin AlexNet. ZF Net säätää kerroksen parametreja, kuten suodattimen kokoa tai AlexNetin askeleen, mikä saa sen vähentämään virhetasoa.

4. GoogLeNet

Tämä arkkitehtuuri kehitettiin vuonna 2014. Alkukerros on ydinkonsepti. Tämä kerros peittää suuremman alueen, mutta merkitsee kuvan pienet tiedot. Suorituksen parantamiseksi GoogLeNetissä käytetään yhdeksää aloitusmoduulia. Koska aloituskerros on alttiina liika-asennukselle, tässä käytetään enemmän epälineaarisuutta ja vähemmän parametreja. Suurinta yhdistämiskerrosta käytetään yhdistämään edellisen kerroksen lähtö. Tässä arkkitehtuurissa on 22 kerrosta ja parametrit ovat 12x pienemmät. Tämä on tarkempi kuin AlexNet, myös nopeammin. Virheaste on verrattain alhaisempi. Keskimääräistä yhdistämiskerrosta käytetään lopussa täysin kytketyn kerroksen sijasta. Laskentaa vähennetään, syvyyttä ja leveyttä lisätään. Monet aloitusmoduulit on kytketty syvemmälle arkkitehtuuriin. GoogLeNet menestyi paremmin kuin kaikki muut vuoteen 2014 asti kehitetyt arkkitehtuurit. Tätä arkkitehtuuria varten on saatavana useita seurantaversioita.

5. VGG Net

Tämä oli parannus ZFNetiin ja myöhemmin AlexNetiin verrattuna. Siinä on 16 kerrosta, joissa on 3 × 3 konvoluutiokerrosta, 2 × 2 yhdistävät kerrokset ja täysin kytketyt kerrokset. Tämä arkkitehtuuri omaa yksinkertaisimman verkkorakenteen, mutta sillä on suurin osa parametreista.

6. ResNet

Residual Network -arkkitehtuuri kehitettiin vuonna 2015. Se käyttää erän normalisointia ja ohittaa FC-kerrosten käytön. Tämä arkkitehtuuri käyttää 152 tasoa ja ohittaa yhteydet. ResNet-järjestelmää käytetään nyt pääosin kaikissa syvän oppimisen algoritmeissa.

johtopäätös

Facebook käyttää CNN: tä kuvien merkitsemiseen, Amazon - tuotesuosituksiin ja Google etsiä käyttäjäkuvien joukosta. Kaikki nämä tehdään suuremmalla tarkkuudella ja tehokkuudella. Syvän oppimisen eteneminen saavutti vaiheen, jossa CNN kehitettiin ja auttaa monin tavoin. Kun monimutkaisesta CNN: stä tulee, se auttaa parantamaan tehokkuutta.

Suositeltava artikkeli

Tämä on opas konvoluutiohermoihin. Tässä keskustellaan Johdatus konvoluutiohermoihin ja sen kerroksiin yhdessä arkkitehtuurin kanssa. Voit myös käydä läpi muiden ehdotettujen artikkeleidemme saadaksesi lisätietoja -

  1. Neuraaliverkoston luokittelu
  2. Koneoppiminen vs. hermoverkko
  3. Yleiskatsaus hermoverkkoalgoritmeista
  4. Toistuvat hermoverkot (RNN)
  5. Neuraaliverkkojen toteutus
  6. Kuusi parhainta vertailua CNN: n ja RNN: n välillä

Luokka: