Ero lineaarisen regression ja logistisen regression välillä
Seuraava artikkeli Lineaarinen regressio vs. logistinen regressio tarjoaa tärkeimmät erot molempien välillä, mutta ennen kuin katsotaan, mitä regressio tarkoittaa?
Regressio
Regressio on pohjimmiltaan tilastollinen mitta yhden riippuvaisen muuttujan, ts. Lähtö Y: n ja muiden riippumattomien muuttujien sarjan, ts. X 1, X 2 ja niin edelleen, välisen suhteen vahvuuden määrittämiseksi. Regressioanalyysiä käytetään periaatteessa ennustamiseen ja ennustamiseen.
Mikä on lineaarinen regressio?
Lineaarinen regressio on algoritmi, joka perustuu koneoppimisen ohjattuun oppimisalueeseen. Se perii lineaarisen suhteen syöttömuuttujien ja yksittäisen lähtömuuttujan välillä, kun lähtömuuttuja on luonteeltaan jatkuva. Sitä käytetään ennustamaan tuotoksen arvo, sanotaan Y tuloista, sanotaan esimerkiksi X. Kun tarkastellaan vain yhtä tuloa, sitä kutsutaan yksinkertaiseksi lineaariseksi regressioon.
Se voidaan jakaa kahteen pääryhmään:
1. Yksinkertainen regressio
Toiminnan periaate: Päätavoite on selvittää näytteenottoihin parhaiten sopivan suoran yhtälö. Tämä yhtälö kuvaa algebrallisesti kahden muuttujan välistä suhdetta. Parhaiten sopivaa suoraa virtausta kutsutaan regressioviivaksi.
Y = β 0 + β 1 X
Missä,
p edustaa piirteitä
p 0 edustaa sieppausta
p1 edustaa ominaisuuden X kerrointa
2. Monimuuttuja regressio
Sitä käytetään ennustamaan korrelaatio useamman kuin yhden riippumattoman muuttujan ja yhden riippuvan muuttujan välillä. Regressio, jossa on enemmän kuin kaksi riippumatonta muuttujaa, perustuu muodon sovittamiseen datan tähdistöyn moniulotteisessa kuvaajassa. Regression muodon tulisi olla sellainen, että se minimoi muodon etäisyyden jokaisesta datapisteestä.
Lineaarinen suhdemalli voidaan esittää matemaattisesti seuraavasti:
Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + ……. + β n X n
Missä,
p edustaa piirteitä
p 0 edustaa sieppausta
p1 edustaa ominaisuuden X1 kerrointa
p n edustaa ominaisuuden Xn kerrointa
Lineaarisen regression edut ja haitat
Seuraavassa on etuja ja haittoja:
edut
- Yksinkertaisuutensa vuoksi sitä käytetään laajalti ennusteiden ja päätelmien mallinnuksessa.
- Se keskittyy tietojen analysointiin ja tietojen esikäsittelyyn. Joten se käsittelee erilaisia tietoja häiritsemättä mallin yksityiskohtia.
haitat
- Se toimii tehokkaasti, kun tiedot jaetaan normaalisti. Siksi tehokasta mallintaa varten kollineaarisuutta on vältettävä.
Mikä on logistinen regressio?
Se on regression muoto, joka mahdollistaa erillisten muuttujien ennustamisen jatkuvien ja erillisten ennustajien seoksella. Se johtaa riippumattomien muuttujien ainutlaatuiseen muuntamiseen, joka vaikuttaa arviointiprosessin lisäksi myös riippumattomien muuttujien kertoimiin. Siinä käsitellään samaa kysymystä, joka moninkertainen regressio tekee, mutta ilman ennusteiden jakaumaoletuksia. Logistisessa regressiossa tulosmuuttuja on binaarinen. Analyysin tarkoituksena on arvioida useiden selittävien muuttujien vaikutuksia, jotka voivat olla numeerisia tai kategorisia tai molempia.
Logistisen regression tyypit
Alla on 2 logistisen regression tyyppiä:
1. Binaarinen logistinen regressio
Sitä käytetään, kun riippuvainen muuttuja on kaksiarvoinen, eli kuin kahdella oksalla oleva puu. Sitä käytetään, kun riippuvainen muuttuja ei ole parametrinen.
Käytetään kun
- Jos lineaarisuutta ei ole
- Riippuvaista muuttujaa on vain kaksi tasoa.
- Jos monimuuttujainen normaalisuus on kyseenalaista.
2. Multinomiaalinen logistinen regressio
Multinomiaalinen logistinen regressioanalyysi vaatii, että riippumattomat muuttujat ovat metrisiä tai kaksijakoisia. Se ei tee oletuksia lineaarisuudesta, normaalisuudesta ja varianssin homogeenisuudesta riippumattomille muuttujille.
Sitä käytetään, kun riippuvaisella muuttujalla on enemmän kuin kaksi luokkaa. Sitä käytetään analysoimaan ei-metrisesti riippuvan muuttujan ja metristen tai kaksiromaisten riippumattomien muuttujien välisiä suhteita, sitten vertaa useita ryhmiä binaaristen logististen regressioiden yhdistelmällä. Lopulta se tarjoaa joukon kertoimia molemmille vertailuille. Vertailuryhmän kertoimina pidetään kaikkia nollia. Lopuksi ennustus tehdään korkeimman mahdollisen todennäköisyyden perusteella.
Logistisen regression etu: Se on erittäin tehokas ja laajalti käytetty tekniikka, koska se ei vaadi monia laskennallisia resursseja eikä vaadi viritystä.
Logistisen regression haitta: Sitä ei voida käyttää epälineaaristen ongelmien ratkaisemiseen.
Head to Head -vertailu lineaarisen regression ja logistisen regression välillä (infografia)
Alla on kuusi tärkeintä eroa lineaarisen regression ja logistisen regression välillä
Avainero lineaarisen regression ja logistisen regression välillä
Keskustelemme joistain tärkeimmistä eroista lineaarisen regression ja logistisen regression välillä
Lineaarinen regressio
- Se on lineaarinen lähestymistapa
- Se käyttää suoraa linjaa
- Se ei voi ottaa kategorisia muuttujia
- Sen on jätettävä huomioimatta puuttuvat numeerisen riippumattoman muuttujan arvot
- Lähtö Y annetaan muodossa
- Yhden yksikön lisäys x: ssä lisää Y: tä α
Sovellukset
- Tuotteen hinnan ennustaminen
- Ennustetaan ottelua ottelussa
Logistinen regressio
- Se on tilastollinen lähestymistapa
- Se käyttää sigmoid-toimintoa
- Se voi kestää kategorisia muuttujia
- Se voi tehdä päätöksiä, vaikka havainnoista puuttuisi arvoja
- Lähtö Y annetaan muodossa, missä z annetaan muodossa
- Yhden yksikön lisäys x: ssä lisää Y: tä log-kertoimella a
- Jos P on tapahtuman todennäköisyys, niin (1-P) on todennäköisyys, että tapahtumaa ei tapahdu. Menestyskertoimet = P / 1-P
Sovellukset
- Ennustetaan, onko tänään sadetta vai ei.
- Ennakoidaan onko sähköposti roskapostia vai ei.
Lineaarinen regressio vs. logistinen regressiovertailutaulukko
Keskustelemme parhaasta vertailusta lineaarisen regression ja logistisen regression välillä
Lineaarinen regressio |
Logistinen regressio |
Sitä käytetään regressio-ongelmien ratkaisemiseen | Sitä käytetään luokitteluongelmien ratkaisemiseen |
Se mallii riippuvaisen muuttujan ja yhden tai useamman riippumattoman muuttujan välisen suhteen | Se ennustaa tuloksen todennäköisyyden, jolla voi olla vain kaksi arvoa ulostulossa joko 0 tai 1 |
Ennustettu lähtö on jatkuva muuttuja | Ennustettu lähtö on diskreetti muuttuja |
Ennakoitu lähtö Y voi ylittää 0 ja 1 alueen | Ennustettu lähtö Y on välillä 0 ja 1 |
![]() | ![]() |
Ennakoitu lähtö Y voi ylittää 0 ja 1 alueen | Ennustettu lähtö |
johtopäätös
Jos piirteet eivät edistä ennustamista tai jos ne korreloivat hyvin toisiinsa, se lisää malliin melua. Joten ominaisuudet, jotka eivät vaikuta tarpeeksi malliin, on poistettava. Jos riippumattomat muuttujat korreloivat voimakkaasti, se voi aiheuttaa monikollineaarisuuden ongelman, joka voidaan ratkaista ajamalla erillisiä malleja jokaisen riippumattoman muuttujan kanssa.
Suositellut artikkelit
Tämä on opas kohtaan Lineaarinen regressio vs. logistinen regressio. Tässä keskustellaan lineaarisen regression vs. logistisen regression keskeisistä eroista infografioiden ja vertailutaulukon kanssa. Saatat myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -
- Data Science vs. tietojen visualisointi
- Koneoppiminen vs. hermoverkko
- Ohjattu oppiminen vs. syväoppiminen
- Logistinen regressio R: ssä