Johdanto monimuuttuja regressioon
- Termi monimuuttujassa tarkoittaa mallia, jossa on useampi kuin yksi muuttuja
- Monimuuttujaregressio on osa monimuuttujatilastoja.
- Monimuuttujainen regressio on tekniikka, jota käytetään arvioimaan yksi regressiomalli, kun lopputulosmuuttujia on enemmän kuin yksi.
- Monimuuttuja regressio käytti yleisesti koneoppimisalgoritmia, joka on ohjattu oppimisalgoritmi.
Miksi yksi regressiomalli ei toimi?
- Kuten tiedetään, regressioanalyysiä käytetään pääasiassa riippuvaisen ja riippumattoman muuttujan välisen suhteen tutkimiseen.
- Todellisessa maailmassa on monia tilanteita, joissa monet muut riippumattomat muuttujat vaikuttavat muihin muuttujiin, joten meidän on siirryttävä eri vaihtoehtoihin kuin yhteen regressiomalliin, joka voi ottaa vain yhden riippumattoman muuttujan.
Mikä on monimuuttuja regressio?
- Monimuuttuja regressio auttaa mittaamaan useamman kuin yhden riippumattoman muuttujan ja useamman kuin yhden riippuvan muuttujan kulmaa. Se löytää muuttujien välisen suhteen (lineaarisesti liittyvät).
- Sitä ennustettiin tulosmuuttujan käyttäytymisestä ja ennustajamuuttujien assosiaatiosta sekä siitä, kuinka ennustajamuuttujat muuttuvat.
- Sitä voidaan soveltaa moniin käytännön aloihin, kuten politiikkaan, talouteen, lääketieteeseen, tutkimukseen ja moniin erilaisiin yrityksiin.
- Monimuuttuja regressio on yksinkertainen jatko monelle regressiolle.
- Useita regressioita käytetään ennustamaan ja vaihtamaan yhden muuttujan arvot perustuen useamman kuin yhden ennustajamuuttujan arvon yhteisarvoon.
- Ensin otetaan esimerkki monimuuttujaregression käytön ymmärtämiseksi, sen jälkeen etsimme ratkaisua tähän kysymykseen.
Esimerkkejä monimuuttujien regressiosta
- Jos verkkokauppayritys on kerännyt tietoja asiakkailleen, kuten ikä, asiakkaan ostettu historia, sukupuoli ja yritys haluavat löytää yhteyden näiden eri huollettavien ja riippumattomien muuttujien välillä.
- Kuntosaliharjoittaja on kerännyt kuntosalilleen tulevan asiakkaansa tiedot ja haluaa seurata joitain asiakkaan asioita, jotka ovat terveyttä, ruokailutottumuksia (millaista tuotetta asiakas käyttää viikossa), asiakkaan painoa. Tämä haluaa löytää yhteyden näiden muuttujien välillä.
Kuten olette nähneet kahdessa edellä mainitussa esimerkissä, molemmissa tilanteissa on enemmän kuin yksi muuttuja, jotkut ovat riippuvaisia ja toiset ovat riippumattomia, joten yksittäinen regressio ei riitä tällaisen tiedon analysointiin.
Tässä on monimuuttuja regressio, joka tulee kuvaan.
1. Ominaisuuden valinta -
Ominaisuuksien valinnalla on tärkein rooli monimuuttujien regressiossa.
Ominaisuuden löytäminen, jota tarvitaan muuttujan löytämiseen, joka riippuu tästä ominaisuudesta.
2. Ominaisuuksien normalisointi -
Parempaa analysointia varten ominaisuuksia on skaalattava saadakseen ne tietylle alueelle. Voimme myös muuttaa kunkin ominaisuuden arvoa.
3. Valitse Tappio-toiminto ja hypoteesi -
Tappiofunktio laskee tappion, kun hypoteesi ennustaa väärän arvon.
Ja hypoteesi tarkoittaa ominaisuusmuuttujan ennustettua arvoa.
4. Aseta hypoteesiparametrit -
Aseta hypoteesiparametri, joka voi vähentää häviöfunktiota ja voi ennustaa.
5. Minimoi menetystoiminto-
Tappion minimointi käyttämällä jotakin menetyksen minimointialgoritmia ja käyttämällä sitä tietojoukon päällä, mikä voi auttaa säätämään hypoteesiparametreja. Kun menetys on minimoitu, sitä voidaan käyttää ennustamiseen.
On olemassa monia algoritmeja, joita voidaan käyttää vähentämään häviöitä, kuten gradientin laskeutuminen.
6. Testaa hypoteesitoiminto -
Tarkista hypoteesitoiminto, kuinka oikein se ennustaa arvoja, testaa se testitiedoilla.
Vaihe arkiston monimuuttujaregression seuraamiseksi
1) Tuo tarvittavat yleiset kirjastot, kuten numpy, pandas
2) Lue tietojoukko pandat-kirjaston avulla
3) Kuten olemme jo keskustelleet, meidän on normalisoitava tiedot parempien tulosten saamiseksi. Miksi normalisointia, koska jokaisella ominaisuudella on eri arvoalue.
4) Luo malli, joka voi arkistoida regression, jos käytät lineaarista regression käyttöyhtälöä
Y = mx + c
Missä x annetaan sisääntulo, m on alaviiva, c on vakio, y on lähtömuuttuja.
5) Kouluta malli hyperparametrilla. Ymmärrä hyperparametri asettaa se mallin mukaan. Kuten oppimisnopeus, aikakaudet, iteraatiot.
6) Kuten edellä on keskusteltu siitä, miten hypoteesilla on tärkeä rooli analyysissä, tarkistetaan hypoteesi ja mitataan tappio / kustannustoiminto.
7) Tappio / kustannustoiminto auttaa meitä mittaamaan, kuinka hypoteesin arvo on totta ja tarkka.
8) Tappioiden / kustannusten minimointi auttaa mallia parantamaan ennustetta.
9) Tappioyhtälö voidaan määritellä ennakoidun arvon ja todellisen arvon välisen neliöeron summana, joka on jaettu kaksinkertaisella tietojoukon koosta.
10) Lose / cost-funktion minimoimiseksi käytetään gradientin laskeutumista, se alkaa satunnaisarvolla ja löytää pisteen, jonka menetysfunktio on vähiten.
Seuraamalla yllä olevaa voimme toteuttaa monimuuttujaregression
Monimuuttuja regression edut
- Monimuuttujatekniikka mahdollistaa suhteen löytämisen muuttujien tai piirteiden välillä
- Se auttaa löytämään korrelaation riippumattomien ja riippuvien muuttujien välillä.
Monimuuttujaregression edut
- Monimuuttujatekniikat ovat vähän monimutkaisia ja korkean tason matemaattisia laskelmia
- Monimuuttuja regressiomallin lähtö ei ole helposti tulkittavissa ja joskus koska jotkut häviöt ja virheet eivät ole identtisiä.
- Sitä ei voida soveltaa pieneen tietojoukkoon, koska suurempien tietojoukkojen tulokset ovat selkeämpiä.
Johtopäätös - monimuuttuja regressio
- Monimuuttujaisen regression käytön päätarkoitus on, kun käytettävissä on useampia kuin yksi muuttuja ja tällöin yksi lineaarinen regressio ei toimi.
- Pääasiassa todellisessa maailmassa on useita muuttujia tai piirteitä, kun useita muuttujia / piirteitä tulee peliin. Monimuuttuja regressiota käytetään.
Suositellut artikkelit
Tämä on opas monimuuttujien regressioon. Tässä keskustellaan johdannosta, esimerkkeistä monimuuttujien regressiosta sekä eduista ja dis-eduista. Voit myös käydä läpi muiden ehdotettujen artikkeleidemme saadaksesi lisätietoja -
- Regressiokaava
- Data Science Course Lontoossa
- SAS-operaattorit
- Data Science -tekniikat
- Muuttujat JavaScript
- Regression tärkeimmät erot vs. luokittelu