Katsaus kaksisuuntaiseen ANOVAan R: ssä
Kaksisuuntainen ANOVA (varianssianalyysi) auttaa meitä ymmärtämään yhden jatkuvasti riippuvan muuttujan ja kahden kategorisen riippumattoman muuttujan välisen suhteen. Tässä aiheessa aiomme oppia Two Way ANOVAsta R.
Alla on kiinnostava hypoteesi kaksisuuntaisen ANOVA: n alla
- H₀: Kutsu sitä päätehosteeksi, joka on ensimmäinen tekijä, joka riippuu jatkuvasta muuttujasta
- H₀: Päävaikutus koskee myös vaikutusta toiseen muuttujaan riippuvaisesta jatkuvasta muuttujasta.
- H₀: Vuorovaikutus on sekä ensimmäisen että toisen tekijän muuttujan yhdistetty vaikutus riippuvaiseen muuttujaan
Alla on normit, jotka kaksisuuntaisen ANOVA: n on täytettävä.
- Havaintojen on oltava riippumattomia
- Havainnot tulisi jakaa normaalisti.
- Havainnoissa tulisi olla sama variaatio
- Ei suunnittelussa poikkeavia
- Virheiden tulee olla riippumattomia.
Huomautus
Meidän on muutettava tietomme, jos normaalisuutta ja yhtäläistä varianssia rikotaan.
Esimerkki kaksisuuntaisesta ANOVA: sta R: ssä
Suoritetaan yksisuuntainen ANOVA-testi syöpätasojen tietojoukolle, joka sisältää 48 riviä ja 3 tietomuuttujaa:
Aika: Eläimen eloonjäämisaika
Eri syöpätasot 1 - 3
Hoito: Hoidot, joita käytetään 1.-3
Ennen testausta tarvitsemme seuraavat tiedot kädessä.
- Tietojen tuominen
- Poista tarpeeton muuttuja
- Muunna muuttujat (syöpätasot) tilattuun tasoon.
Alla on tietojoukko.
Havainnot: 48
Muuttujat: 3
selviytymisaika 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…
syöpätasot 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…
Hoito A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, B, …
tavoitteet
- H₀: ei muutosta keskimääräisessä eloonjäämisajassa ryhmien välillä
- H₀: selviytymisaika on erilainen ainakin yhdellä ryhmällä.
Askeleet
- Tarkista syöpätasot. Voimme nähdä kolme merkkiarvoa, koska muuntamme ne tekijöiksi mutatoidulla verbillä.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Laske sekä keskimääräinen että keskihajonta
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
lähtö:
Sormuste: 3 x 4
syöpätasojen lukumäärän peruutusaste keskiarvoajan sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 277650 0, 06227627
- Vaiheessa 3 voit tarkistaa graafisesti, onko jakaumien välillä eroa. Huomaa, että mukana on säröillä oleva piste.
- Suorita testi komennolla AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Syntaksi:
y ~ X1 + X2 +… + Xn (X1 + X2 +… viittaa riippumattomiin muuttujiin)
y ~. Käytä kaikkia muita muuttujia itsenäisinä muuttujina
Muista tallentaa malli ja tulostaa yhteenveto.
Koodi
- aov (aika ~ syöpätasot, data = df): Suorita ANOVA-testi seuraavalla kaavalla
- yhteenveto (anova_one_way): Tulosta testin yhteenveto
Df Sum Sq Keskimääräinen Sq F-arvo Pr (> F)
Syöpätasot 2 1, 033 0, 5165 11, 79 7, 66e-05 ***
Jäännökset 45 1, 972 0, 0438
-
SIGNIF. koodit: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1
P-arvo on alempi kuin kynnysarvo 0, 05. Tilastollinen ero on merkitty '*' yllä olevassa tapauksessa.
Yhdensuuntainen testi kaksisuuntaiseen Anovaan R
Katsotaan kuinka yksisuuntainen testi voidaan laajentaa kaksisuuntaiseen ANOVAan. Testi on samanlainen kuin yksisuuntainen ANOVA, mutta kaava eroaa ja lisää kaavaan toisen ryhmämuuttujan.
y = x1 + x2
- H0 : Keskiarvot ovat molemmille muuttujille (tekijämuuttujat)
- H3 : Keskiarvot ovat erilaisia molemmille muuttujille
Lisäät hoitomuuttujat malliin. Tämä muuttuja osoittaa potilaalle suoritetun hoidon. Olet kiinnostunut näkemään, onko syöpätason ja potilaalle annetun hoidon välillä tilastollinen riippuvuus.
Mukautamme koodiamme lisäämällä herkku toisella riippumattomalla muuttujalla.
Df Sum Sq Keskimääräinen Sq F-arvo Pr (> F)
Syöpätasot 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***
Hoito 3 0, 9212 0, 3071 12, 27 6.7e-06 ***
Jäännökset 42 1, 0509 0, 0250
Sekä syöpätasot että hoito ovat tilastollisesti erilaisia kuin 0. Tällä voidaan hylätä NULL-hypoteesi. Varmista myös, että syövän hoidon tai tyypin muuttaminen vaikuttaa selviytymiseen.
Testata
Yhdensuuntainen ANOVA: H3- Keskiarvo on erilainen ainakin yhdellä ryhmällä
Kaksisuuntainen ANOVA: H3- keskiarvo on erilainen molemmille ryhmille.
Ero yhden ja kaksisuuntaisen ANOVA: n välillä
Erot yksisuuntaisen ANOVA: n ja kaksisuuntaisen ANOVA: n välillä
Yksisuuntainen ANOVA | Kaksisuuntainen ANOVA |
Suunniteltu mahdollistamaan tasa-arvotestaus kolmen tai useamman välineen välillä | Suunniteltu arvioimaan kahden riippumattoman muuttujan keskinäisiä suhteita riippuvaisesta muuttujasta. |
Sisältää yhden itsenäisen muuttujan | Sisältää kaksi riippumatonta muuttujaa |
Analysoidaan 3 tai useammassa kategorisessa ryhmässä. | Vertaa useita tekijöiden ryhmiä |
Täytyy tyydyttää kaksi periaatetta - toisto ja satunnaistaminen | Sen on täytettävä kolme periaatetta, jotka ovat replikointi, satunnaistaminen ja paikallinen hallinta. |
Kaksisuuntaisen ANOVAn edut
- Yllä olevassa esimerkissä ikä ja sukupuoli esimerkissämme - auttavat vähentämään virheen vaihtelua ja tekevät suunnittelusta tehokkaamman.
- Kaksisuuntainen ANOVA antaa meille mahdollisuuden testata kahden tekijän vaikutus samanaikaisesti.
ANOVAn sovellukset
- Eri ajoneuvojen, polttoaine- ja tietyyppien ajokilometrien vertailu.
- Lämpötilan, paineen tai kemiallisen pitoisuuden vaikutus joihinkin kemiallisiin reaktioihin (voimareaktorit, kemialliset laitokset jne.)
- Eri katalysaattorien vaikutus kemiallisiin reaktionopeuksiin
- Mainosten vaikutusten ja erilaisten asiakasvastausten ymmärtäminen.
- Suorituskyvyn, laadun ja nopeuden valmistuksen vaikutukset biologiassa (prosessi perustuu solujen määrään, johon ne jaetaan)
Suositellut artikkelit
Tämä on opas kaksisuuntaiseen ANOVAan R: ssä. Tässä keskustelemme esimerkeistä, tavoitteista, vaiheista ja erotuksesta yksisuuntaisen ja kaksisuuntaisen ANOVA: n välillä. Saatat myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -
- ANOVA R: ssä
- Tulosten tulkinta ANOVA-testiä käyttämällä
- Regressio vs. ANOVA
- GLM R: ssä