Johdanto Boxplot-tarroihin R: ssä

Boxplot-etiketit auttavat visualisoimaan hajautettua tietoa R: ssä. Graafi edustaa keskiarvoa, mediaania ja varianssia. Arvot annetaan tulona toimintokenttään (). Boxplot () -toiminto luo boxplot annetun syöttötiedon avulla. Boxplot voidaan luoda yksittäisille muuttujille tai ryhmälle.

Pöytäkaavion kuvaaja

  • Tarvitsemme viisi arvostettua panosta, kuten keskiarvo, varianssi, mediaani, ensimmäinen ja kolmas kvartiili.
  • Tunnistetaan, onko tiedoissa poikkeamia.
  • Suunnittele malli tietojen piirtämistä varten.

Parametrit boxplot () -toiminnon alla

  1. kaava: Tämä parametri sallii vuotanut numeerisen arvon useisiin ryhmiin.
  2. Data :: Tulotiedot, jotka sisältävät joko tietokehyksen tai luettelon.
  3. Alajoukko: Valinnainen vektoriparametri alajoukon määrittämiseksi piirtämistä varten.
  4. xlab: x-akselin merkintä
  5. ylab: y-akselin merkintä.
  6. alue: alue määrittää kuvaajalaajennukset.
  7. toiminta: määritä, mitä tapahtuu, kun arvo on nolla. Jätä sivu vaste tai arvo.

Satunnaisten tietojen luominen

Voimme luoda satunnaisia ​​näytteetietoja rnorm () -toiminnon kautta.

Otetaan nyt rnorm () luodaksesi 10 arvon satunnainen näytedata.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

Yllä oleva komento tuottaa 10 satunnaista arvoa, joiden keskiarvo on 3 ja keskihajonta = 2, ja tallentaa sen tietokehykseen.

Tulostamalla tietoja saadaan alla oleva tulos.

STAT1

1 2, 662022

2 2, 184315

3 5, 974787

4 4, 536203

5 4, 808296

6 3, 817232

7 1, 135339

8 1, 583991

9 3.308994

10 4, 649170

Voimme muuntaa saman tulon (tiedot) boxplot-funktioon, joka tuottaa kuvaajan.

Lisäämme arvoihin lisätietoja ja näemme kuinka kuvaaja muuttuu.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

Lisäämällä satunnaisia ​​arvoja ja käyttämällä sitä kuvaajan esittämiseen.

Alla on arvoja, jotka tallennetaan datamuuttujaan.

TILA 1TILA 2TILA 3TILA 4
3.7954654, 218645.8275852.157315
0.9117264, 091196.2608112, 26594
3.7078283, 359875, 889453.714557
0.1157724, 51235.9348582, 40645
0.6975562, 159456, 811472.571304
5.1292313, 26986.2500683.025175
5.4041014, 389395.6700612, 9901
1.4550663, 130595.6923232, 69693
0.8686365, 423115.4154352.674768
2, 141133, 907286.2060592.806656

Alla on boxplot-kuvaaja, jossa on 40 arvoa. Meillä on 1-7 numeroa y-akselilla ja stat1 - stat4 x-akselilla.

Voimme muuttaa x-akselin tekstin kohdistusta käyttämällä toista parametria nimeltä las = 2.

R Boxplot -leimojen kaavion analysointi

Olemme antaneet syötteen tietokehykseen ja näemme yllä olevan kuvaajan.

Tietojen ymmärtämiseksi tarkastellaan stat1-arvoja.

Lohko kuvaa kaikkia 5 arvoa. Alkaen vähimmäisarvosta alhaalta ja sitten kolmannesta kvartilasta, keskimääräisestä, ensimmäisestä kvartilasta ja minimiarvosta.

Yllä olevassa kuvaajassa on tekstin kohdistus vaakatasossa x-akselilla.

Värin vaihtaminen

Kaikissa yllä olevissa esimerkeissä olemme nähneet juonen mustana ja valkoisena. Katsotaanpa kuinka muuttaa tontin väriä.

Voimme lisätä parametrin col = väri boxplot () -toimintoon.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Alla näemme juoniulostulon punaisella.

Käyttämällä samaa yllä olevaa koodia, voimme lisätä useita värejä kuvaajaan.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Tarrojen lisääminen

Voimme lisätä tarroja käyttämällä xlab, ylab -parametreja boxplot () -toiminnossa.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

Pääparametria käyttämällä voimme lisätä otsikon kuvaajaan.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

Lovi-parametria käytetään kuvaajan ymmärrettävyyden parantamiseksi. Koska stat1: n stat4: n mediaanit eivät vastaa yllä olevaa kuvaajaa.

Box-tontin edut ja haitat

edut

  • Suurten tietomäärien yhteenveto on helppoa boxplot-tarrojen avulla.
  • Näyttää alueen ja datan jakauman akselilla.
  • Se osoittaa symmetriaa ja vinoutta
  • Auttaa tunnistamaan poikkeavuudet tiedoissa.

haitat

  • Voidaan käyttää vain numeerisiin tietoihin.
  • Jos tiedoissa on eroja, laatikkokaavio ei voi olla tarkka.

Huomautuksia:

  1. Kaaviot on merkittävä oikein.
  2. Vaa'at ovat tärkeitä; asteikon muuttaminen voi antaa tiedolle erilaisen näkymän.
  3. Tietojen vertaamisen oikeisiin asteikkoihin tulisi olla johdonmukaisia

Johtopäätös - R Boxplot -etiketit

Tietoryhmittely on helppoa ruudukkojen avulla. Box-tuki tukee useita muuttujia sekä erilaisia ​​optimointeja. Voimme myös vaihdella asteikkoja datan mukaan.

Boxplot -sovelluksia voidaan käyttää erilaisten datamuuttujien tai joukkojen vertaamiseen.

Boxplotin käyttö on helppoa ja kätevää. Tarvitsemme johdonmukaisia ​​tietoja ja asianmukaisia ​​etikettejä. Boxplotteja käytetään usein informaatiotieteessä ja jopa myyntitiimien avulla ryhmitellä ja vertailla tietoja. Boxplot antaa tietoa tietojen mahdollisuuksista ja optimoinneista, jotka voidaan tehdä myynnin lisäämiseksi.

Boxplot on mielenkiintoinen tapa testata tietoja, joka antaa käsityksen tietojen vaikutuksesta ja potentiaalista.

Suositellut artikkelit

Tämä on opas R Boxplot -tarroihin. Tässä keskustellaan boxplot () -toiminnon alla olevista parametreistä, kuinka luoda satunnaista tietoa muuttamalla väri- ja kuvaaja-analyysiä sekä etuja ja haittoja. Voit myös tarkastella seuraavaa artikkelia saadaksesi lisätietoja -

  1. Tiedon visualisoinnin tyypit
  2. Tietovaraston toteutus
  3. Data Science -tekniikat
  4. Mikä on Data Cube?

Luokka: