Hajapiirros R: ssä Opas kuinka luoda Scatterplot R: hen?

Sisällysluettelo:

Anonim

Johdatus Scatterplotiin R: ssä

  • R on avoimen lähdekoodin ohjelmointikieli, jota käytetään datatilastoihin ja tietojen analysointiin. Tietotekniikan kasvavan suosion myötä myös R on saanut suosiotaan. Sitä käyttävät pääasiassa tilastotieteilijät ja tietojen kaivojat arvokkaan tiedon keräämiseksi tiedoista. R on tulkittu kieli ja sillä on komentoriviliittymä, mutta käytettävissä on monia graafisia käyttöliittymiä, jotka helpottavat kehittäjän töiden tekemistä. R tarjoaa laajan valikoiman kirjastoja tilastojen ja graafisten tekniikoiden toteuttamiseksi. R tarjoaa staattisen grafiikan; sen avulla käyttäjä voi rakentaa kerroksellisen kuvaajan. Siksi se tuottaa julkaisulaatuisia kuvaajia ja tarjoaa paremman esityksen tiedoista.
  • R tarjoaa valtavan joukon kirjastoja graafiseen toteutukseen, mutta suosituin on “ggplot2”. GGPlot2 on grafiikan kielioppi, joka tekee monimutkaisten kuvaajien luomisesta yksinkertaisen. Se tarjoaa ohjelmallisen käyttöliittymän muuttujien, niiden sijainnin, kuvaajan värin, kuvaajatyyppien ja muiden visualisointiominaisuuksien määrittelemiseksi. Sen avulla voit rakentaa kuvaajia askel askeleelta, jolloin voit luoda tasoja laajalle joustavuudelle ja julkaisulaadulle.
  • Yksi tällainen kuvaajatyyppi on Scatterplot R: ssä. Scatterplot R: ssä, jota kutsutaan myös hajotusdiagrammiksi, joka on graafin tyyppi, joka näyttää korrelaation kahden muuttujan välillä. Se näyttää datapisteet pisteinä. Se voidaan piirtää jatkuvan riippumattoman muuttujan ja toisen muuttujan välillä, joka riippuu edellisestä muuttujasta tai kahdesta jatkuvasta riippumattomasta muuttujasta. Korrelaatio voi olla positiivinen, negatiivinen tai nolla. Jos kuvaajan kaltevuus on vasemmasta alakulmasta oikealle, korrelaatio on positiivinen. Jos kaltevuus on vasemmasta yläkulmasta oikealle, korrelaatio on negatiivinen tai toisin sanoen yhden muuttujan arvon kasvu vähenee toisen muuttujan arvoon.

Syntaksi: R : ssä on monia paketteja graafille, siksi on monia toimintoja Scatterplotin luomiseksi R: ssä. Alkeisin ja yksinkertaisin toiminto on

juoni (x, y)

missä

x tarkoittaa vaaka-akselia tai riippumatonta jatkuvaa muuttujaa.

y tarkoittaa pystyakselia tai riippuvaa muuttujaa.

Kuvaajatoiminnossa on monia muita parametreja, jotta kuvaaja olisi helppo ymmärtää.

Alla on joitain määritelmällä:

  • main: lisää otsikon graafiin
  • xlab: lisää tarra x-akselille
  • ylab: lisää tarran y-akselille
  • xlim: määrittää x-akselin alueen
  • ylim: määrittää y-akselin alueen
  • pch: osoittaa pisteiden muodon sirontakuvassa
  • cex: osoittaa pisteiden koon
  • col: määrittää pisteiden värin

Scatterplot in R voidaan luoda myös ggplot2-paketin avulla. Tätä varten meidän on ensin asennettava ja ladattava ggplot2-paketti. Kun paketti on lisätty alla olevaan nykyiseen istuntoon, komentoa voidaan käyttää luomaan Scatterplot R: hen.

ggplot (aineisto, aes (x, y, väri, muoto)) + geom_poin () + labs (x, y, title)

missä

  • tietojoukko on tietojoukko, jolle scatterplot on luotava.
  • aes () on esteettinen kartoitus kuvaajassa. Se kuvaa kuinka muuttujat kartoitetaan kuvaajassa.
  • x on vaaka-akseli tai riippumaton jatkuva muuttuja.
  • y on pystyakseli tai riippuvainen muuttuja.
  • väri on lisätä väriä pisteisiin perustuen ryhmittelymuuttujaan.
  • muotoa käytetään asettamaan muoto ryhmämuuttujan perusteella.
  • + -merkki osoittaa, että komento jatkuu.
  • geom_point () on funktio sirontakuvaajalle.
  • laboratoriot (x, y, otsikko): lisää x-tarra, y-tarra ja otsikko kuvaajaan.

Luo hajautusalue R: hen

Jotta voidaan luoda Scatterplot R: ssä, meidän on ensin ladattava tietojoukko. Käytämme tässä R.: n toimittamaa tietojoukkoa (mtcars). Lataa ensin tietojoukko nykyiseen istuntoon käyttämällä alla-komentoa

tiedot (iiris)

Kun tietojoukko on ladattu, tarkastele tietoja saadaksesi perustiedot tietotyypistä ja siinä olevista sarakkeista käyttämällä alla-komentoa.

iiris

Saatuaan perustiedot tiedoista, luodaan yksinkertainen sirontapiirros kuvaajatoiminnon avulla

tontti (iiris $ Sepal.pituus, iiris $ Sepal.leveys, xlim = c (4.0, 9.0), ylim = c (2.0, 5.0))

Lisätään tarroja, jotta kaaviosta voidaan lukea

tontti (iris $ Sepal.Pituus, iris $ $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = “Sepal Length”, ylab = “Sepal Width”, main = “Leveys vs. pituus ”)

Lisäämällä lisää parametria graafin houkuttelevuudesta

tontti (iris $ Sepal.Pituus, iris $ $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = “Sepal Length”, ylab = “Sepal Width”, main = “Leveys vs. pituus ”, pch = 8, cex = 1, 5, col = 6)

Näiden 2-D-kuvaajien lisäksi matriisikaaviot ja 3D-kuvaajat voidaan myös luoda R: hen.

Hajapintamatriisit

Kun tietojoukossa on enemmän kuin kaksi muuttujaa ja haluamme löytää korrelaation jokaiselle muuttujalle kaikkien muiden muuttujien kanssa, käytetään hajapiirrosmatriisia. Scatterplot-matriisin yksinkertaisin ja yksinkertaisin komento on:

paria (~ Sepal.pituus + Sepal.leveys + terälehti.pituus + terälehti.leveys, data = iiris, pää = ”Scatterplot Matrix”)

Yllä oleva kaavio näyttää korrelaation painon, mpg, dsp ja sylinnin välillä.

Scatterplot 3D

Joskus 3-ulotteinen kuvaaja antaa paremman käsityksen tiedoista. Sillä R tarjoaa useita paketteja, yksi niistä on “scatterplot3d”. Alla on komennot asentaa “scatterplot3d” R-työtilaan ja ladata se nykyiseen istuntoon

install.packages ( ”scatterplot3d”)

kirjasto (scatterplot3d)

Kun kirjasto on ladattu, alla olevien komentojen suorittaminen luo kolmiulotteisen hajautuksen.

liittää (iiris)

scatterplot3d (Sepal.Pituus, Sepal.leveys, Petal.Length, main = “3D Scatterplot”)

Tämän lisäksi on monia muita tapoja luoda kolmiulotteinen. Käyttäjät voivat myös lisätä yksityiskohtia, kuten väriä, otsikoita, jotta kaaviota voidaan parantaa. Käyttäjä voi myös luoda vuorovaikutteisen 3D-scatterplotin käyttämällä “plot3D (x, y, z)” -toimintoa, jonka tarjoaa “rgl” -paketti. Tämä toiminto luo kehräävän 3D-sirontatiedon, jota voidaan kiertää hiirellä. Siten saadaan täysi kuva muuttujien välisestä korrelaatiosta.

johtopäätös

R on yksi tunnetuimmista kielistä tietotekijöiden käyttämien graafisten tekniikoiden toteuttamisessa. Se tarjoaa laajan valikoiman grafiikkapaketteja ja -kirjastoja ja paremman tiedon ymmärtämisen. “Gglpot2”, “ggvis”, “rgl”, “plot3d”, “ristikko”, “animaatio”, “gganimate”, “kairo” ovat joitakin R: n tarjoamista paketeista.

Hajontakaavio on yksinkertaisin tapa ymmärtää tietoja paremmin. Tämän visualisoinnin avulla käyttäjä voi saada selville kuinka muuttujat liittyvät toisiinsa, kuinka yhden muuttujan arvon muuttaminen muuttaa muiden muuttujien arvoa jne. Kaaviossa on kaltevuus muuttujien välisestä positiivisesta ja negatiivisesta suhteesta.

Suositellut artikkelit

Tämä on opas Scatterplotiin R. Tässä keskustellaan johdannosta, scatterplot-matriiseista, scatterplot 3D: stä, miten scatterplot luodaan? sekä sopivia esimerkkejä. Voit myös käydä läpi muiden ehdotettujen artikkeleidemme saadaksesi lisätietoja -

  1. Mikä on GraphQL
  2. Scrum-kehys
  3. R-haastattelukysymykset
  4. Johdanto binomijakaumaan R