Johdanto Histogrammiin R: ssä

Tässä artikkelissa aloitamme perushistogrammin avulla R-toteutuksessa ja mukautuksissa. Histogrammalla on tärkeä rooli tietoanalyysissä datan visualisoimiseksi. R-ohjelmointi on erityinen ympäristö tilastolliselle laskennalle ja tietotekniikan perusteet. R-ohjelmoinnissa tietojoukot ja toiminnot on ryhmitelty pakettien muodossa. Suurin osa visuaalisen analyysin ohjelmista hyödyntää histogrammeja ja tekee oletusarvoksi roskakorin leveyden. Niiden avulla voidaan nopeasti ymmärtää tietoa, joka on ensisijainen rooli tietojenkäsittelyssä. Täällä rakennetaan histogrammi käyttämällä R-komentoja.

Mikä on Histogram?

Histogrammi on kuvallinen esitys tietojoukon jakaumasta, jonka avulla voimme helposti analysoida mikä tekijä sisältää suuremman datan määrän ja vähiten dataa. Toisin sanoen, histogrammi mahdollistaa kumulatiivisten taajuuskäyrien tekemisen x-akselilla ja y-akselilla. Itse asiassa histogrammit käyttävät sekä ryhmitettyä että ryhmittelemätöntä tietoa. Ryhmitetylle tiedolle histogrammi rakennetaan ottamalla huomioon luokan rajat, kun taas ryhmittelemättömään dataan on tarpeen muodostaa ryhmitelty taajuusjakauma. Ne auttavat analysoimaan datan laajuutta ja sijaintia tehokkaasti. Jotakin yhteistä histogrammien rakennetta käytetään, kuten normaalia, vinossa, kalliota datan jakelun aikana.

Toisin kuin palkki, kaavion histogrammissa ei ole rakoja palkkien välillä, ja täällä olevat palkit on nimetty lokeroiksi, joiden kanssa tiedot esitetään samoin välein. Histogrammi Ottaa jatkuvan muuttujan ja jakaa välein, on tarpeen valita oikea lokeron leveys. Suurin ero palkkikaavion ja histogrammin välillä on se, että entinen käyttää nimelliset tietojoukot piirtämiseen, kun taas histogrammi kuvaa jatkuvia tietojoukkoja. R käyttää hist () -toimintoa histogrammien luomiseen. Tämä hist () -funktio käyttää arvovektoria histogrammin piirtämiseen. Histogrammi käsittää jatkuvien arvojen x-akselialueen, y-akseli kuvaa x-akselilla usein olevat data-arvot korkeuden vaihteluväleillä.

Syntaksi:

Histogrammin luomisen syntaksi on

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Histogrammin luominen R: ssä

Analyysiä varten tarkoitushistogrammi vaatii jonkin sisäänrakennetun tietojoukon tuontiin R. R: hen ja sen kirjastoissa on erilaisia ​​graafisia paketteja ja toimintoja. Tässä käytetään sveitsiläisten ja lentomatkustajien tietojoukkoa. Histogrammin laskemiseksi annetulle data-arvolle hist () -funktiota käytetään yhdessä $ -merkin kanssa tietyn tietosarakkeen valitsemiseksi tietojoukosta histogrammin luomiseksi.

Seuraava esimerkki laskee histogrammin data-arvosta Swiss-nimisen tietojoukon tarkastelu -sarakkeessa.

Esimerkki 1: Luodaan yksinkertainen histogrammi

Koodi:

hist (swiss $Examination)

lähtö:

Hist luodaan tietojoukko sveitsille pylvästutkimuksella. tämä yksinkertaisesti piirtää bin-taajuuden ja x-akselin.

Esimerkki 2: Lisää argumentteja sisältävä histogrammi

Jotta histogrammeja ymmärrettäisiin paremmin, meidän on lisättävä hist-funktioon lisää argumentteja kaavion visualisoinnin optimoimiseksi. X- ja y-tunnisteiden muuttaminen arvoalueelle xlim- ja ylim-argumentit lisätään funktioon.

Esimerkki:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

lähtö:

Koodin yläpuolella on histogrammi lentomatkustajien tietojoukon arvoille, antaa otsikon nimellä “Histogram for more arg”, x-akselin etiketti ”nimiluettelo”, jossa on vihreä reuna ja keltainen väri palkkeihin rajoittamalla arvoksi 100 - 600, y-akselille tulostetut arvot 2: lla ja aseman leveyden muuttaminen arvoon 5.

Kaksi eri väriä lisääminen palkkiin

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

lähtö:

Lisäämällä uusia palkkeja histogrammiin

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

lähtö:

Esimerkki 3: Histogrammi R: ssä antaa arvon

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

lähtö:

Esimerkki 4: Break-argumentin käyttäminen lokeron leveyden muuttamiseen

Jotta leveyden välillä olisi enemmän raja-arvoja, on edullista käyttää arvoa c () -toiminnossa.

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

lähtö:

Yllä oleva kaavio vie palkin leveyden sekvenssiarvojen läpi.

Esimerkki 5: Normaalijakaumakäyrän toteuttaminen histogrammissa

Käytämme tietoarvoa tietojoukkoa 'swiss' kuvaajan piirtämiseksi. Tässä käyräkäyrää () käytetään jakeluviivan näyttämiseen.

Koodi:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

lähtö:

Esimerkki 6: Todennäköisyysjakauman piirtäminen

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Tiheyskaavioiden luominen Histogrammissa R: ssä

Muuttujan jakauma luodaan funktiotiheydellä (). Alla on esimerkki tietojoukon mtcars kanssa. Tiheyspiirrokset auttavat muodon jakautumista.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

lähtö:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Seuraava histogrammi R: ssä näyttää korkeuden tutkimuksena x-akselilla ja tiheys on piirretty y-akselille.

lähtö:

johtopäätös

Siinä kaikki histogrammista ja histogrammi on helpoin tapa ymmärtää tietoja. Kuten olemme nähneet histogrammin kanssa, voimme piirtää yhden, useita kaavioita käyttämällä binäärin leveyttä, akselinkorjausta, värien vaihtamista jne. Histogrammi auttaa visualisoimaan datan eri muodot. Viimeinkin olemme nähneet kuinka histogrammi mahdollistaa tietojoukkojen analysoinnin ja keskipisteitä käytetään luokan leimoina. Histogrammi auttaa muuttamaan välejä tuottamaan parannetun kuvauksen tiedoista ja toimii erityisesti numeerisen datan kanssa. histogrammit ovat edullisempia analyysissä, koska niiden etuna on se, että ne esittävät suuren datajoukon. Tuloksen perusteella voimme visuaalisesti vinouttaa tietoja ja tehdä joitain oletuksia helposti.

Suositellut artikkelit

Tämä on ollut opas R: n histogrammista. Tässä olemme keskustelleet käsitteestä, syntaksista ja kuinka luoda histogrammi R: ssä esimerkkien avulla. Voit myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -

  1. Esimerkkejä histogrammista
  2. Ura R-ohjelmoinnissa
  3. Gantt-taulukko taulukossa
  4. Ura tietokoneohjelmoinnissa
  5. Kuinka luoda viivakaavio R: hen?

Luokka: