Johdatus tietokehyksiin R: ssä
Tietokehys on 2D (kaksiulotteinen) matriisimainen rakenne, jossa hyväksytään erilaisia tietotyyppejä, kuten merkkejä, numeerisia jne. Tietokehys on osajoukko luettelolle, jonka jokainen komponentti on yhtä pitkä. Periaatteessa tietokehys on taulukko, jossa kukin sarake sisältää yhden muuttujan arvot ja jokainen rivi sisältää yhden arvojoukon jokaisesta sarakkeesta.
Tietokehyksessä on joitain ominaisuuksia.
- Sarakkeen nimi vaaditaan
- Rivinimien tulee olla yksilöiviä
- Tuotteiden lukumäärän jokaisessa sarakkeessa tulisi olla sama
Vaiheet tietokehysten luomiseen R: ssä
Aloitetaan luomalla tietokehys, joka selitetään alla,
Vaihe 1: Luo luokan tietokehys koulussa.
Koodi:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
Kun suoritamme tämän koodin, saamme tällaisen tietokehyksen.
lähtö:
Tässä esimerkissä tietokehys on hyvin pieni, mutta tosielämässä meillä on paljon tietoa ongelman käsittelyssä. Joten tietojen rakenteen ymmärtämiseksi välitämme funktion Str ().
Vaihe 2: Lisäämme alla olevan rivin koodiin.
Koodi:
Str(tenthclass)
Kun suoritamme koko koodin, tulemme tulosteen.
lähtö:
Yllä oleva tulos tarkoittaa, että meillä on 5 havaintoa 3 muuttujasta. Sitten se selittää kunkin muuttujan tietotyypin. Kuten esimerkissämme, rullanumero on kokonaisluku, nimi on merkki ja merkit on numeroitu.
Kun ymmärrämme tietojen rakenteen, lähetämme alla mainitun koodin ymmärtääksesi tietoja statisemmin.
Vaihe 3: Käytämme nyt yhteenveto () -toimintoa
Koodi:
summary(tenthclass)
lähtö:
Yhteenveto tarjoaa paremman käsityksen tiedoistamme. Se kertoo meille, että mediaani, kvartiili, maksimi ja min. Nämä asiat auttavat meitä tekemään paremman päätöksen.
Kuinka purkaa tietoa tietokehyksistä R: ssä?
Jatkamme tässä edellä mainittua tapausta. Oletetaan, että haluamme tietää kymmenennen luokan oppilaan nimen, vain nimen. Joten miten me poimimme?
Tietokehysmme näyttää tältä.
roll_number nimimerkit
1 1 John 77
2 2 Sam 87
3 3 Casey 45
4 4 Ronald 68
5 5 Mathew 95
Saadaksesi nimen vain tulosteena, lähetämme seuraavan koodin.
Koodi:
onlyname = tenthclass$Name
print(onlyname)
lähtö:
Jos rikkomme koodin, laitamme tässä vain dollarin merkin tietokehyksen nimen ja muuttujan nimen väliin, jota haluamme tulosteena.
Mieti nyt tilannetta, opettaja haluaa tietää kaiken rullanumerosta 2, kuten hänen nimensä ja kuinka paljon hän teki maalin.
Tarvitsemme täällä kaiken rullanumerosta 2, joten välitämme alla mainitun koodin.
Koodi:
result_rollnumber2 = tenthclass(c(2), c(1:3)) print(result_rollnumber2)
lähtö:
Laajenna tietokehyksissä
Tietokehystä voidaan suurentaa ja pienentää kokoa lisäämällä tai poistamalla sarakkeita ja rivejä.
1. Lisää rivi
Meillä on kaksi tietokehystä. Yksi tietokehys kuuluu luokan kymmeneen osaan A ja toinen tietokehys luokan kymmenenteen osaan B. Nyt nämä eri osiot sulautuvat yhdeksi luokkaksi.
Esimerkki 1: luokka 10 A
Koodi:
tenthclass_sectionA = data.frame(roll_number = c(1:5),
Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass_sectionA)
lähtö:
Esimerkki 2: luokka 10 B
Koodi:
tenthclass_sectionB = data.frame(roll_number = c(6:10), Name = c("Ria", "Justin", "Bon", "Tim", "joe"),
Marks = c(68, 98, 54, 68, 42), stringsAsFactors = FALSE)
print(tenthclass_sectionB)
lähtö:
Esimerkki # 3: rbind () -toiminto
Nyt meidän on yhdistettävä nämä molemmat luokat yhdeksi luokkaksi. Käytämme tässä rbind () -toimintoa. Ainoa rajoitus uuden rivin lisäämisessä on, että meidän on tuotava uudet rivit samaan rakenteeseen kuin olemassa oleva tietokehys.
Koodi:
new_tenthclass = rbind(tenthclass_sectionA, tenthclass_sectionB)
print(new_tenthclass)
lähtö:
2. Lisää sarake
Mieti nyt tapausta, jossa meidän on lisättävä veriryhmätiedot jokaisesta luokan 10 oppilaasta. Lisäämme siihen uuden sarakkeen ja nimeämme sen nimellä “Blood_group”.
Tietokehysmme näyttää tältä.
Koodi:
tenthclass = data.frame(roll_number = c(1:5), Name = c("John", "Sam", "Casey", "Ronald", "Mathew"),
Marks = c(77, 87, 45, 68, 95), stringsAsFactors = FALSE)
print(tenthclass)
lähtö:
Koodi:
tenthclass$Blood_group = c("O", "AB", "B+", "A+", "AB")
print(tenthclass)
lähtö:
Poista rivi ja sarake tietokehyksestä
Rivin ja sarakkeen poistamiseksi tietokehyksestä käytämme seuraavaa koodin toteutusta.
1. Poista sarake
Koodi:
print(tenthclass)
lähtö:
Jos meidän on poistettava veriryhmämuuttuja (oikeanpuoleisin sarake), tässä tietokehyksessä, lähetämme alla olevan koodin.
Koodi:
tenthclass$Blood_group = NULL
print(tenthclass)
lähtö:
Ohittamalla NULL-komento voidaan poistaa muuttuja suoraan tietokehyksestämme.
2. Poista rivi
Koodi:
print(tenthclass)
lähtö:
Mieti nyt tilannetta, jossa emme tarvitse John-merkkejä, joten meidän on poistettava ylin rivi.
Koodi:
tenthclass = tenthclass(-1, ) print(tenthclass)
lähtö:
Päivitä tiedot tietokehykseen
Koodi:
print(tenthclass)
lähtö:
Oletetaan, että Sam sai 98 pistettä, mutta tietokehyksestämme 87 on merkitty kohti. Joten voimme siirtää seuraavan koodin korjataksesi sen.
Koodi:
tenthclass$Marks(2) = 98
print(tenthclass)
lähtö:
johtopäätös
Tietokehykset ovat hyvin yleinen muoto ongelmalausunnosta. Se on luettelo saman määrän rivien muuttujista, joilla on ainutlaatuiset rivitunnukset. Tämä artikkeli auttaa meitä tietämään, kuinka voimme lisätä rivin, lisätä sarakkeen, poistaa rivin, poistaa tietokehyksen sarakkeen ja siinä kerrotaan, kuinka voimme päivittää tietokehyksen tietoja.
Suositellut artikkelit
Tämä on opas R-kehyksen tietokehyksiin. Tässä keskustellaan eri vaiheista tietokehysten luomiseksi ja siitä, kuinka tietoa voidaan kerätä R-kehyksistä. Voit myös tarkastella seuraavia artikkeleita saadaksesi lisätietoja-
- 5 suosituinta tietotyyppiä
- Luettelo hyödyllisistä R-paketteista
- R CSV-tiedostot
- R-ohjelman toiminnot - Tärkeys
- Kerroin R edut