Yleiskatsaus R-datakehykseen
Tietokehykset ovat luettelo vektoreista, joilla on yhtä pitkä pituus. Ero matriisin ja tietokehysten välillä on kuitenkin se, että tietokehykset hyväksyvät erityyppisiä tietoja. (Merkki, numeerinen jne.). Tässä aiheesta aiomme oppia R Data Frame -sovelluksesta.
Tietokehysten käytön edut
- Hajautettu tiedonkeruu ja organisoitu.
- Sillä on parempia optimointeja verrattuna relaatiotietokantaan.
- Pitää monenlaista heterogeenistä tietoa.
Tietokehyksen luominen R: ään
Luomme datakehyksen. Alla on esimerkki tietokehyksen ilmoittamisesta.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
Yllä olevassa esimerkissä emme ole määritelleet muuttujia. Katsotaan nyt, kuinka määrittelemme arvot muuttujille ja tallennamme ne tietokehykseen.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
lähtö:
Numero alfa-Boolean
1 2 x TOSI
2 3 y TOSI
3 4 z FALSE
Tietokehyksen rakenne
Kun haluamme tietää tietyn tietokehyksen rakenteen. Voimme käyttää alla olevaa toimintoa.
Tähti ()
str(Data_frame)
lähtö:
Lukumäärä: num 2 3 4
alfa: Kertoimen w / 3 tasot “x”, “y”, “z”: 1 2 3
Booleans: logi Tosi Tosi Väärä
Erityisen datan purkaminen tietokehyksestä
1. Sarakkeen nimen käyttäminen
Voimme purkaa tietyn tietoryhmän tietokehyksestä.
Otetaan edellä olevasta esimerkistämme vain ensimmäinen sarake tietokehyksestä, joka on Numero.
Data_ frame <- data. Frame(Number)
lähtö:
Määrä
1 2
2 3
3 4
2. Rivien avulla
Voimme purkaa tiedot riveistä kuten alla olevassa esimerkissä.
Oletetaan, että haluamme tulostaa vain kaksi riviä Numero-sarakkeesta.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
lähtö:
Numero alfa-Boolean
1 2 x TOSI
2 3 y TOSI
3 4 z FALSE
------------
Numero alfa-Boolean
1 2 x TOSI
2 3 y TOSI
Voimme havaita eron ensimmäisessä ja toisessa ulostulossa.
3. Tulosta tietyt rivit ja sarakkeet
Voimme myös tulostaa tiettyjä rivejä ja sarakkeita.
Alla olevassa esimerkissä tulostamme ensimmäisen ja toisen rivin, sarakkeen
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
lähtö:
Numero alfa-Boolean
1 2 x TOSI
2 3 y TOSI
3 4 z FALSE
-------------
Numero alfa
1 2 x
2 3 vuotta
4. Lisää uusi sarake tietokehykseen
Voimme lisätä toisen sarakkeen arvojen kanssa tietokehykseen.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
lähtö:
Numero alfa Boolen luokka
1 2 x TOSI A
2 3 y TODEN B
3 4 z FALSE C
5. Rivin lisääminen tietokehykseen
Käytämme rbind-toimintoa lisätäksesi uuden rivin olemassa olevaan tietokehykseen.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
lähtö:
Numero alfa Boolen luokka
1 2 x TOSI A
2 3 y TODEN B
3 4 z FALSE C
4 5 x FALSE D
6. Yhdistä molemmat tietokehykset
Voimme myös yhdistää kaksi tietokehystä yhden tulosteen tuottamiseksi.
Kahden tietokehyksen yhdistämiseksi meillä on oltava sama sarake tietokehyksille.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
lähtö:
Numero alfa-Boolean
1 2 x TOSI
2 3 y TOSI
3 4 z FALSE
--------------
Numero alfa-Boolean
1 4 x TOSI
2 5 v TOSI
3 6 z FALSE
--------------
Numero alfa-Boolean
1 2 x TOSI
2 3 y TOSI
3 4 z FALSE
4 4 x TOSI
5 5 totta
6 6 z FALSE
Tietokehysten tarkastaminen
Alla on erilaisia tapoja tarkistaa tietokehys ja se tarjoaa tietoja tietokehyksestä, kuten yllä oleva tähtitoiminto.
1. Nimet - Antaa muuttujien nimet tietokehyksessä
Syntaksi : names(data frame name)
esimerkki
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
lähtö : (1) “Numero” “alfa” “Booleans”
2. Yhteenveto - Tarjoaa tietokehyksen tilastotiedot.
Syntaksi: summary(data frame name)
esimerkki
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
lähtö:
Numero alfa-Boolean
Min. : 2.0 x: 1 Tila: looginen
1. Qu.:2.5 y: 1 FALSE: 1
Mediaani: 3, 0 z: 1 TODEN: 2
Keskiarvo: 3, 0 NA: t: 0
3. Qu.:3.5
Max. : 4, 0
3. Head - Tarjoaa muutaman ensimmäisen rivin tiedot.
Syntaksi: Head( name of the data frame)
esimerkki
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
lähtö:
Numero alfa-Boolean
1 2 x TOSI
2 3 y TOSI
3 4 z FALSE
4 5 a TOSI
5 6 b Väärä
6 7 c Väärä
4. Tail - Tulostaa muutama viimeinen rivi tietokehykseen.
Syntaksi: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
lähtö:
Numero alfa-Boolean
5 6 b Väärä
6 7 c Väärä
7 8 d Väärä
8 9 f FALSE
9 10 g FALSE
10 11 j FALSE
johtopäätös
Tietokehykset ovat tärkeä käsite R-ohjelmoinnissa. Se on helppo, mutta tehokas luomalla tietokokonaisuuksia, joita voidaan muokata ja käyttää helposti. Aineistoon, kuten matriisiin, voidaan päästä myös rivien ja sarakkeiden nimien avulla lisäämällä ja poistamalla tietoja helpoksi.
Suositellut artikkelit
Tämä on opas R-datakehykseen. Tässä keskustellaan tietokehyksen luomisesta R: ssä rakenteen kanssa ja tietyn datan poimimisesta tietokehyksestä. Saatat myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -
- Tietotyypit C: ssä
- Data Science ura
- Big Data Technologies
- Data Science Platform
- Java Booleans