Yleiskatsaus R-datakehykseen

Tietokehykset ovat luettelo vektoreista, joilla on yhtä pitkä pituus. Ero matriisin ja tietokehysten välillä on kuitenkin se, että tietokehykset hyväksyvät erityyppisiä tietoja. (Merkki, numeerinen jne.). Tässä aiheesta aiomme oppia R Data Frame -sovelluksesta.

Tietokehysten käytön edut

  • Hajautettu tiedonkeruu ja organisoitu.
  • Sillä on parempia optimointeja verrattuna relaatiotietokantaan.
  • Pitää monenlaista heterogeenistä tietoa.

Tietokehyksen luominen R: ään

Luomme datakehyksen. Alla on esimerkki tietokehyksen ilmoittamisesta.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

Yllä olevassa esimerkissä emme ole määritelleet muuttujia. Katsotaan nyt, kuinka määrittelemme arvot muuttujille ja tallennamme ne tietokehykseen.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

lähtö:

Numero alfa-Boolean

1 2 x TOSI

2 3 y TOSI

3 4 z FALSE

Tietokehyksen rakenne

Kun haluamme tietää tietyn tietokehyksen rakenteen. Voimme käyttää alla olevaa toimintoa.

Tähti ()

str(Data_frame)

lähtö:

Lukumäärä: num 2 3 4

alfa: Kertoimen w / 3 tasot “x”, “y”, “z”: 1 2 3

Booleans: logi Tosi Tosi Väärä

Erityisen datan purkaminen tietokehyksestä

1. Sarakkeen nimen käyttäminen

Voimme purkaa tietyn tietoryhmän tietokehyksestä.

Otetaan edellä olevasta esimerkistämme vain ensimmäinen sarake tietokehyksestä, joka on Numero.

Data_ frame <- data. Frame(Number)

lähtö:

Määrä

1 2

2 3

3 4

2. Rivien avulla

Voimme purkaa tiedot riveistä kuten alla olevassa esimerkissä.

Oletetaan, että haluamme tulostaa vain kaksi riviä Numero-sarakkeesta.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

lähtö:

Numero alfa-Boolean

1 2 x TOSI

2 3 y TOSI

3 4 z FALSE

------------

Numero alfa-Boolean

1 2 x TOSI

2 3 y TOSI

Voimme havaita eron ensimmäisessä ja toisessa ulostulossa.

3. Tulosta tietyt rivit ja sarakkeet

Voimme myös tulostaa tiettyjä rivejä ja sarakkeita.

Alla olevassa esimerkissä tulostamme ensimmäisen ja toisen rivin, sarakkeen

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

lähtö:

Numero alfa-Boolean

1 2 x TOSI

2 3 y TOSI

3 4 z FALSE

-------------

Numero alfa

1 2 x

2 3 vuotta

4. Lisää uusi sarake tietokehykseen

Voimme lisätä toisen sarakkeen arvojen kanssa tietokehykseen.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

lähtö:

Numero alfa Boolen luokka

1 2 x TOSI A

2 3 y TODEN B

3 4 z FALSE C

5. Rivin lisääminen tietokehykseen

Käytämme rbind-toimintoa lisätäksesi uuden rivin olemassa olevaan tietokehykseen.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

lähtö:

Numero alfa Boolen luokka

1 2 x TOSI A

2 3 y TODEN B

3 4 z FALSE C

4 5 x FALSE D

6. Yhdistä molemmat tietokehykset

Voimme myös yhdistää kaksi tietokehystä yhden tulosteen tuottamiseksi.

Kahden tietokehyksen yhdistämiseksi meillä on oltava sama sarake tietokehyksille.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

lähtö:

Numero alfa-Boolean
1 2 x TOSI
2 3 y TOSI
3 4 z FALSE
--------------
Numero alfa-Boolean
1 4 x TOSI
2 5 v TOSI
3 6 z FALSE

--------------

Numero alfa-Boolean
1 2 x TOSI
2 3 y TOSI
3 4 z FALSE
4 4 x TOSI
5 5 totta
6 6 z FALSE

Tietokehysten tarkastaminen

Alla on erilaisia ​​tapoja tarkistaa tietokehys ja se tarjoaa tietoja tietokehyksestä, kuten yllä oleva tähtitoiminto.

1. Nimet - Antaa muuttujien nimet tietokehyksessä

Syntaksi : names(data frame name)

esimerkki

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

lähtö : (1) “Numero” “alfa” “Booleans”

2. Yhteenveto - Tarjoaa tietokehyksen tilastotiedot.

Syntaksi: summary(data frame name)

esimerkki

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

lähtö:

Numero alfa-Boolean
Min. : 2.0 x: 1 Tila: looginen
1. Qu.:2.5 y: 1 FALSE: 1
Mediaani: 3, 0 z: 1 TODEN: 2
Keskiarvo: 3, 0 NA: t: 0
3. Qu.:3.5
Max. : 4, 0

3. Head - Tarjoaa muutaman ensimmäisen rivin tiedot.

Syntaksi: Head( name of the data frame)

esimerkki

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

lähtö:

Numero alfa-Boolean
1 2 x TOSI
2 3 y TOSI
3 4 z FALSE
4 5 a TOSI
5 6 b Väärä
6 7 c Väärä

4. Tail - Tulostaa muutama viimeinen rivi tietokehykseen.

Syntaksi: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

lähtö:

Numero alfa-Boolean
5 6 b Väärä
6 7 c Väärä
7 8 d Väärä
8 9 f FALSE
9 10 g FALSE
10 11 j FALSE

johtopäätös

Tietokehykset ovat tärkeä käsite R-ohjelmoinnissa. Se on helppo, mutta tehokas luomalla tietokokonaisuuksia, joita voidaan muokata ja käyttää helposti. Aineistoon, kuten matriisiin, voidaan päästä myös rivien ja sarakkeiden nimien avulla lisäämällä ja poistamalla tietoja helpoksi.

Suositellut artikkelit

Tämä on opas R-datakehykseen. Tässä keskustellaan tietokehyksen luomisesta R: ssä rakenteen kanssa ja tietyn datan poimimisesta tietokehyksestä. Saatat myös katsoa seuraavia artikkeleita saadaksesi lisätietoja -

  1. Tietotyypit C: ssä
  2. Data Science ura
  3. Big Data Technologies
  4. Data Science Platform
  5. Java Booleans

Luokka: