Přehled R datového rámce

Datové rámce jsou seznamem vektorů se stejnou délkou. Rozdíl mezi maticovými a datovými rámci je však v tom, že datové rámce přijímají různé typy dat. (Znak, číselný atd.). V tomto tématu se budeme učit o R datovém rámci.

Výhody použití datových rámců

  • Distribuovaný sběr dat a organizovaný.
  • Má lepší optimalizace ve srovnání s relační databází.
  • Obsahuje různorodá data, která jsou různorodá.

Vytvoření datového rámce v R

Vytváříme data_frame. Níže je uveden příklad deklarace datového rámce.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

Ve výše uvedeném příkladu jsme nedefinovali proměnné. Podívejme se nyní, jak přiřazujeme hodnoty proměnným a ukládáme je do datového rámce.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Výstup:

Číslo alfa Booleans

1 2 x PRAVDA

2 3 y PRAVDA

3 4 z FALSE

Struktura datového rámce

Když chceme znát strukturu konkrétního datového rámce. Můžeme použít níže uvedenou funkci.

Hvězda ()

str(Data_frame)

Výstup:

Číslo: num 2 3 4

alfa: Faktor w / 3 úrovně „x“, „y“, „z“: 1 2 3

Booleans: logi TRUE TRUE FALSE

Extrahování specifických dat z datového rámce

1. Pomocí názvu sloupce

Z datového rámce můžeme extrahovat konkrétní sadu dat.

Z výše uvedeného příkladu vyjdeme z datového rámce, který je číslo, pouze první sloupec.

Data_ frame <- data. Frame(Number)

Výstup:

Číslo

1 2

2 3

3 4

2. Pomocí řádků

Data můžeme z řádků extrahovat stejně jako v níže uvedeném příkladu.

Předpokládejme, že chceme vytisknout pouze dva řádky sloupce Number.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Výstup:

Číslo alfa Booleans

1 2 x PRAVDA

2 3 y PRAVDA

3 4 z FALSE

------------

Číslo alfa Booleans

1 2 x PRAVDA

2 3 y PRAVDA

Můžeme pozorovat rozdíl v prvním a druhém výstupu.

3. Tisk konkrétních řádků a sloupců

Můžeme také tisknout konkrétní řádky a sloupce.

V níže uvedeném příkladu tiskneme 1. a 2. řádky, sloupce

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Výstup:

Číslo alfa Booleans

1 2 x PRAVDA

2 3 y PRAVDA

3 4 z FALSE

-------------

Číslo alfa

1 2 x

2 3 y

4. Přidání dalšího sloupce do datového rámce

Do datového rámce můžeme přidat další sloupec spolu s hodnotami.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Výstup:

Třída alfa booleovských tříd

1 2 x PRAVDA A

2 3 y PRAVDA B

3 4 z FALSE C

5. Přidání řádku do datového rámce

Pomocí funkce rbind přidáme nový řádek do existujícího datového rámce.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Výstup:

Třída alfa booleovských tříd

1 2 x PRAVDA A

2 3 y PRAVDA B

3 4 z FALSE C

4 5 x FALSE D

6. Kombinace obou datových rámců

Můžeme také zkombinovat dva datové rámce a vytvořit jediný výstup.

Ke zkombinování dvou datových rámců musíme mít stejný datový sloupec.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Výstup:

Číslo alfa Booleans
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
--------------
Číslo alfa Booleans
1 4 x PRAVDA
2 5 let PRAVDA
3 6 z FALSE

--------------

Číslo alfa Booleans
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
4 4 x PRAVDA
5 5 let PRAVDA
6 6 z FALSE

Kontrola datových rámců

Níže jsou uvedeny různé způsoby kontroly datového rámce a poskytuje informace o datovém rámci stejně jako výše uvedená funkce hvězdy.

1. Názvy - Uvádí názvy proměnných v datovém rámci

Syntaxe : names(data frame name)

Příklad

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

výstup : (1) „Number“ „alpha“ „Booleans“

2. Shrnutí - Poskytuje statistiky datového rámce.

Syntaxe: summary(data frame name)

Příklad

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Výstup:

Číslo alfa Booleans
Min. : 2, 0 x: 1 režim: logický
1. Qu.:2.5 y: 1 FALSE: 1
Medián: 3, 0 z: 1 PRAVDA: 2
Průměr: 3, 0 NA: 0
3. kv.:3.5
Max. : 4.0

3. Head - Poskytuje data pro několik prvních řádků.

Syntaxe: Head( name of the data frame)

Příklad

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Výstup:

Číslo alfa Booleans
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
4 5 PRAVDA
5 6 b FALSE
6 7 c FALSE

4. Ocas - Vytiskne několik posledních řádků v datovém rámci.

Syntaxe: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Výstup:

Číslo alfa Booleans
5 6 b FALSE
6 7 c FALSE
7 8 d FALSE
8 9 f FALSE
9 10 g FALSE
10 11 j FALSE

Závěr

Datové rámce jsou důležitým konceptem v programování R. Je snadné, ale výkonné při vytváření datových sad, které lze snadno modifikovat a získat k nim přístup. Stejně jako matice lze k datovým sadám přistupovat prostřednictvím řádků a názvů sloupců, což usnadňuje přidávání a odebírání dat.

Doporučené články

Toto je průvodce R datovým rámcem. Zde diskutujeme Vytvoření datového rámce v R se strukturou a extrahování specifických dat z datového rámce. Další informace naleznete také v následujících článcích -

  1. Typy dat v C
  2. Kariéra Data Science
  3. Technologie velkých dat
  4. Data Science Platform
  5. Java Booleans

Kategorie: