Přehled R datového rámce
Datové rámce jsou seznamem vektorů se stejnou délkou. Rozdíl mezi maticovými a datovými rámci je však v tom, že datové rámce přijímají různé typy dat. (Znak, číselný atd.). V tomto tématu se budeme učit o R datovém rámci.
Výhody použití datových rámců
- Distribuovaný sběr dat a organizovaný.
- Má lepší optimalizace ve srovnání s relační databází.
- Obsahuje různorodá data, která jsou různorodá.
Vytvoření datového rámce v R
Vytváříme data_frame. Níže je uveden příklad deklarace datového rámce.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
Ve výše uvedeném příkladu jsme nedefinovali proměnné. Podívejme se nyní, jak přiřazujeme hodnoty proměnným a ukládáme je do datového rámce.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Výstup:
Číslo alfa Booleans
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
Struktura datového rámce
Když chceme znát strukturu konkrétního datového rámce. Můžeme použít níže uvedenou funkci.
Hvězda ()
str(Data_frame)
Výstup:
Číslo: num 2 3 4
alfa: Faktor w / 3 úrovně „x“, „y“, „z“: 1 2 3
Booleans: logi TRUE TRUE FALSE
Extrahování specifických dat z datového rámce
1. Pomocí názvu sloupce
Z datového rámce můžeme extrahovat konkrétní sadu dat.
Z výše uvedeného příkladu vyjdeme z datového rámce, který je číslo, pouze první sloupec.
Data_ frame <- data. Frame(Number)
Výstup:
Číslo
1 2
2 3
3 4
2. Pomocí řádků
Data můžeme z řádků extrahovat stejně jako v níže uvedeném příkladu.
Předpokládejme, že chceme vytisknout pouze dva řádky sloupce Number.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Výstup:
Číslo alfa Booleans
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
------------
Číslo alfa Booleans
1 2 x PRAVDA
2 3 y PRAVDA
Můžeme pozorovat rozdíl v prvním a druhém výstupu.
3. Tisk konkrétních řádků a sloupců
Můžeme také tisknout konkrétní řádky a sloupce.
V níže uvedeném příkladu tiskneme 1. a 2. řádky, sloupce
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Výstup:
Číslo alfa Booleans
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
-------------
Číslo alfa
1 2 x
2 3 y
4. Přidání dalšího sloupce do datového rámce
Do datového rámce můžeme přidat další sloupec spolu s hodnotami.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Výstup:
Třída alfa booleovských tříd
1 2 x PRAVDA A
2 3 y PRAVDA B
3 4 z FALSE C
5. Přidání řádku do datového rámce
Pomocí funkce rbind přidáme nový řádek do existujícího datového rámce.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Výstup:
Třída alfa booleovských tříd
1 2 x PRAVDA A
2 3 y PRAVDA B
3 4 z FALSE C
4 5 x FALSE D
6. Kombinace obou datových rámců
Můžeme také zkombinovat dva datové rámce a vytvořit jediný výstup.
Ke zkombinování dvou datových rámců musíme mít stejný datový sloupec.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Výstup:
Číslo alfa Booleans
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
--------------
Číslo alfa Booleans
1 4 x PRAVDA
2 5 let PRAVDA
3 6 z FALSE
--------------
Číslo alfa Booleans
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
4 4 x PRAVDA
5 5 let PRAVDA
6 6 z FALSE
Kontrola datových rámců
Níže jsou uvedeny různé způsoby kontroly datového rámce a poskytuje informace o datovém rámci stejně jako výše uvedená funkce hvězdy.
1. Názvy - Uvádí názvy proměnných v datovém rámci
Syntaxe : names(data frame name)
Příklad
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
výstup : (1) „Number“ „alpha“ „Booleans“
2. Shrnutí - Poskytuje statistiky datového rámce.
Syntaxe: summary(data frame name)
Příklad
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Výstup:
Číslo alfa Booleans
Min. : 2, 0 x: 1 režim: logický
1. Qu.:2.5 y: 1 FALSE: 1
Medián: 3, 0 z: 1 PRAVDA: 2
Průměr: 3, 0 NA: 0
3. kv.:3.5
Max. : 4.0
3. Head - Poskytuje data pro několik prvních řádků.
Syntaxe: Head( name of the data frame)
Příklad
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Výstup:
Číslo alfa Booleans
1 2 x PRAVDA
2 3 y PRAVDA
3 4 z FALSE
4 5 PRAVDA
5 6 b FALSE
6 7 c FALSE
4. Ocas - Vytiskne několik posledních řádků v datovém rámci.
Syntaxe: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Výstup:
Číslo alfa Booleans
5 6 b FALSE
6 7 c FALSE
7 8 d FALSE
8 9 f FALSE
9 10 g FALSE
10 11 j FALSE
Závěr
Datové rámce jsou důležitým konceptem v programování R. Je snadné, ale výkonné při vytváření datových sad, které lze snadno modifikovat a získat k nim přístup. Stejně jako matice lze k datovým sadám přistupovat prostřednictvím řádků a názvů sloupců, což usnadňuje přidávání a odebírání dat.
Doporučené články
Toto je průvodce R datovým rámcem. Zde diskutujeme Vytvoření datového rámce v R se strukturou a extrahování specifických dat z datového rámce. Další informace naleznete také v následujících článcích -
- Typy dat v C
- Kariéra Data Science
- Technologie velkých dat
- Data Science Platform
- Java Booleans