Úvod do balíčků R
Balíček je kolekce funkcí a datových sad. Balíčky pomáhají vylepšit funkčnost v programovacím jazyce. Pokud chceme ukládat a zpracovávat databáze (tj. Funkce podobné SQL pomocí datových rámců), můžeme použít balíček dplyr v R. Balíčky také poskytují dokumentaci o tom, jak používat funkce a datové sady v daném balíčku.
Kde najdeme balíčky?
Balíčky jsou k dispozici na internetu z různých zdrojů. Existují však určitá důvěryhodná úložiště, ze kterých můžeme balíčky stahovat.
Zde jsou dvě důležitá úložiště, která jsou k dispozici online.
- CRAN (Comprehensive R Archive Network): Toto je oficiální komunita R se sítí FTP a webovými servery, která obsahuje nejnovější kód a dokumentaci R. Před odesláním vašich balíčků online prochází řada testů, které dodržují zásady CRAN .
- GitHub: GitHub je další slavný repozitář, ale není specifický pro R.The online komunita může sdílet své balíčky s ostatními lidmi a používá se pro správu verzí. GitHub je open-source a nemá žádný proces kontroly.
Seznam užitečných R balíčků
Existuje několik balíčků v R a lze je stáhnout z CRAN nebo GitHub. Níže jsou uvedeny balíčky, které lze použít ke konkrétním účelům.
1. Načítání dat z externích zdrojů
- Haven: R čte a zapisuje data ze SAS.
- DBI: O navázání komunikace mezi relační databází a R.
- RSQlite: Používá se ke čtení dat z relačních databází.
2. Manipulace s daty
- Dplyr: Používá se pro manipulaci s daty, jako je podmnožina, poskytuje zkratky pro přístup k datům a generuje dotazy SQL.
- Tidyr - Používá se k převodu dat do malých formátů.
- stringr - manipuluje s řetězcovými výrazy a řetězci znaků.
- lubridate- Práce s daty a časem.
3. Vizualizace dat
- Rgl: Pro práci na 3D vizualizacích.
- ggvis: Vytvořit a vytvořit gramatiku grafiky.
- googlevis: Použití nástrojů vizualizace google v R.
4. Webové balíčky
- XML: Čtení a zápis XML dokumentů v R.
- Httpr: Práce s http připojeními.
- Jsonlite: Čtení datových tabulek json.
Získání R balíčků
Pomocí níže uvedeného kódu můžeme zkontrolovat dostupné balíčky, které jsou přítomny v R.
- available.packages (): V síti CRAN je k dispozici přibližně 5200 balíčků.
CRAN má zobrazení úkolů, které seskupuje balíčky podle konkrétního tématu.
Instalace balíčků R
Balíčky můžeme instalovat přímo prostřednictvím IDE nebo pomocí příkazů. K instalaci balíčků používáme níže uvedenou funkci a určíme název balíčku.
Syntax:
install.packages()
Kód:
install.packages(“ggplot2”)
Výše uvedený kód nainstaluje balíček ggplot2 a jeho závislé balíčky, pokud existují.
Můžeme nainstalovat několik balíčků najednou zadáním názvů balíků pod znakový vektor.
Syntax:
install.packages(c(“package 1”, ”package 2”, ”package 3”))
Kód:
install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))
Instalace pomocí aplikace R Studio
Výhodou použití R studia je GUI (Graphical User Interface). Můžeme si vybrat balíčky pro instalaci a jejich zdroj.
Můžeme jít na nástroje -> Instalovat balíčky.
Načítání R balíčků
Po instalaci balíčku R je musíme načíst do R, abychom mohli začít používat nainstalované balíčky.
K načtení balíčků používáme níže uvedenou funkci.
Syntax:
library(package name)
Kód:
library(ggplot2)
Existují určité balíčky, které zobrazují zprávy při načtení. Někteří ne. Podrobnosti o nainstalované knihovně můžeme vidět pomocí níže uvedeného kódu.
Kód:
library(ggplot2)
search()
Výstup:
“Package: lattice” “package: ggplot2” “package: makinglides”
„Package: knitr“ „package: slidify“ „tools: rstudio“
Vytvoření vlastního balíčku
Před vytvořením vlastního balíčku. Než začneme vytvářet balíček, měli bychom mít na paměti níže uvedený kontrolní seznam.
- Organizace kódu je jednou z nejdůležitějších věcí při psaní kódu v balíčku. Ztrácíme polovinu času hledáním umístění kódu namísto vylepšování kódu. Vložte všechny soubory do snadno přístupné složky.
- Dokumentace kódu vám pomůže pochopit účel kódu. Když tento kód často nebudeme opakovat, zapomínáme, proč jsme ho napsali určitým způsobem. Také může lidem pomoci lépe porozumět vašemu kódu, když je s nimi sdílíte.
- Sdílení skriptů prostřednictvím e-mailu se stalo archaickým. Snadným způsobem je nahrát svůj kód a distribuovat jej na GitHubu. Je možné získat zpětnou vazbu, která vám pomůže vylepšit kód.
Chcete-li vytvořit svůj vlastní balíček, musíme nainstalovat balíček devtools.
Kód:
install.packages("devtools")
K pomoci s dokumentací můžeme použít níže uvedený balíček.
Kód:
install.packages("roxygen2")
Po instalaci balíčku devtools. Můžete si vytvořit svůj vlastní balíček.
Kód:
devtools::create ("packagename")
Místo „packagename“ můžete zadat jméno, které si přejete. Nyní můžete do tohoto balíčku přidat své funkce.
Můžete vytvořit stejný název souboru jako název funkce.
Syntax:
Devtools:create(“firstpackage”)
Distribuční balíček
Balíček můžete distribuovat na githubu pomocí balíčku devtools.
Pomocí níže uvedeného kódu distribuujeme náš balíček na githubu.
Kód:
devtools::install_github("yourusername/firstpackage")
Výše můžete zadat své uživatelské jméno a název balíčku github.
Zde jsou požadované soubory pro balíček
- Funkce
- Dokumentace
- Data
Jakmile máme všechny výše uvedené soubory, je dobré je zaúčtovat do úložiště.
Doporučené články
Toto je průvodce R balíčky. Zde probereme seznam užitečných balíčků R, instalaci balíčků pomocí R studio a vytvoření vlastního balíčku atd. Další informace naleznete také v následujících článcích -
- Co je to programovací jazyk R?
- Kariéra v programování R
- R Programování vs Python
- MySQL vs SQLite
- Seznam R balíčků