Úvod do balíčků R

Balíček je kolekce funkcí a datových sad. Balíčky pomáhají vylepšit funkčnost v programovacím jazyce. Pokud chceme ukládat a zpracovávat databáze (tj. Funkce podobné SQL pomocí datových rámců), můžeme použít balíček dplyr v R. Balíčky také poskytují dokumentaci o tom, jak používat funkce a datové sady v daném balíčku.

Kde najdeme balíčky?

Balíčky jsou k dispozici na internetu z různých zdrojů. Existují však určitá důvěryhodná úložiště, ze kterých můžeme balíčky stahovat.

Zde jsou dvě důležitá úložiště, která jsou k dispozici online.

  • CRAN (Comprehensive R Archive Network): Toto je oficiální komunita R se sítí FTP a webovými servery, která obsahuje nejnovější kód a dokumentaci R. Před odesláním vašich balíčků online prochází řada testů, které dodržují zásady CRAN .
  • GitHub: GitHub je další slavný repozitář, ale není specifický pro R.The online komunita může sdílet své balíčky s ostatními lidmi a používá se pro správu verzí. GitHub je open-source a nemá žádný proces kontroly.

Seznam užitečných R balíčků

Existuje několik balíčků v R a lze je stáhnout z CRAN nebo GitHub. Níže jsou uvedeny balíčky, které lze použít ke konkrétním účelům.

1. Načítání dat z externích zdrojů

  • Haven: R čte a zapisuje data ze SAS.
  • DBI: O navázání komunikace mezi relační databází a R.
  • RSQlite: Používá se ke čtení dat z relačních databází.

2. Manipulace s daty

  • Dplyr: Používá se pro manipulaci s daty, jako je podmnožina, poskytuje zkratky pro přístup k datům a generuje dotazy SQL.
  • Tidyr - Používá se k převodu dat do malých formátů.
  • stringr - manipuluje s řetězcovými výrazy a řetězci znaků.
  • lubridate- Práce s daty a časem.

3. Vizualizace dat

  • Rgl: Pro práci na 3D vizualizacích.
  • ggvis: Vytvořit a vytvořit gramatiku grafiky.
  • googlevis: Použití nástrojů vizualizace google v R.

4. Webové balíčky

  1. XML: Čtení a zápis XML dokumentů v R.
  2. Httpr: Práce s http připojeními.
  3. Jsonlite: Čtení datových tabulek json.

Získání R balíčků

Pomocí níže uvedeného kódu můžeme zkontrolovat dostupné balíčky, které jsou přítomny v R.

  • available.packages (): V síti CRAN je k dispozici přibližně 5200 balíčků.

CRAN má zobrazení úkolů, které seskupuje balíčky podle konkrétního tématu.

Instalace balíčků R

Balíčky můžeme instalovat přímo prostřednictvím IDE nebo pomocí příkazů. K instalaci balíčků používáme níže uvedenou funkci a určíme název balíčku.

Syntax:

install.packages()

Kód:

install.packages(“ggplot2”)

Výše uvedený kód nainstaluje balíček ggplot2 a jeho závislé balíčky, pokud existují.

Můžeme nainstalovat několik balíčků najednou zadáním názvů balíků pod znakový vektor.

Syntax:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Kód:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Instalace pomocí aplikace R Studio

Výhodou použití R studia je GUI (Graphical User Interface). Můžeme si vybrat balíčky pro instalaci a jejich zdroj.

Můžeme jít na nástroje -> Instalovat balíčky.

Načítání R balíčků

Po instalaci balíčku R je musíme načíst do R, abychom mohli začít používat nainstalované balíčky.

K načtení balíčků používáme níže uvedenou funkci.

Syntax:

library(package name)

Poznámka: Název balíčku nemusí být uveden v uvozovkách.

Kód:

library(ggplot2)

Existují určité balíčky, které zobrazují zprávy při načtení. Někteří ne. Podrobnosti o nainstalované knihovně můžeme vidět pomocí níže uvedeného kódu.

Kód:

library(ggplot2)
search()

Výstup:

“Package: lattice” “package: ggplot2” “package: makinglides”

„Package: knitr“ „package: slidify“ „tools: rstudio“

Vytvoření vlastního balíčku

Před vytvořením vlastního balíčku. Než začneme vytvářet balíček, měli bychom mít na paměti níže uvedený kontrolní seznam.

  • Organizace kódu je jednou z nejdůležitějších věcí při psaní kódu v balíčku. Ztrácíme polovinu času hledáním umístění kódu namísto vylepšování kódu. Vložte všechny soubory do snadno přístupné složky.
  • Dokumentace kódu vám pomůže pochopit účel kódu. Když tento kód často nebudeme opakovat, zapomínáme, proč jsme ho napsali určitým způsobem. Také může lidem pomoci lépe porozumět vašemu kódu, když je s nimi sdílíte.
  • Sdílení skriptů prostřednictvím e-mailu se stalo archaickým. Snadným způsobem je nahrát svůj kód a distribuovat jej na GitHubu. Je možné získat zpětnou vazbu, která vám pomůže vylepšit kód.

Chcete-li vytvořit svůj vlastní balíček, musíme nainstalovat balíček devtools.

Kód:

install.packages("devtools")

K pomoci s dokumentací můžeme použít níže uvedený balíček.

Kód:

install.packages("roxygen2")

Po instalaci balíčku devtools. Můžete si vytvořit svůj vlastní balíček.

Kód:

devtools::create ("packagename")

Místo „packagename“ můžete zadat jméno, které si přejete. Nyní můžete do tohoto balíčku přidat své funkce.

Můžete vytvořit stejný název souboru jako název funkce.

Syntax:

Devtools:create(“firstpackage”)

Distribuční balíček

Balíček můžete distribuovat na githubu pomocí balíčku devtools.

Pomocí níže uvedeného kódu distribuujeme náš balíček na githubu.

Kód:

devtools::install_github("yourusername/firstpackage")

Výše můžete zadat své uživatelské jméno a název balíčku github.

Zde jsou požadované soubory pro balíček

  • Funkce
  • Dokumentace
  • Data

Jakmile máme všechny výše uvedené soubory, je dobré je zaúčtovat do úložiště.

Doporučené články

Toto je průvodce R balíčky. Zde probereme seznam užitečných balíčků R, instalaci balíčků pomocí R studio a vytvoření vlastního balíčku atd. Další informace naleznete také v následujících článcích -

  1. Co je to programovací jazyk R?
  2. Kariéra v programování R
  3. R Programování vs Python
  4. MySQL vs SQLite
  5. Seznam R balíčků

Kategorie: