Úvod do seznamu R balíčků

Balíček v programovacím jazyce R je jednotka, která poskytuje požadované funkce, které lze využít jejich načtením do prostředí R. Seznam R balíčků je podobný knihovně v C, C ++ nebo Java. Balíček tedy může mít v zásadě řadu funkcí, jako jsou funkce, konstanty atd., Které uživateli umožníme jejich využití v kontextu konkrétního problému. V R lze požadovaný balíček načíst pomocí funkce library (). V případě, že balíček není k dispozici, lze jej nainstalovat pomocí funkce install.packages (). Balíčky usnadňují zdánlivě obtížné úkoly díky připraveným funkcím.

Co jsou balíčky R?

Existuje mnoho balíčků v R a výběr balíčku závisí na jeho aplikaci. Ačkoli existují určité balíčky, které jsou široce používány kvůli funkcím, které poskytují, není tomu tak v případě, že jiné balíčky jsou méně důležité. Různé balíčky mají různé účely; některé souvisí se statistickými technikami, jiné se týkají vizualizace atd.

V následující části se podíváme na některé důležité balíčky v R:

1. Auto

Tento balíček je Companion to Applied Regression. Je to velký balíček, který poskytuje různé funkce pro statistickou analýzu. Při importu tohoto balíčku do prostředí R se importují další související balíčky, jako je MASS, statistiky, grafika atd. Mezi některé funkce v balíčku patří Anova, avPlots, Boxplot, carPalette, hustotní diagramy, infIndexPlot, lineární hypotéza, logit, test outlier, qqPlot, zbytkové grafy, rozptyl, matice rozptylu atd. Rozsáhlé schopnosti balíčku lze měřit z počtu funkcí, které poskytuje.

2. Corrplot

Balíček poskytuje grafické zobrazení korelační matice a intervalu spolehlivosti. Balíček také poskytuje algoritmy pro provádění přeskupování matic. Četné možnosti zahrnují výběr požadovaných barev, textových štítků, barevných štítků, rozvržení atd. Různé metody vizualizace nebo metody parametrů v balíčku Corrplot jsou „kruh“, „čtverec“, „elipsa“, „číslo“, „odstín“, „barva“ a „koláč“. Corrplotova funkce zahrnující různé možnosti poskytuje vizuálně atraktivní reprezentaci korelace mezi různými proměnnými, které by jinak za normálních okolností, jako jsou čísla, bylo obtížné interpretovat. Pozitivní korelace jsou zobrazeny modře a negativní korelace červeně. Intenzita barvy a velikost kruhu jsou úměrné korelačním koeficientům.

3. DataExplorer

Tento balíček se zabývá automatizovaným průzkumem a zpracováním dat. Poskytuje automatizovaný proces průzkumu dat určený pro analytické úkoly a prediktivní modelování. To je zásadní, protože uživateli umožňuje porozumět datům a získávat informace. Každá proměnná v analýze je skenována a analyzována balíčkem. Balíček dále poskytuje funkce pro vizualizaci těchto proměnných pomocí typických grafických technik. Poskytuje také běžné metody zpracování dat pro zpracování a formátování dat.

4. Gmodely

Balíček gmodels poskytuje různé nástroje v R pro vykreslování dat. Obsahuje různé funkce jako glh.test, které se používají k testování, tisku nebo shrnutí obecné lineární hypotézy pro regresní model. Tato funkce je. kontrasty převádějí lidsky čitelné kontrasty do formy, kterou R potřebuje pro výpočet. Matici vrácenou pomocí make.contrasts lze použít jako argument k argumentu kontrasty u modelových funkcí. Funkce coefFrame zapadá do modelu do každé podskupiny definované podle , poté vrací datový rámec s jedním řádkem pro každé přizpůsobení a jedním sloupcem pro každý parametr. Odhadnutelná funkce počítá a testuje kontrasty a další odhadnutelné lineární funkce modelových koeficientů pro lm, glm atd. Funkce fit.contrast vypočítává a testuje libovolné kontrasty pro regresní objekty.

5. Gplots

Tento balíček poskytuje funkce vizualizace pomocí rozmanitých programovacích nástrojů. Funkce v balíčku pracují na konceptu výpočtu a vykreslování. Grafické schopnosti balíčku jsou demonstrovány různými funkcemi, jako je pásmový graf, boxplot2, col2hex, ci2d, hist2d, textový graf, dřezový graf, pilot balónu, plotCI, plot plot atd. Tyto funkce umožňují práci s nastaveními souvisejícími s barvou, text a další složité grafické aspekty vizualizace. Zabývají se také složitými prvky, které se podílejí na vizualizaci založené na statistikách, např. Lmplot2, rezidenčními funkcemi, které umožňují uživateli řídit podrobnou regresní diagnostiku pomocí diagnostických grafů. Pokud je třeba vykreslit více dat ve stejné oblasti, ale se samostatnými osami, je to možné pomocí funkce over plot v balíčku.

6. Ggplot2

Je to jeden z velmi slavných balíčků v R, který poskytuje rozsáhlé vizuální schopnosti a prezentuje výsledky i složitých statistických a matematických technik. Četné funkce poskytované balíčkem umožňují analytikům odvodit vhledy z dat nej interaktivnějším způsobem. Popis R funkce je „systém pro deklarativní vytváření grafiky, který je založen na gramatice grafiky“. Tato gramatika grafiky znamená, že uživatel musí vyprávět „ggplot2“ o tom, jak se proměnné musí mapovat na estetiku, takže to v podstatě znamená, že určení, jaké grafické aspekty se má použít, a ggplot2 bude podle toho fungovat na základě podrobností.

7. Namažte

Tento balíček R usnadňuje práci s daty a časy. Mazací balíček umožňuje snadnou manipulaci s daty a časem. Analyzuje číslo a poskytuje vhodné uspořádání dat, ve skutečnosti funkce analýzy v balíčku zpracovávají širokou škálu formátů a oddělovačů, což zjednodušuje proces analýzy. Jednou z pozoruhodných vlastností je, že balíček poskytuje funkce pro zpracování dat s různými časovými pásmy.

8. Hmisc

Balíček Hmisc, pojmenovaný Harrell Miscellaneous, obsahuje mnoho funkcí, které lze využít pro analýzu dat, grafiku na vysoké úrovni a obslužné programy. Zahrnuje také funkce pro výpočet velikosti a výkonu vzorku, import a anotaci datových sad, imputování chybějících hodnot, poskytování pokročilých funkcí tabulek, sdružování proměnných, manipulaci s řetězcem znaků, převod R objektů na HTML kód atd.

9. Mříž

Balíček nabízí systém vizualizace dat na vysoké úrovni, který byl inspirován grafikou Trellis. Důraz je kladen na vícerozměrná data. Výkonné možnosti vizualizace balíčku poskytují potřebné grafické řešení. Některé z pozoruhodných funkcí v balíčku jsou B_07_cloud, které pomáhají vytvářet 3D rozptylový graf a plošný drátový graf; D_level. barvy, funkce pro výpočet falešných barev představujících numerickou nebo kategorickou proměnnou; B_06_levelplot, funkce, která generuje vodorovné a obrysové grafy; A_01_Lattice, funkce, která poskytuje grafické funkce mřížky. B_09_tmd je funkce, která generuje Tukey Mean - Diference Plot; B_11_oneway, funkce, která vyhovuje jednosměrnému modelu. Balíček tedy poskytuje rozsáhlé funkce pro vizualizaci prostřednictvím různých funkcí.

10. MatrixModels

Tento balíček umožňuje modelování s řídkými a hustými maticovými maticemi. K dosažení tohoto cíle používá modulární predikci a odezvu, třídy modulů. Všechny funkce poskytované balíčkem jsou stejně důležité, z nichž některé jsou lm.fit.sparse, což je fitterová funkce pro řídké lineární modely, solutionCoef, který řeší koeficienty a koeficientový přírůstek, model. Matice, která konstruuje možná řídké konstrukční nebo modelové matice, glm4, která vyhovuje zobecněným lineárním modelům.

11. Multcomp

Balíček umožňuje vícenásobné srovnání skupin k ve zobecněných lineárních modelech. Seznam devíti standardních postupů viz. Uživateli jsou poskytovány Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott a Tetrade, a uživatel na základě požadavku vybere srovnání. Kromě toho je pro kontrastní matici také k dispozici volné vstupní rozhraní, které umožňuje speciální srovnání. Pozoruhodné je, že samotná srovnání nejsou omezena na konkrétní design, jako je vyvážený nebo jednoduchý, ale programy jsou navrženy tak, aby vyhovovaly vícenásobnému srovnání v obecném lineárním modelu, který umožňuje kovariáty, korelované prostředky, chybějící hodnoty., atd.

12. OpenMx

Tento balíček se v zásadě zabývá rozšířeným modelováním strukturální rovnice. Poskytuje funkce pro vytváření modelů strukturálních rovnic. S těmito modely lze manipulovat pomocí programování. Modely mohou být specifikovány maticemi nebo cestami, jako je LISREL nebo RAM. Některé z typů modelů zahrnují více skupin, potvrzující faktor, distribuci směsí, kategorický práh, diferenciální funkce přizpůsobení atd.

13. Plyr

Jedná se o velmi důležitý balíček, který poskytuje funkce pro manipulaci s daty. Poskytuje nástroje pro rozdělení, aplikaci a kombinování dat. Dodává se se sadou nástrojů, které pomáhají řešit běžnou sadu problémů. Např. Někdy můžeme potřebovat rozdělit velký úkol na menší úkoly, které jsou zvládnutelné, potom pracujeme na každém kusu a nakonec nakonec všechny kousky dáme zpět dohromady.

14. Qcc

Balíček získává význam díky různým funkcím analýzy kvality, které poskytuje. Poskytuje grafy řízení kvality Shewhartu pro kontinuální, atributy a počítá data. Mezi další důležité grafy patří grafy Cusum a EWMA a křivky provozních charakteristik. Nabízí také funkčnost analýzy procesních schopností. Paretův graf, graf příčin a následků a vícerozměrné kontrolní diagramy jsou užitečné nástroje, které poskytuje balíček.

15. RandomForest

Jak název napovídá, tento balíček se používá k vytvoření náhodného algoritmu doménové struktury. Balíček implementuje Breimanův náhodný lesní algoritmus, který je založen na Beimanově a Cutlerově originálním kódu FORTRAN. Algoritmus se používá pro klasifikaci a regresi. Balíček lze také použít v režimu bez dozoru k posouzení blízkosti mezi datovými body.

16. Psych

Jedná se o balíček určený pro zvláštní účely. Balíček poskytuje postup pro psychologický, psychometrický a osobnostní výzkum. Funkce jsou primárně pro multivariační analýzu pomocí různých vícerozměrných statistických technik.

Závěrečný seznam balíčků R

Existuje řada balíčků v R a použití balíčku závisí na požadavcích. Komunita Seznam R balíčků rostla velmi rychle a každý den se přidává balíček. Více funkcí může poskytovat podobné funkce, ale výběr balíčku musí být založen na pečlivé studii.

Doporučené články

Toto je průvodce seznamem R balíčků. Zde diskutujeme o úvodu do balíčků R a některých důležitých balíčcích R. Další informace naleznete také v našich dalších doporučených článcích -

  1. Java balíčky
  2. Co je JNDI v Javě?
  3. JColorChooser
  4. R Programování vs Python

Kategorie: