Úvod do Scatterplotu v R

  • R je programovací jazyk s otevřeným zdrojovým kódem používaný pro statistiku a analýzu dat. Se zvyšující se popularitou datové vědy získala R popularitu. Používá se hlavně statistiků dat a těžařů dat pro získávání cenných informací z dat. R je interpretovaný jazyk a má rozhraní příkazového řádku, ale existuje mnoho grafických uživatelských rozhraní pro usnadnění práce vývojářů. R nabízí širokou škálu knihoven pro implementaci statistik a grafických technik. R nabízí statickou grafiku; umožňuje uživateli vytvořit vrstvený graf. Vytváří tedy grafy kvality publikací a poskytuje lepší reprezentaci informací.
  • R nabízí obrovskou sadu knihoven pro grafickou implementaci, ale nejoblíbenější je „ggplot2“. GGPlot2 je implementace „gramatiky grafiky“, která zjednodušuje tvorbu komplexních grafů. Poskytuje programové rozhraní pro určování proměnných, jejich polohy, barvy grafu, typů grafu a dalších vizualizačních vlastností. To vám umožní vytvářet grafy krok za krokem, což vám umožní vytvářet vrstvy pro velkou flexibilitu a kvalitu publikace.
  • Jedním takovým typem grafu je Scatterplot in R. Scatterplot in R, také nazývaný scatter chart, což je typ grafu, který ukazuje korelaci mezi dvěma proměnnými. Zobrazuje datové body ve formě teček. Může být nakreslena mezi spojitou nezávislou proměnnou a jinou proměnnou, která závisí na předchozí proměnné nebo dvěma spojitými nezávislými proměnnými. Korelace může být pozitivní, negativní nebo nulová. Pokud je sklon grafu zleva doleva doprava, je korelace pozitivní. Pokud je sklon zleva zleva doprava, korelace je záporná nebo jinými slovy, zvýšení hodnoty jedné proměnné sníží hodnotu jiné proměnné.

Syntaxe: Existuje mnoho balíčků v R pro grafy, proto existuje mnoho funkcí pro vytvoření Scatterplotu v R. Nejzákladnější a nejjednodušší funkce je

děj (x, y)

kde

x označuje vodorovnou osu nebo nezávislou spojitou proměnnou.

y označuje svislou osu nebo závislou proměnnou.

Existuje mnoho dalších parametrů pro vykreslení funkce, aby byl graf snadno srozumitelný.

Níže jsou některé s definicí:

  • main: přidá název do grafu
  • xlab: přidejte štítek k ose x
  • ylab: přidá štítek k ose y
  • xlim: určuje rozsah osy x
  • ylim: určuje rozsah osy y
  • pch: označuje tvar bodů v bodovém grafu
  • cex: označuje velikost bodů
  • col: definuje barvu bodů

Scatterplot in R lze také vytvořit pomocí balíčku ggplot2. Z tohoto důvodu musíme nejprve nainstalovat a načíst balíček ggplot2. Po přidání balíčku do aktuální relace níže lze pomocí příkazu Scatterplot vytvořit R.

ggplot (dataset, aes (x, y, color, shape)) + geom_poin () + labs (x, y, title)

kde

  • dataset je dataset, pro který je třeba vytvořit rozptyl.
  • aes () je estetické mapování v grafu. Popisuje, jak jsou proměnné mapovány v grafu.
  • x je vodorovná osa nebo nezávislá souvislá proměnná.
  • y je svislá osa nebo závislá proměnná.
  • color je přidat barvu k bodům na základě proměnné seskupení.
  • tvar se používá k nastavení tvaru na základě proměnné seskupení.
  • znaménko + znamená, že příkaz pokračuje.
  • geom_point () je funkce pro bodový graf.
  • laboratoře (x, y, title): do grafu přidejte x label, y label a title.

Vytvořit Scatterplot v R

Chcete-li vytvořit Scatterplot v R, musíme nejprve načíst datovou sadu. Zde používáme dataset (mtcars) poskytnutý R. Nejprve načtěte dataset do aktuální relace pomocí příkazu níže

data (iris)

Jakmile se datová sada načte, zobrazte data a pomocí příkazu níže získáte základní přehled o typu dat a sloupcích v něm.

duhovka

Po získání základních znalostí o datech umožňuje vytvořit jednoduchý rozptyl pomocí funkce plot

plot (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 5.0))

Přidání štítků, aby byl graf čitelný

graf (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = „Sepal Length“, ylab = „Sepal Width“, main = „Width vs Délka “)

Přidáním dalšího parametru bude graf atraktivnější

graf (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 4.0), xlab = „Sepal Length“, ylab = „Sepal Width“, main = „Width vs Délka “, pch = 8, cex = 1, 5, col = 6)

Kromě těchto 2-D grafů lze v R. vytvořit i maticové grafy a 3-D grafy.

Rozptylové matice

Pokud máme v datovém souboru více než dvě proměnné a chceme najít korelaci každé proměnné se všemi ostatními proměnnými, použije se rozptylová matice. Nejzákladnější a nejjednodušší příkaz pro matici scatterplot je:

páry (~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris, main = ”Scatterplot Matrix”)

Výše uvedený graf ukazuje korelaci mezi hmotností, mpg, dsp a roll.

Rozptyl 3D

Někdy trojrozměrný graf poskytuje lepší pochopení dat. Pro tento R poskytuje více balíčků, jeden z nich je „scatterplot3d“. Níže jsou uvedeny příkazy k instalaci „scatterplot3d“ do pracovního prostoru R a načtení do aktuální relace

install.packages („scatterplot3d“)

knihovna (scatterplot3d)

Po načtení knihovny vytvoří spuštění níže uvedených příkazů trojrozměrný rozptyl.

připojit (iris)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = „3D Scatterplot“)

Kromě toho existuje mnoho dalších způsobů, jak vytvořit trojrozměrný. Uživatelé mohou také přidat podrobnosti, jako je barva, tituly, aby se graf zlepšil. Uživatel může také vytvořit interaktivní 3D rozptyl pomocí funkce „plot3D (x, y, z)“ poskytované balíčkem „rgl“. Tato funkce vytvoří rotující 3D rozptyl, který lze otočit pomocí myši. Poskytuje tak úplný přehled o korelaci mezi proměnnými.

Závěr

R je jedním z nejznámějších jazyků pro implementaci grafických technik používaných vědci dat. Poskytuje širokou škálu balíčků a knihoven pro grafiku a lepší porozumění datům. „Gglpot2“, „ggvis“, „rgl“, „plot3d“, „mřížka“, „animace“, „gganimate“, „cairo“ jsou některé z balíčků poskytnutých R.

Bodový graf je nejjednodušší způsob, jak lépe porozumět datům. Pomocí této vizualizace může uživatel poznat, jak jsou proměnné ve vzájemném vztahu, jak měnící se hodnota jedné proměnné změní hodnotu jiných proměnných atd. Sklon grafu říká o pozitivním a negativním vztahu mezi proměnnými.

Doporučené články

Toto je průvodce Scatterplotem v R. Zde diskutujeme úvod, rozptýlené matice, scatterplot 3D, jak vytvořit scatterplot? spolu s vhodnými příklady. Další informace naleznete také v dalších navrhovaných článcích -

  1. Co je GraphQL
  2. Scrum Framework
  3. R Otázky k pohovoru
  4. Úvod do binomické distribuce v R

Kategorie: