Úvod do nástrojů vizualizace dat:

Vizualizace dat je klíčem k pochopení výsledku jakéhokoli řešení bez ohledu na doménu. Přináší více statistických závěrů z porozumění datům, zkoumání různých vzorců mezi údaji a více k výsledkům porozumění modelu. Nástroje vizualizace dat jsou jednou z hlavních oblastí, kde se může kdokoli dostat do základního porozumění vztahů. V dnešní době je rozšířen na obchodních jednáních, zúčastněné strany, díky nimž snadno identifikují základní hodnotu produktu.

Co jsou to nástroje pro vizualizaci dat?

Existuje mnoho nástrojů pro vizualizaci dat, jako jsou Tableau, QlikView, FusionCharts, HighCharts, Datawrapper, Ploty, D3.js atd. Přestože existují vizuální nástroje pro vizualizaci dat používané v každodenním životě ve vizualizaci dat, jeden z nejpopulárnějších nástrojů vykreslování je matplot.pyplot.

Důvody, proč je Matplotlib z nástrojů vizualizace dat nejpoužívanější-

  1. Matplotlib je jednou z nejdůležitějších mapovacích knihoven v pythonu.
  2. Celý modul vykreslování je inspirován nástroji vykreslování, které jsou k dispozici v programu MATLAB.
  3. Hlavním důvodem je, že mnoho lidí pochází z oblastí matematiky, fyziky, astronomie a statistiky a mnoho techniků a výzkumníků je zvyklých na MATLAB.
  4. MATLAB je populární vědecký výpočetní nástroj tam, zejména pro vědecké výpočty. Takže když lidé začínající pythonovou specifickou knihovnu pro strojové učení / Data science / Artificial Intelligence dostali inspiraci MATLABu a postavili knihovnu s názvem matplotlib
  • matplotlib.pyplot -

matplotlib.pyplot se široce používá při vytváření postav s oblastí, vykreslování čar a my můžeme grafy vizualizovat atraktivně.

Pojďme se přímo pustit do velmi jednoduchých příkladů -

import matplotlib.pyplot jako plt

plt.plot ((2, 4, 6, 4))

Výše uvedené je seznam, plt.plot vykreslí tyto seznamové prvky osy Y, které jsou indexovány na 0, 1, 2, 3 jako jejich odpovídající osa X.

plt.ylabel („Čísla“)

plt.xlabel („Indexy“)

Podíváme-li se na výše uvedené 2 řádky kódu, označí osy Y a X-osy. (tj. pojmenování obou os.)

plt.title ('MyPlot')

Výše uvedený řádek kódu udělí název grafu. Název nám říká, o čem zápletka je.

plt.show ()

S výše uvedeným grafem je jeden problém (snímek obrazovky 1), pokud jste si všimli, nevidíme strukturu podobnou mřížce. Mřížka vám pomůže mnohem snáze číst hodnoty z grafu. Nyní se podívejme, jak získat mřížku.

plt.plot ((1, 2, 3, 4), (1, 4, 9, 16))

Podívejte se na výše uvedený řádek kódu, namísto zadání jednoho pole máme dva seznamy, které se stanou naší osou X a osou Y. Zde si můžete všimnout, že pokud je naše osa x 2, je to odpovídající hodnota osy y 4, tj. Hodnoty osy y jsou čtverečky hodnot osy x.

plt.ylabel ('čtverce')

plt.xlabel ('čísla')

plt.grid () # grid on

Ve chvíli, kdy to uděláte, získáte graf s vloženou mřížkou, jak ukazuje obrázek 2

plt.show ()

Nyní namísto řádkového vykreslování vykreslujeme jiný graf s jiným příkladem.

plt.plot ((1, 2, 3, 4), (1, 4, 9, 16), 'ro')

Každý pár X, Y má přidružený parametr, jako je barva a tvar, který můžeme podle toho dát pomocí funkce argumentu pár klíčových slov python.

V tomto případě „ro“ označuje r - červenou barvu a tečky ve tvaru písmene O (viz obrázek 3).

plt.grid ()

plt.show ()

Řekněme, že matplot lib funguje pouze se seznamem, takže jej při zpracování čísel nemůžeme široce použít. Můžeme použít balíček NumPy. Všechno je také interně převedeno jako pole NumPy

Podívejme se mírně na různé spiknutí:

importovat numpy jako np

t = np.arange (0, 5, 0, 2)

Nad řádkem vytvoří hodnoty od 0 do 5 s intervalem 0, 2.

plt.plot (t, t ** 2, 'b–', label = '2') # 'rs', 'g ^')

plt.plot (t, t ** 2, 2, 'rs', label = '2, 2')

plt.plot (t, t ** 2, 5, 'g ^', label = '2, 5')

Ve výše uvedených řádcích kódu „b - -“ označuje modré pomlčky, „rs“ označuje červené čtverečky, „g ^“ označuje zelené trojúhelníky (viz snímek obrazovky 4)

plt.grid ()

plt.legend ()

Výše uvedený řádek kódu přidává online popisky založené na legendách. Legendy dělají děj velmi čitelným.

plt.show ()

Umožňuje pochopit některé další vlastnosti. Pokud chceme, aby šířka řádku byla větší, může to udělat jednoduchý parametr zvaný linewidth.

x = (1, 2, 3, 4)

y = (1, 4, 9, 16)

plt.plot (x, y, šířka řádku = 5, 0)

plt.show ()

Existuje mnoho dalších různých parametrů, které můžete mít v dokumentaci funkce plot v matplotlib.pyplot (https://matplotlib.org/api/pyplot_api.html).

Další zajímavou věcí jsou nastavené vlastnosti.

x1 = (1, 2, 3, 4) y1 = (1, 4, 9, 16)

Hodnoty Y1 jsou druhou mocninou hodnot X1

x2 = (1, 2, 3, 4) y2 = (2, 4, 6, 8)

Hodnoty Y2 jsou pouze dvakrát vyšší než hodnoty X2

řádky = plt.plot (x1, y1, x2, y2)

Pomocí výše uvedeného řádku můžeme tyto hodnoty vykreslit do jednoho řádku. Stane se tedy, že vykreslí X1 vs Y1 a X2 vs Y2 a ukládáme je do proměnné zvané řádky. Také můžeme změnit vlastnosti těchto řádků pomocí argumentů klíčových slov.

plt.setp (řádky (0), color = 'r', šířka řádku = 2, 0)

Tady se setp nazývá jako set vlastnosti, argumenty jsou řádky (0) odpovídající X1, Y1, barva a šířka řádku. Výše ​​uvedený řádek kódu je zapsán pomocí argumentů klíčových slov (viz screenshot 6).

plt.setp (řádky (1), 'color', 'g', 'linewidth', 2.0)

Výše uvedený řádek kódu představuje syntaxi matlabu.

Zde řádky (1) odpovídají X2, Y2. Máme také dva páry argumentů 'color', 'g' a 'linewidth', '2.0' (viz screenshot 6).

Ať tak či onak, můžeme čáru vykreslit.

  • První způsob je nativní způsob, jakým používáme v pythonu.
  • Druhou cestu používají lidé z prostředí MATLABu.

plt.grid ()

put.show ()

Závěr - Nástroje vizualizace dat

V tomto příspěvku na nástroje pro vizualizaci dat jsme objevili úvod k vizualizaci dat v Pythonu. Abychom byli konkrétnější, viděli jsme

  • Jak mapovat data pomocí čar
  • Jak shrnout vztah mezi proměnnými s rozptylovými grafy

Doporučené články

Toto byl průvodce nástroji vizualizace dat. Zde jsme studovali základní pojmy a nástroje vizualizace dat s jejich příklady. Další informace naleznete také v následujících článcích -

  1. Vizualizace dat vs Analytika dat
  2. Data Scientist vs Data Mining
  3. Software Big Data Analytics
  4. .Data Warehousing Interview Otázky
  5. Matplotlib V Pythonu
  6. Rozptyl Plots v Matlabu

Kategorie: