Úvod do typů vizualizace dat

V moderní aréně velkých dat, která mají více než 2, 5 kvintilionu bajtů (1 kvintilion bajtů = 10 18 bajtů!) Dat vytvořených každý den (Podle socialmediatoday.com), je zde umírající potřeba data ukládat. Není třeba říkat, že tato data jsou hustá, a proto nejsou tak uživatelsky čitelná a jsou neustále zaostřena. Pro posun paradigmatu pro snadné pochopení rozsahu dat a získání užitečných přínosů v podnikání musí být data prezentována intuitivnějším způsobem, a proto by k jejich vizualizaci vyžadovaly vhodné grafy. Existují nástroje a metodiky vytvořené pro efektivní zobrazení dat, ale účinnost většinou závisí na typu dat a požadavku, který je třeba z těchto údajů vyřezat.

Co je to vizualizace dat?

Vizualizace dat je metodika, pomocí které jsou data v nezpracovaném formátu zobrazována, aby objasnila jejich význam. S příchodem velkých dat se stalo nezbytností vybudovat smysluplný způsob předvádění dat tak, aby množství dat nebylo ohromující. Část zobrazování dat může být použita pro různé účely, například pro nalezení trendů / společností / vzorců v datech, sestavení modelů pro strojové učení nebo může být použita pro jednoduchou operaci, jako je agregace.

Různé typy vizualizace dat

Vizualizace dat je široce rozdělena do 6 různých typů. Přestože oblast vizualizace dat neustále roste, nebude překvapením, pokud se počet kategorií zvýší.

Časový: Data pro tyto typy vizualizace by měla splňovat obě podmínky: reprezentovaná data by měla být lineární a měla by být jednorozměrná. Tyto typy vizualizace jsou reprezentovány čarami, které se mohou překrývat a mají také společný počáteční a koncový datový bod.
Rozptyl PlotsPoužije tečky k reprezentaci datového bodu. Nejběžnější v dnešním světě v strojovém učení během průzkumné analýzy dat.
Výsečový grafTento typ vizualizace zahrnuje kruhovou grafiku, kde délka oblouku označuje velikost.
Diagram polární oblastiPodobně jako výsečový graf je i diagram polární oblasti kruhovým grafem, s výjimkou sektorových úhlů, délky se rovná a vzdálenost od středu znamená velikost.
Čárové grafyStejně jako graf rozptylu jsou data reprezentována body, s výjimkou spojení pomocí čar, aby byla zachována kontinuita.
Časové osyTímto způsobem zobrazíme seznam datových bodů v chronologickém pořadí času.
Sekvence časových řadV časové řadě reprezentujeme velikost dat ve 2D grafu v chronologickém pořadí časových razítek v datech.
Hierarchické: Tyto typy vizualizací zobrazují uspořádané skupiny ve větší skupině. V jednoduchém jazyce je hlavní intuicí za těmito vizualizacemi shluky, které lze zobrazit, pokud tok shluků začíná z jednoho bodu.
Stromový diagramVe stromovém diagramu je hierarchický tok reprezentován ve formě stromu, jak název napovídá. Málo terminologií této reprezentace je:

- Kořenový uzel: Počáteční bod.

- Podřízený uzel: Nadřazený rodič

- Leaf node: Už žádný podřízený uzel.

Prstencové diagramy / diagramy SunburstReprezentace stromu ve stromovém diagramu je převedena na radiální základnu. Tento typ pomáhá při prezentaci stromu v stručné velikosti. Nejvnitřnější kruh je kořenový uzel. A oblast podřízeného uzlu znamená% dat.
TreeMapStrom je znázorněn ve formě obdélníků úzce zabalených. Oblast označuje množství obsažené.
Balení kruhůPodobně jako u treemapu používá místo obdélníků kruhové balení.
Síť: Vizualizace tohoto typu spojuje datové sady s datovými sadami. Tyto vizualizace zobrazují, jak se tyto datové sady vzájemně vztahují v rámci sítě.
Maticové grafyTento typ vizualizace se široce používá k nalezení spojení mezi různými proměnnými uvnitř sebe. Například korelační graf
Aluviální diagramyJedná se o typ vývojového diagramu, ve kterém jsou změny toku sítě znázorněny v intervalech podle požadavků uživatele.

Slovo mrakTo se obvykle používá pro reprezentaci textových dat. Slova jsou úzce zabalena a velikost textu označuje frekvenci slova.

Diagramy uzluZde jsou uzly reprezentovány jako tečky a je zde uvedeno spojení mezi uzly.
Vícerozměrné: Na rozdíl od časového typu vizualizace mohou mít tyto typy více dimenzí. V tomto můžeme použít 2 nebo více funkcí k vytvoření 3D vizualizace pomocí souběžných vrstev. Umožní uživateli prezentovat klíčové cesty s sebou tím, že rozbije mnoho nepotřebných dat.
Rozptylové grafyVe vícerozměrných datech vybereme libovolné 2 funkce a poté je vykreslíme do 2-D rozptylového grafu. Tím bychom získali n C 2 = n (n-1) / 2 grafy.
Skládané sloupcové grafyReprezentativní segmentové pruhy jsou na sobě. Může to být buď 100% skládaný sloupcový graf, kde je segregace zastoupena v%, nebo jednoduchý skládaný sloupcový graf, který označuje skutečnou velikost
Paralelní souřadnicový grafV této reprezentaci je nakresleno pozadí a n paralelních čar je nakresleno (pro n-rozměrná data).
Geospatial: Tyto vizualizace se týkají současného fyzického umístění v reálném čase jeho překřížením s mapami (může to být geospatiální nebo prostorová mapa). Intuice za těmito vizualizacemi je vytvořit ucelený pohled na výkon.
Mapa tokuJe uveden přesun informací nebo objektů z jednoho místa na druhé, kde velikost šipky označuje částku.
Mapa ChoroplethGeoprostorová mapa je obarvena na základě konkrétní datové proměnné.
KartogramTento typ reprezentace používá pro mapování tematickou proměnnou. Tyto mapy zkreslují realitu, aby poskytovaly informace. To znamená, že v určité proměnné jsou mapy přehnané. Například obrázek vlevo je prostorová mapa zkreslená na strukturu včelího úlu.

Teplotní mapaTito jsou velmi podobní Choropleth v geospatial žánru ale moci být použit v oblastech kromě geospatial také.
Různé: Tyto vizualizace nelze zobecnit ve zvlášť velké skupině. Takže místo toho, abychom vytvořili menší skupiny pro jednotlivé typy, jsme je seskupili do různých. Níže uvádíme několik příkladů:
Open-High-Low-Close grafTento typ grafů se obvykle používá pro reprezentaci cen akcií. Rostoucí trend se nazývá býčí a klesající jako Bearish.
Kagi-ChartTypicky je poptávka-nabídka aktiva reprezentována pomocí tohoto grafu.

Závěr

Z výše uvedených typů vizualizace vidíme, že obecně existuje 6 typů skupin. Výše uvedený seznam není vyčerpávající, ale jen málo z nich je široce využíváno. V nadcházejících časech, kdy a kdy se do seznamu přidají nové typy, se skupiny mohou zvětšit. To je pro typy vizualizace. Pokračovali bychom v tom, na jaké parametry se při určování typu vizualizace díváme.

Doporučené články

Toto je průvodce vizualizací typu dat. Zde diskutujeme úvod a různé typy vizualizace dat. Další informace naleznete také v dalších navrhovaných článcích -

  1. Typy technik analýzy dat
  2. Integrace dat Talend
  3. Nástroje pro analýzu dat
  4. Nástroje pro vědu o údajích
  5. Talend Tools
  6. Co je integrace dat?
  7. Rozptyl Plots v Matlabu
  8. Jak je sloupcový graf používán v Matlabu (příklady)

Kategorie: