Úvod do typů vizualizace dat
V moderní aréně velkých dat, která mají více než 2, 5 kvintilionu bajtů (1 kvintilion bajtů = 10 18 bajtů!) Dat vytvořených každý den (Podle socialmediatoday.com), je zde umírající potřeba data ukládat. Není třeba říkat, že tato data jsou hustá, a proto nejsou tak uživatelsky čitelná a jsou neustále zaostřena. Pro posun paradigmatu pro snadné pochopení rozsahu dat a získání užitečných přínosů v podnikání musí být data prezentována intuitivnějším způsobem, a proto by k jejich vizualizaci vyžadovaly vhodné grafy. Existují nástroje a metodiky vytvořené pro efektivní zobrazení dat, ale účinnost většinou závisí na typu dat a požadavku, který je třeba z těchto údajů vyřezat.
Co je to vizualizace dat?
Vizualizace dat je metodika, pomocí které jsou data v nezpracovaném formátu zobrazována, aby objasnila jejich význam. S příchodem velkých dat se stalo nezbytností vybudovat smysluplný způsob předvádění dat tak, aby množství dat nebylo ohromující. Část zobrazování dat může být použita pro různé účely, například pro nalezení trendů / společností / vzorců v datech, sestavení modelů pro strojové učení nebo může být použita pro jednoduchou operaci, jako je agregace.
Různé typy vizualizace dat
Vizualizace dat je široce rozdělena do 6 různých typů. Přestože oblast vizualizace dat neustále roste, nebude překvapením, pokud se počet kategorií zvýší.
Časový: Data pro tyto typy vizualizace by měla splňovat obě podmínky: reprezentovaná data by měla být lineární a měla by být jednorozměrná. Tyto typy vizualizace jsou reprezentovány čarami, které se mohou překrývat a mají také společný počáteční a koncový datový bod. | ||
Rozptyl Plots | Použije tečky k reprezentaci datového bodu. Nejběžnější v dnešním světě v strojovém učení během průzkumné analýzy dat. | ![]() |
Výsečový graf | Tento typ vizualizace zahrnuje kruhovou grafiku, kde délka oblouku označuje velikost. | ![]() |
Diagram polární oblasti | Podobně jako výsečový graf je i diagram polární oblasti kruhovým grafem, s výjimkou sektorových úhlů, délky se rovná a vzdálenost od středu znamená velikost. | ![]() |
Čárové grafy | Stejně jako graf rozptylu jsou data reprezentována body, s výjimkou spojení pomocí čar, aby byla zachována kontinuita. | ![]() |
Časové osy | Tímto způsobem zobrazíme seznam datových bodů v chronologickém pořadí času. | ![]() |
Sekvence časových řad | V časové řadě reprezentujeme velikost dat ve 2D grafu v chronologickém pořadí časových razítek v datech. | ![]() |
Hierarchické: Tyto typy vizualizací zobrazují uspořádané skupiny ve větší skupině. V jednoduchém jazyce je hlavní intuicí za těmito vizualizacemi shluky, které lze zobrazit, pokud tok shluků začíná z jednoho bodu. | ||
Stromový diagram | Ve stromovém diagramu je hierarchický tok reprezentován ve formě stromu, jak název napovídá. Málo terminologií této reprezentace je:
- Kořenový uzel: Počáteční bod. - Podřízený uzel: Nadřazený rodič - Leaf node: Už žádný podřízený uzel. | ![]() |
Prstencové diagramy / diagramy Sunburst | Reprezentace stromu ve stromovém diagramu je převedena na radiální základnu. Tento typ pomáhá při prezentaci stromu v stručné velikosti. Nejvnitřnější kruh je kořenový uzel. A oblast podřízeného uzlu znamená% dat. | ![]() |
TreeMap | Strom je znázorněn ve formě obdélníků úzce zabalených. Oblast označuje množství obsažené. | ![]() |
Balení kruhů | Podobně jako u treemapu používá místo obdélníků kruhové balení. | ![]() |
Síť: Vizualizace tohoto typu spojuje datové sady s datovými sadami. Tyto vizualizace zobrazují, jak se tyto datové sady vzájemně vztahují v rámci sítě. | ||
Maticové grafy | Tento typ vizualizace se široce používá k nalezení spojení mezi různými proměnnými uvnitř sebe. Například korelační graf | ![]() |
Aluviální diagramy | Jedná se o typ vývojového diagramu, ve kterém jsou změny toku sítě znázorněny v intervalech podle požadavků uživatele. |
|
Slovo mrak | To se obvykle používá pro reprezentaci textových dat. Slova jsou úzce zabalena a velikost textu označuje frekvenci slova. |
|
Diagramy uzlu | Zde jsou uzly reprezentovány jako tečky a je zde uvedeno spojení mezi uzly. | ![]() |
Vícerozměrné: Na rozdíl od časového typu vizualizace mohou mít tyto typy více dimenzí. V tomto můžeme použít 2 nebo více funkcí k vytvoření 3D vizualizace pomocí souběžných vrstev. Umožní uživateli prezentovat klíčové cesty s sebou tím, že rozbije mnoho nepotřebných dat. | ||
Rozptylové grafy | Ve vícerozměrných datech vybereme libovolné 2 funkce a poté je vykreslíme do 2-D rozptylového grafu. Tím bychom získali n C 2 = n (n-1) / 2 grafy. | ![]() |
Skládané sloupcové grafy | Reprezentativní segmentové pruhy jsou na sobě. Může to být buď 100% skládaný sloupcový graf, kde je segregace zastoupena v%, nebo jednoduchý skládaný sloupcový graf, který označuje skutečnou velikost | ![]() |
Paralelní souřadnicový graf | V této reprezentaci je nakresleno pozadí a n paralelních čar je nakresleno (pro n-rozměrná data). | ![]() |
Geospatial: Tyto vizualizace se týkají současného fyzického umístění v reálném čase jeho překřížením s mapami (může to být geospatiální nebo prostorová mapa). Intuice za těmito vizualizacemi je vytvořit ucelený pohled na výkon. | ||
Mapa toku | Je uveden přesun informací nebo objektů z jednoho místa na druhé, kde velikost šipky označuje částku. | ![]() |
Mapa Choropleth | Geoprostorová mapa je obarvena na základě konkrétní datové proměnné. | ![]() |
Kartogram | Tento typ reprezentace používá pro mapování tematickou proměnnou. Tyto mapy zkreslují realitu, aby poskytovaly informace. To znamená, že v určité proměnné jsou mapy přehnané. Například obrázek vlevo je prostorová mapa zkreslená na strukturu včelího úlu. | ![]() |
Teplotní mapa | Tito jsou velmi podobní Choropleth v geospatial žánru ale moci být použit v oblastech kromě geospatial také. | ![]() |
Různé: Tyto vizualizace nelze zobecnit ve zvlášť velké skupině. Takže místo toho, abychom vytvořili menší skupiny pro jednotlivé typy, jsme je seskupili do různých. Níže uvádíme několik příkladů: | ||
Open-High-Low-Close graf | Tento typ grafů se obvykle používá pro reprezentaci cen akcií. Rostoucí trend se nazývá býčí a klesající jako Bearish. | ![]() |
Kagi-Chart | Typicky je poptávka-nabídka aktiva reprezentována pomocí tohoto grafu. | ![]() |
Závěr
Z výše uvedených typů vizualizace vidíme, že obecně existuje 6 typů skupin. Výše uvedený seznam není vyčerpávající, ale jen málo z nich je široce využíváno. V nadcházejících časech, kdy a kdy se do seznamu přidají nové typy, se skupiny mohou zvětšit. To je pro typy vizualizace. Pokračovali bychom v tom, na jaké parametry se při určování typu vizualizace díváme.
Doporučené články
Toto je průvodce vizualizací typu dat. Zde diskutujeme úvod a různé typy vizualizace dat. Další informace naleznete také v dalších navrhovaných článcích -
- Typy technik analýzy dat
- Integrace dat Talend
- Nástroje pro analýzu dat
- Nástroje pro vědu o údajích
- Talend Tools
- Co je integrace dat?
- Rozptyl Plots v Matlabu
- Jak je sloupcový graf používán v Matlabu (příklady)