Úvod do dat Mart
Svět se stává stále více digitálním a každá organizace generuje několik petabajtů dat. Data Mart je jedna taková klasifikace dat z datového skladu, kde je koncentrace na jeden subjekt.
Dá se říci, že se jedná o údaje týkající se jednoho konkrétního oddělení nebo kategorie, jako je prodej, finance nebo marketing atd. V podstatě se jedná o podmnožinu datového skladu. Protože se soustředíme na konkrétní předměty nebo oddělení, můžeme říci, že jejich zdroj je omezený nebo je závislý na velmi malém počtu zdrojů.
Data Mart vs Data Warehouse
Datový sklad je sklad se sbírkou dat z více proudů subjektu. Údržbu a kontrolu, jako je sběr nezpracovaných dat a jejich zpracování, zajišťují hlavně IT skupiny podnikových informačních technologií, které poskytují různé služby mateřským organizacím.
Datový sklad je také označován jako centrální nebo podnikový datový sklad. Zdroj datového skladu tedy bude násobkem na rozdíl od datového serveru, který je v některých případech podmnožinou datového skladu.
Typy dat Mart
Obvykle existují tři typy datových serverů. Oni jsou:
1. Závislý datový sklad
Závislý datový server je čistě z datového skladu a veškerý seskupený závislý vytvoří podnikový datový sklad. Je to čistě podmnožina datového skladu, protože je vytvořen z centrálního DW.
Protože čistá a souhrnná data jsou již obsažena v centrálním datovém skladu ETT, zjednodušuje se proces extrakce transformace a přepravy. Potřebujeme zde pouze určit konkrétní podmnožinu a provést ETT.
Tyto datové diagramy jsou obvykle vytvořeny k dosažení lepší dostupnosti a mnoha zlepšených výkonů s lepší kontrolou a účinností.
2. Nezávislá data Mart
Toto není vytvořeno z centrálního datového skladu a jeho zdroj se může lišit. Protože data pocházejí z jiného než centrálního procesu DW ETT, je poněkud odlišná.
Většinu nezávislých datových sítí používá menší skupina organizací a jejich zdroje jsou také omezené. Nezávislý datový server je obecně vytvořen, když potřebujeme získat řešení v relativně kratším časovém limitu.
3. Hybridní data Mart
Hybridní datový server vám umožní seskupit data ze všech jiných zdrojů, než je centrální datový sklad DW. Pokud se zabýváme integrací ad hoc, bude to mít velký přínos pro špičkovou práci na všech produktech, které byly do organizací přidány navenek.
Vlastnosti hotelu Data Mart
Níže jsou uvedeny některé funkce datového serveru:
- Protože zdroj dat je soustředěn na předmět, jeho doba odezvy se jeho použitím zvyšuje.
- Pro často požadovaná data bude výhodné použít datové mapy, protože je podmnožinou centrálního DW, a proto bude velikost dat menší.
- Také protože objem dat je omezený, doba zpracování bude ve srovnání s centrálními Dws poměrně zkrácena.
- Jsou to v zásadě agilní a ve srovnání s datovým skladem dokážou poměrně rychle a efektivně přizpůsobit změny modelu.
- Datamart vyžaduje, aby odborník na jeden předmět zpracovával, na rozdíl od dat skladu, odbornost, kterou požadujeme ve více skladech předmětů. Z tohoto důvodu říkáme, že datový server je pohyblivější.
- Můžeme oddělit kategorie přístupu na nízkou úroveň pomocí dat rozdělených do oddílů a pomocí datového martu, je to velmi snadné.
- Závislost na infrastruktuře je poměrně omezená a data mohou být po segmentaci uložena na různých hardwarových platformách.
Kroky k implementaci dat Mart
Níže jsou uvedeny kroky, které jsou nutné k jeho implementaci.
1. Projektování
Toto bude první krok v implementaci, kde budou identifikovány všechny požadované úkoly a zdroje pro shromažďování technických a obchodních informací. Později bude implementován logický plán a po kontrole bude převeden na fyzický plán. Rovněž se zde rozhoduje o logické a fyzické struktuře dat, například o tom, jak rozdělit data a pole oddílu, jako je datum nebo jakýkoli jiný soubor.
2. Konstrukce
Toto je druhá fáze implementace, kdy byly generovány fyzické databáze pomocí RDBMS, který byl určen jako součást procesu návrhu a logických struktur. Vytvoří se všechny objekty, jako je schéma, indexy, tabulky, pohledy atd.
3. Obyvatelstvo
Toto je třetí fáze a zde se v ní data zadávají při získávání dat. Všechny požadované transformace jsou implementovány před naplněním dat na něm.
4. Přístup
Toto je další krok implementace, kde použijeme naplněná data k dotazování pro vytváření sestav. Koncový uživatel používá tento krok k porozumění dat pomocí dotazů.
5. Správa
Toto je poslední fáze implementace datového martu a zde jsou ošetřovány různé úkoly, jako je správa přístupu, optimalizace systému a ladění, správa a přidávání čerstvých dat do datového martu a plánování scénářů obnovy pro zvládnutí případů selhání.
Výhody Data Mart
Níže jsou uvedeny některé z výhod jeho použití.
- Je to jedna z nejlepších nákladově efektivních alternativ k datovému skladu, kde musíte pracovat pouze na malém segmentu dat.
- Segregace dat ze zdrojů zlepší efektivitu dat, protože určitá skupina lidí může pracovat s daty ze specifického zdroje namísto všech pomocí datového skladu.
- Rychlejší přístup k datům je možný pomocí datového martu, pokud víme, na kterou podmnožinu potřebujeme přístup.
- Používání Datamartu je mnohem snazší, takže koncoví uživatelé si mohou na ně snadno vyžádat dotaz.
- Přijetí datového martu implementace vyžaduje ve srovnání s datovým skladem méně času, protože data jsou segregována do skupin.
- Pro snadnou analýzu trendů lze použít historická data od konkrétního subjektu.
Závěr
Protože se soustředí na jednu funkční oblast, existuje mnoho výhod jak pro implementátora procesu, tak pro koncového uživatele. Proto je vyžadována efektivní implementace martů spolu s datovým skladem v organizaci.
Doporučené články
Toto je průvodce Co je Data Mart. Zde diskutujeme o úvodu, vlastnostech a top 3 typech spolu s jeho funkcemi a kroky. Další informace naleznete také v následujících článcích -
- Oracle Data Warehousing
- R Datové typy
- Datové typy Python
- Cassandra Data Modeling
- Kompletní průvodce datovým modelem v Cassandře