Úvod do designu datových skladů

Sklad běžným slovem znamená ukládat něco na jednom místě a podobné případy v průmyslových odvětvích, aby bylo možné uložit komplexní množství dat na jednom místě. Business Intelligence (BI) umožňuje dotazovat data ze zdrojů dat a důvěru lze dosáhnout pouze v případě, že existuje dobrý design datového skladu.

Datový sklad integruje více zdrojů dat a bude dobře podporovat analytické a analytické vykazování. Pokud máte špatný design datového skladu, bude to mít vliv na růst vaší organizace tím, že budete mít nepřesná data dotazů.

Vezměte si příklad popularity internetového obchodu Amazon objednáním položky a lze ji doručit na dosah ruky. Když se zákazník přihlásí na web elektronického obchodu a hledá dostupný produkt v obchodě. Poté, co dodavatel přijme a ihned expedujeme, jsme vybrali a objednali položku. Zde můžeme ušetřit čas na nákup požadované položky.

Podobný případ jako tento datový sklad lze také ukládat a získávat z transakčního systému. Datový sklad jako dva hlavní pojmy

  • OLAP - online analytické zpracování
  • OLTP - online transakční zpracování

Oba jsou online systémy zpracování, ale mají určité rozdíly. OLTP řídí transakční aplikaci, jako je ATM, OLAP používá pro analytické zpracování, jako je reporting, prognóza atd.,

Shromažďování požadavků

  • Shromažďování požadavků je jednou fází v návrhu datového skladu. Musí určit kritéria a úspěšně je implementovat. Pro návrh datového skladu budou použity dvě strategie, jedna se nazývá podnikání a druhá se nazývá technická.
  • Obchodní strategie se zaměřuje na dlouhodobé obchodní pohledy a pomáhá zvyšovat zisk pro růst. Požadavek technické strategie je založen na hlášeních uživatelů, analýze, výběru hardwaru, metodě vývoje, testovací technice, implementačním prostředí a školení uživatelů.
  • Když jsme určili obchodní a technickou strategii, musíme také navrhnout plán BCP (Disaster Recovery). Pokud dojde k katastrofě způsobené člověkem nebo přírodou, musíme mít plán na rychlé obnovení dat a zajistit, aby nedošlo ke ztrátě dat. Vypracování plánu obnovy po katastrofě je jedním z náročných úkolů a vytváří důvěru pro organizaci.

Nastavení prostředí

  • Jakmile jsme shromáždili data pro návrh datového skladu, musíme provést správné nastavení prostředí pro vývoj, testování a výrobu. Přednostně by měl existovat samostatný systém pro aplikaci, databázi a také oddělený pro reporting / ETL.
  • Při vytváření samostatného prostředí pro každý zajišťuje, že všechny změny mohou být vyvinuty / testovány a poté přesunuty do výroby.
  • Pokud máme jediné prostředí, které je určeno pro všechny tyto činnosti, mohlo by to skončit problémem a ztrácet data. Například, když dojde k nějaké události v systému, nemohli jsme se navigovat a najít způsob, jak opravit, a to je složitější.

Modelování dat

  • Jakmile je shromažďování požadavků a prostředí nastaveno, dalším je navrhnout, jak připojit zdroj dat, zpracovat a uložit do datového skladu. Tato technika se nazývá modelování dat. Může to být analýza předmětu a vztahu mezi ostatními.
  • Při návrhu datového skladu konstruktéři navrhli, jak a kde je třeba data uložit. Při stejné příležitosti bychom také měli definovat možný způsob načtení dat z datového skladu. Jakmile je zdroj identifikován, tým může vytvořit logiku a vytvořit zobrazení schématu struktury.

Typy datového modelu

Existují tři typy

  • Pojmový
  • Logický
  • Fyzický

Níže jsou uvedeny tři typy datového modelu:

1. Koncepční: Říká se, CO systém obsahuje a je navržen obchodními architekty, aby definoval rozsah obchodní strategie.

2. Logická: Definuje, jak logické mohou být vytvořeny v DBMS, bude navrženo Business Analyst a Data Architect tak, aby vytvořilo sadu pravidel pro ukládání / načítání dat

3. Fyzické: Definuje, jak může být systém implementován.

Použití designu datového skladu

Být dobrým designem datového skladu může být při získávání dat časově náročné. Každý krok musí následovat efektivně, aby byl systém dobrý. Pomůže organizaci zpracovat složité typy dat a na základě analýzy trendů zlepší produktivitu. Každý krok při navrhování architektury DWH je tedy při výběrové metodě důležitý a vědomější. Organizace postupně vstupuje do každého toku a vede k úspěšné implementaci datového skladu.

Existuje několik důležitých použití datových skladů

1. Bankovní průmysl: Většina bank používá datový sklad pro ukládání velkého množství transakčních dat a schopnost načíst data dotazu mnohem rychleji. Lze jej spravovat jako údaje o zákaznících, tržní trendy, zprávy, analýzy atd.,

2. Finanční průmysl: Je to podobné bankovnictví, ale jediným cílem je zlepšit finanční změny analýzou údajů o zákaznících

3. Vláda: Vláda dnes spravuje velké množství dat online a ukládá se do relační databáze. Každá data mají vzájemný vztah, jako je Aadhaar, PAN je spojen s mnoha zdroji.

4. Zdravotnictví: Zdravotničtí manažeři a služby tolik informací. Udržuje klinické údaje, záznamy zákazníků a pomáhá jim předpovídat výsledky, analyzovat zpětnou vazbu a generovat zprávy.

5. Pojištění: Pojišťovna se primárně používá pro datové vzorce, trend zákazníků a vedení záznamů.

6. Výrobní a distribuční průmysl: Nejčastěji se používá ve všech průmyslových odvětvích k ukládání informací o položkách a pomáhá jim předpovídat poptávkovou položku pro výrobu a prodej. Analýza prodané položky, která poskytuje lepší techniky rozhodování.

7. Maloobchodní služby: Maloobchodníci jsou prostředníkem mezi výrobcem a zákazníkem. Datový sklad jim pomáhá při propagaci a trendech nákupu zboží.

8. Telefonický průmysl: Telefonní průmysl spravuje mnoho historických dat, což pomáhá při vytváření trendu údajů o zákaznících a cílí na tlačení reklamních kampaní.

Výhody datového skladu

  • Poskytuje rozšířené obchodní zpravodajství
  • Zajišťuje kvalitu a konzistenci dat
  • Šetří čas a peníze
  • Sleduje historicky inteligentní data
  • Vytváří vysokou návratnost investic

Nevýhoda datového skladu

  • Práce s dalšími zprávami
  • Nepružnost a homogenizace dat
  • Vlastnické obavy
  • Požadavky na velké množství zdrojů
  • Skryté problémy vyžadují čas

Doporučené články

Toto je průvodce návrhem datového skladu. Zde diskutujeme techniku ​​návrhu datového skladu, shromažďování požadavků, nastavení prostředí, použití, výhodu / výhodu. Další informace naleznete také v následujícím článku -

  1. Výhody datového skladu
  2. Implementace datového skladu
  3. Modelování datových skladů
  4. Nástroje datového skladu
  5. Top 4 různé typy datových modelů

Kategorie: