Co je datové modelování
Zjednodušeně řečeno, Data Modeling se týká vytváření datového modelu, který lze uložit do některé databáze. Datový model je koncepční reprezentace asociace mezi různými datovými objekty.
Pochopení modelování dat / rozsahu
Vyskytuje se ve třech různých vrstvách:
- Fyzický model: Jedná se o schéma, které říká, jak jsou data fyzicky ukládána do databáze
- Koncepční model: Jedná se o pohled uživatele na data, tj. Vysokou úroveň, kterou uživatel vidí.
- Logický model: Je umístěn mezi fyzickým modelem a koncepčním modelem a reprezentuje data logicky, odděleně od svých fyzických obchodů.
Hierarchické modelování dat: Tyto modely byly použity k nahrazení systémů založených na souborech. Data byla uchovávána ve stromu jako jedno příliš mnoho uspořádání.
Relační modelování dat: Je pravda, že hierarchický model nám pomohl přejít od systémů založených na souborech, což snížilo složitost, ale přesto jeden znal konkrétní použité fyzické úložiště dat. Relační databáze sleduje relační model, ve kterém jsou data uložena v tabulkách, na rozdíl od hierarchické databáze, kde jsou uložena ve stromové struktuře. Stručně řečeno, to snížilo složitost více ve srovnání s hierarchickým modelem.
Jak usnadňuje modelování dat práci / proč bychom ji měli používat?
Pomáhá nám při vizuální reprezentaci dat a prosazuje obchodní logiku, předpisy, zásady atd. V oblasti dat. Je to průvodce, který vědci a analytici používají při navrhování a implementaci databáze. Bez modelování dat se stává úloha analytiků a vědců implementovat obchodní požadavky na databázi obtížnou.
Proč potřebujeme modelování dat? / Co s tím můžete dělat?
Hlavním cílem jeho použití je:
- Abychom zajistili správné zobrazení všech datových objektů, jako by to nebylo provedeno správně, dostáváme nesprávné výsledky.
- Jak bylo uvedeno výše, pomáhá navrhovat databázi na koncepční, fyzické a logické úrovni.
- Pomáhá navrhovat relační tabulky, primární klíče, cizí klíče atd.
- Vývojáři databází mohou vytvořit lepší fyzickou databázi s dobrým modelem, protože se pro ně stává vodícím nástrojem.
- Pomáhá identifikovat chybějící a nadbytečná data.
- Pomáhá nám mít lepší infrastrukturu IT a mít snadnou a levnou údržbu, pokud je to z dlouhodobého hlediska nutné, ačkoli je to zpočátku časově náročné.
Práce s modelováním dat
Nyní vytvořme vzorový datový model, abychom pochopili, jak pracovat s modelem. K tomu musíme postupovat podle určitých kroků:
- Nejprve musíme pochopit požadavky, V tomto případě vytvoříme model pro internetový obchod. S ohledem na to potřebujeme dvě tabulky a) zákazníci b) produkty
- Dalším krokem je získání atributů tabulek nebo entit
A. tabulka zákazníků může mít atributy jako:
- Id
- název
- E-mailem
- Adresa
b. Tabulka produktů může mít atributy jako:
- Id
- název
V tabulce zákazníků můžeme mít ID jako primární klíč a podobně ID produktu v tabulce produktů bude primární klíč, jak je znázorněno na následujících diagramech.
Nyní navrhneme vztah mezi těmito dvěma tabulkami. Abychom propojili zákaznickou a produktovou tabulku, vytvoříme tabulku nazvanou nákup, která bude jako tabulka objednávek (tj. Který zákazník objednal, který produkt).
Pokud se podíváte na obrázek výše, reference na nákup zákazníka je v pořádku, protože každý nákup má jednoho zákazníka a jeden zákazník má mnoho nákupů. Tento odkaz je tedy v pořádku. Ještě jednu věc jsme vzali user_account_id jako cizí klíč (odkaz na id v zákaznickém klíči). Podobně product_id. Stále existuje problém s referencí na nákup produktu, protože několik produktů lze zakoupit v jednom nákupu a několik nákupů může zahrnovat stejný produkt.
K překonání tohoto problému navrhneme prostřední tabulku známou jako purchase_item, která bude spojena s nákupem a produktem. Na obrázku níže vidíme problém vyřešen.
Výhody
Existují různé výhody:
- Pomáhá podnikům komunikovat, plánovat napříč jejich organizací.
- Pomáhá rozpoznat správný zdroj dat, který lze použít k naplnění modelu.
- To lze použít k definování vztahů mezi různými tabulkami, jako je primární klíč, cizí klíč atd.
Kdo je tím pravým publikem pro učení této technologie?
Je to velmi důležité. Správné publikum pro techniky učení modelování jsou jednotlivci, kteří jsou datovými architekty a analytiky dat. Většina jednotlivců začíná jako analytici dat a poté se pohybují po žebříku.
Jak vám tato technologie pomůže v kariérním růstu?
Podle společnosti Glassdoor se předpokládá, že průměrný plat na trhu modelářů vydělá v průměru asi 78 601 $. Takže vidíte, že se jedná o dobře placenou práci. Většina velkých společností investuje do modelářů, protože jsou velmi důležité pro zachování integrity dat.
Závěr
Závěrem lze říci, že model vytvořený modeláři zajišťují jednotnost pojmenování konvencí, integritu a zabezpečení dat. protože dobrá data umožní podnikání ve správném a efektivním využití jejich dat.
Doporučené články
Toto byl průvodce Co je to datové modelování. Zde jsme diskutovali definici, kariérní růst, dovednosti, výhody a zpracování datového modelování pomocí příkladů. Další informace naleznete také v dalších navrhovaných článcích -
- Co je agilní projektový management?
- Interview otázky skladování dat
- Co je SAS?
- Co je technologie velkých dat?
- Průvodce datovým modelem v Cassandře