Tabulka rozměrů Úvod Typy - Jak to funguje - Výhody

Obsah:

Anonim

Úvod do tabulky rozměrů

Ve schématu hvězdy nebo sněhové vločky je tabulka rozměrů. Tabulky dimenzí pomáhají popsat kóty, tj. Hodnoty kót, atributy a klíče. Má obecně malou velikost. Velikost se může pohybovat od několika do tisíc řádků. Popisuje objekty obsažené v tabulce faktů. Tabulka rozměrů označuje soubor nebo skupinu informací souvisejících s jakoukoli měřitelnou událostí. Tvoří jádro pro rozměrové modelování. Obsahuje sloupec, který lze považovat za sloupec primárního klíče, který pomáhá jednoznačně identifikovat každý řádek nebo záznam kóty. Prostřednictvím tohoto klíče je spojena s tabulkami faktů. Když je vytvořen klíč nazývaný náhradní klíč, který je generován systémem, je použit k jedinečné identifikaci řádků v dimenzi.

Proč je třeba použít?

  • Jeho pomoc k ukládání historie informací nebo rozměrové informace.
  • Je to snadno pochopitelné než normalizované tabulky.
  • Do tabulky lze přidat více sloupců, aniž by to ovlivnilo stávající aplikace, které tyto aplikace používají.

Druhy rozměrové tabulky

Níže jsou uvedeny různé typy tabulky rozměrů:

1. SCD (pomalu se měnící rozměry)

Atributy dimenze, které mají tendenci se měnit pomalu s časem spíše než se měnit v pravidelném časovém intervalu, se nazývají pomalu se měnící dimenze. Například změna adresy a telefonního čísla, ale ne pravidelně. Podívejme se na příklad muže, který cestuje do různých zemí, takže musí změnit svou adresu podle dané země. To lze provést třemi způsoby:

Type1: Přepíše předchozí hodnotu. Tuto metodu lze snadno použít a pomáhá šetřit místo, čímž se snižují náklady. V tomto scénáři je však historie ztracena.

Tabulka před změnou

IDNÁZEVZEMĚNÁRODNOST
1001RachelIndieindický

Tabulka po změně

IDNÁZEVZEMĚNÁRODNOST
1001RachelČínaindický

Type2: Přidejte nový řádek s novou hodnotou. V této metodě se historie uloží a lze ji kdykoli použít. Ale to vyžaduje velký prostor, a proto zvyšuje náklady.

Tabulka před změnou

IDNÁZEVZEMĚNÁRODNOST
1001RachelIndieindický

Tabulka po změně

IDNÁZEVZEMĚNÁRODNOST
1001RachelIndieindický
1001RachelČínaindický

Type3: Přidejte nový sloupec. Je to nejlepší přístup, protože historii lze snadno udržovat.

Tabulka před změnou

IDNÁZEVZEMĚNÁRODNOST
1001RachelIndieindický

Tabulka po změně

IDNÁZEVZEMĚSTARÁ ZEMĚNÁRODNOST
1001RachelČínaIndieindický

2. Konformovaná dimenze

Tato dimenze je sdílena mezi více tematickými oblastmi nebo datovými schématy. Totéž lze použít v různých projektech bez jakýchkoli úprav provedených stejným způsobem. To se používá k udržení konzistence. Konformované rozměry jsou ty, které jsou přesně stejné nebo správná podmnožina jakékoli jiné dimenze.

3. Junk Dimension

Junk dimenze je skupina atributů nízké kardinality. Obsahuje různé nebo různé atributy, které nesouvisejí s žádným jiným atributem. Tyto mohou být použity k implementaci RCD (rychle se měnící rozměr), jako jsou vlajky, váhy atd.

4. Degenerovaná dimenze

Atributy, které jsou uloženy v samotné tabulce faktů a nikoli jako samostatná tabulka rozměrů, se nazývají degenerované dimenze. Například číslo lístku, číslo faktury, číslo transakce atd.

5. Roleplay Dimension

Mít více vztahů s tabulkou faktů se nazývá dimenze role-play. Jinými slovy, je to tehdy, když je stejný rozměrový klíč se všemi souvisejícími atributy spojen s mnoha dárky cizího klíče v tabulce faktů. Může plnit více účelů ve stejné existující databázi.

Jak to funguje v datovém skladu?

  • Dimenze označuje soubor nebo skupinu informací souvisejících s jakoukoli měřitelnou událostí. Tvoří jádro pro rozměrové modelování. Po vytvoření dimenze se vygeneruje struktura projektu. Vytvořené lze použít v různých projektech a odráží myšlenku opakovaného použití. Pokud je v kterémkoli z nich provedena změna, její účinek se projeví pouze v této konkrétní tabulce. Když má být sestava vytvořena, uživatel může data převzít, protože tabulky rozměrů obsahují všechny potřebné informace.
  • Při provádění modelování rozměrů jsou atomová data načtena do rozměrových struktur. Poté jsou generované rozměrové modely vytvářeny nebo vytvářeny kolem obchodních procesů. Při jeho vytváření je třeba pamatovat na filtrování hodnot domény a ukládání štítků sestav do těchto tabulek. Musí být zajištěno, že při vytváření tabulky rozměrů musí být použit náhradní klíč (systémem generovaný klíč používaný při vytváření tabulky rozměrů, který pomáhá jednoznačně identifikovat každý záznam přítomný v tabulce rozměrů.). Musí být denormalizováno, protože jejich úkolem je umožnit uživateli číst a analyzovat data snadněji stejně efektivně než spravovat transakce. Hlavním cílem dimenze je zajistit filtrování, provádět seskupování a účinné označování.

Výhody

Níže jsou uvedeny různé výhody tabulky rozměrů:

  • Má jednoduchou strukturu.
  • Je snadné analyzovat a pochopit.
  • Denormalizovaná data.
  • Pomáhá udržovat historické informace pro jakoukoli dimenzi.
  • Snadné načítání dat z něj.
  • Rychlé vytváření a implementace.
  • Poskytuje kontextové prostředí jakéhokoli obchodního procesu.

Závěr - rozměrová tabulka

Toto je nedílnou součástí modelování dat. Používá se ve schématu hvězd nebo sněhových vloček. Obsahuje rozměry, klíče a hodnoty atributů tabulky faktů. Existují různé typy, které se používají v různých scénářích.

Doporučené články

Toto je průvodce Dimension Table. Zde jsme diskutovali Typy, jak funguje tabulka rozměrů v datovém skladu s výhodami. Další informace naleznete také v dalších souvisejících článcích.

  1. Tabulka faktů vs. tabulka rozměrů
  2. Co je tabulka faktů?
  3. Co je Tableau?
  4. Míchání dat v Tableau