Přehled tabulky faktů

Tabulka faktů je přítomna ve středu schématu hvězd nebo schématu sněhové vločky. Je obklopen více tabulkami dimenzí. Obsahuje kvantitativní informace, které se používají pro analýzu. Je denormalizován. Má hlavně dva sloupce, tj. Sloupec cizího klíče a sloupec pro měření. Sloupec cizího klíče pomáhá připojit se k tabulce rozměrů a sloupec měření ukládá data, která mají být analyzována. Primární přítomný klíč je složený klíč, který je kombinací všech cizích klíčů.

Charakteristika tabulky faktů

Níže jsou uvedeny charakteristiky tabulky faktů:

  • Klíče: Má klíč nebo primární klíč, který je souhrnem všech primárních klíčů všech tabulek dimenzí s ním spojených. Tento klíč je znám jako zřetězený klíč, který pomáhá jednoznačně identifikovat řádek.
  • Zrno tabulky faktů: Zrno tabulky zobrazuje úroveň detailu nebo hloubku informací obsažených v dané tabulce. Více úrovně, více účinnosti stolu.
  • Aditivní opatření: Atributy obsažené v tomto dokumentu mohou být plně aditivní, neaditivní nebo poloaditivní. Do všech dimenzí jsou přidána plně aditivní nebo aditivní opatření. Semi-aditivní jsou ta opatření, která se přidávají k některým rozměrům a ne ke všem rozměrům a neaditivní opatření jsou uložena jako základní měrné jednotky pro obchodní proces.
  • Sparse Data: Existují záznamy, které mají atributy obsahující nulové hodnoty nebo míry. Neposkytují žádné informace.
  • Shrunken Rollup Dimensions: Shrunken Rollup Dimensions jsou subdivize základní dimenze.

Tabulka typů faktů

Je rozdělen do tří základních událostí měření:

  1. Transakční
  2. Periodický snímek
  3. Hromadění snímků

Chápeme to na základě měření v krátkosti.

1. Tabulka skutečností transakce

Toto je základní a základní pohled na obchodní operace. Slouží k reprezentaci výskytu události v jakémkoli okamžitém okamžiku. Míra skutečností platí pouze pro tento konkrétní okamžik a pouze pro tuto událost. Zrno, které je spojeno s tabulkou transakcí, se uvádí jako „jeden řádek na řádek v transakci“. Obvykle obsahuje data podrobné úrovně, což vede k tomu, že s ní je spojeno velké množství rozměrů. Zachycuje měření na nejzákladnější nebo atomové úrovni dimenze. To pomáhá tabulce poskytnout uživatelům robustní dimenzionální seskupení, shrnutí a rozbalení zpráv. Je to husté a řídké. Může být velký, možná obsahuje miliardy záznamů. Podívejme se na příklad prodeje v obchodě s potravinami.

2. Tabulka faktů

Tabulka faktografických údajů uvádí stav věcí v konkrétním případě času nebo „obraz okamžiku“. Normálně obsahuje více nepřidatelných a polosaditivních skutečností. Pomáhá kontrolovat kumulativní výkonnost podniku v pravidelných a předvídatelných časových intervalech. V tomto je znázorněna výkonnost činnosti na konci každého dne nebo týdne, měsíce nebo jakéhokoli jiného časového intervalu, na rozdíl od tabulky faktů o transakcích, kde je přidán nový řádek pro výskyt každé události. Tabulky faktických snímků nebo periodické snímky jsou však závislé na tabulce skutečností transakcí, aby se v tabulce skutečností transakcí zobrazily podrobné údaje. Periodické tabulky snímků jsou většinou husté a mohou být velké jako tabulky skutečností transakcí. Podívejme se na příklad pravidelného snímku prodeje stejného obchodu s potravinami jako v tabulce faktů transakcí.

3. Hromadné tabulky faktů

Používají se k reprezentaci činnosti jakéhokoli procesu, který má dobře definovaný a jasný začátek a konec. Hromadění snímků má většinou více datových razítek, které představují předvídatelné fáze nebo události, ke kterým dojde během životnosti. Někdy existuje zvláštní sloupec obsahující datum, které ukazuje, kdy byl řádek naposledy aktualizován. Podívejme se na příklad.

Jak to funguje v datovém skladu?

Tabulka faktů v podstatě představuje metriky související s událostí. Význam každé tabulky faktů musí být reprezentován názvem tabulky nebo složením primárního klíče tabulky faktů. Nejdůležitější volbou je rozhodnout primární klíč. Náhradní klíč lze také vytvořit, aby fungoval jako primární klíč. Pokud uživatel nechce použít náhradní klíč, může použít složení cizích klíčů, které ukazuje na kombinaci rozměrů souvisejících se skutečností. Použití cizích klíčů dává představu o zrnu nebo granularitě tabulky faktů.

Kimball popisuje čtyři kroky, které lze dodržovat:

  1. Výběr obchodního procesu k modelování.
  2. Deklarování zrna.
  3. Výběr rozměrů.
  4. Identifikace skutečností.

Výhody tabulky faktů v datovém skladu

  • Obsahuje kvantitativní informace pro analýzu.
  • Tabulky skutečností obsahující metriky výkonu jsou obvykle normalizovány.
  • Může obsahovat různá měřítka, jako je aditivní, poloaditivní a neaditivní.

Závěr

V tomto článku jsme diskutovali o jeho typech, fungování a výhodách. Je to centrální část schématu hvězdy nebo sněhové vločky. Je spojena s tabulkami rozměrů, aby poskytla strukturu hvězdy nebo sněhové vločky.

Doporučený článek

Toto byl průvodce Co je tabulka faktů ?. Zde diskutujeme o vlastnostech a různých typech faktických tabulek spolu s jeho výhodami. Další informace naleznete také v následujících článcích -

  1. Co je OSI model?
  2. Co je DSS?
  3. Jaké jsou funkce systému DOS?
  4. Co je testování použitelnosti?

Kategorie: