Rozdíl mezi schématem Star Schem a Snowflake Schema

V tomto článku budeme podrobně diskutovat rozdíly mezi schématy hvězd a sněhové vločky. Schéma je způsob logického popisu celých databází nebo datových skladů pomocí relačních databází. Popis může zahrnovat název a podrobnosti záznamů jakéhokoli typu se všemi agregáty a datovými položkami. Datové sklady používají schéma Star, Snowflake, Fact Constellation a Galaxy.

Schéma hvězd

Je to nejjednodušší schéma datového skladu. Jak název napovídá, jeho struktura je jako hvězda. V tomto schématu je tabulka faktů ve středu a počet tabulek dimenzí je s ní spojen cizím klíčem a tabulka rozměrů obsahuje sadu atributů. V tomto schématu je každá dimenze reprezentována pouze jednou tabulkou dimenzí, ale tabulky dimenzí nejsou navzájem spojeny. Mezi jeho výhody patří krájení dolů, snadné pochopení dat, optimální využití disku a zvýšení výkonu. Podívejme se na příklad pro lepší porozumění.

Příklad:

Zvažte společnost vyrábějící ledničky a musíme vytvořit schéma prodeje této společnosti vyrábějící ledničky. Prodej bude mít následující rozměry:

  • Položka
  • Umístění
  • Větev
  • Čas

Schéma má v centru prodeje tabulku faktů, která by obsahovala klíče pro přiřazení ke každé dimenzi, která má dvě míry, tj. Prodané jednotky a prodané dolary.

Schéma sněhové vločky

Schéma sněhové vločky je rozšíření schématu hvězd. Přidává do něj další rozměry. Jak jeho název napovídá, vypadá to jako sněhová vločka. V tomto schématu jsou tabulky rozměrů normalizovány, tj. Data jsou rozdělena do dalších tabulek. Rozdělení stolu snižuje nadbytečnost a plýtvání paměti. Má hierarchickou podobu rozměrových tabulek. Tabulky dimenzí a poddimenzí jsou spojeny s primárními a cizími klíči v tabulce faktů. Je snazší implementovat a spotřebuje méně místa na disku. Protože má více tabulek, výkon dotazu je snížen. Je nutná větší údržba, protože existuje více vyhledávacích tabulek. Podívejme se na příklad pro lepší porozumění.

Příklad:

Pokud vezmeme v úvahu stejný příklad jako výše v případě společnosti vyrábějící ledničky, ve schématu sněhové vločky je faktická tabulka stejná jako ve schématu hvězd, ale hlavní rozdíl je v definici nebo rozvržení rozměrových tabulek.

V tomto schématu byla jednotná rozměrová tabulka položky normalizována a byla rozdělena a byla vytvořena nová dodavatelská tabulka obsahující informace o typu dodavatele. Podobně je tabulka rozměrů normalizována a data jsou rozdělena do nové tabulky měst obsahující podrobnosti o konkrétním městě.

Srovnání hlava-hlava mezi schématem hvězd a schématem sněhové vločky (infografika)

Níže je uvedeno prvních 9 rozdílů mezi schématem Star Schema a Snowflake Schema.

Klíčové rozdíly mezi schématem hvězd a schématem sněhové vločky

Podívejme se na některé velké rozdíly mezi schématem Star Schema a Snowflake Schema.

Schéma hvězd:

  • Hierarchie dimenze ve schématu hvězd jsou uloženy v tabulce rozměrů.
  • Obsahuje centrální tabulku faktů obklopenou tabulkou rozměrů.
  • V tomto případě jediné spojení spojilo tabulku faktů s tabulkou rozměrů.
  • Má jednoduchý design.
  • Struktura dat je denormalizována.
  • Dotaz se provádí rychleji.
  • V této krychli je zpracování rychlejší.
  • Má více redundantních dat.
  • Používá jednoduché dotazy.
  • Schéma hvězd je snadno pochopitelné.
  • Ve schématu hvězd se spotřebuje více místa.

Schéma sněhové vločky:

  • Hierarchie ve schématu sněhové vločky jsou uloženy v samostatných tabulkách.
  • Obsahuje také tabulku faktů obklopenou tabulkou rozměrů a tyto tabulky rozměrů jsou dále obklopeny tabulkou rozměrů.
  • V tomto schématu je pro načtení dat nezbytných mnoho spojení.
  • Má komplexní design.
  • Struktura dat je normalizována ve schématu sněhové vločky.
  • Dotaz se provádí poměrně pomaleji než schéma hvězd.
  • Ve schématu sněhové vločky je zpracování krychle pomalejší.
  • Obsahuje méně nadbytečná data.
  • Využívá složité dotazy.
  • Schéma sněhové vločky je poměrně obtížné pochopit, že schéma hvězdy.
  • Ve schématu sněhové vločky je méně místa.

Srovnávací tabulka schématu Star vs Snowflake Schema

Pojďme diskutovat o srovnání mezi schématem Star Schema a Snowflake Schema.

Charakteristický

Schéma hvězd

Schéma sněhové vločky

Údržba / změnaMá více redundantních dat, a proto je obtížnější je změnit nebo udržovatToto schéma se snadněji mění a udržuje z důvodu menší redundance
PorozuměníSložitost dotazu je menší, a proto je snadno pochopitelnéPoužité dotazy jsou složitější, a proto obtížně pochopitelné
Čas provedení dotazuMá méně cizích klíčů, a proto je provádění dotazu rychlejší a zabere méně časuKvůli více cizím klíčům je doba provádění dotazu delší nebo dotaz se provádí pomalu
Typ datového skladuLepší pro datové mapy, které mají jediný vztah, tj. Jeden ku jednomu nebo jeden k mnohaLepší pro komplexní vztahy, tj. Mnoho až mnoho vztahů
Počet spojeníMá více spojeníMá menší počet spojení
Tabulka rozměrůPro každou dimenzi má pouze jednu tabulku rozměrůMá jednu nebo více rozměrových tabulek pro jednu dimenzi
PoužitelnostPokud je velikost tabulky rozměrů menší, tj. Menší počet řádků, upřednostňuje se schéma hvězdJe dobré použít, když je velikost tabulky rozměrů větší
Normalizace a denormalizaceTabulky faktů i tabulky rozměrů jsou denormalizovány.Tabulka faktů je denormalizována, zatímco tabulka rozměrů je normalizována
Datový modelVychází z přístupu shora dolůVychází z přístupu zdola nahoru

Závěr

V tomto článku jsme podrobně diskutovali o schématu Star vs Schéma sněhové vločky. Tato schémata slouží k reprezentaci datového skladu. V některých aspektech jsou podobné a v jiných jiné. Snowflake je rozšíření schématu hvězd. Pokud jsou data více, je preferována sněhová vločka, protože snižuje redundanci, ale hvězda je poměrně populárnější než schéma sněhové vločky.

Doporučené články

Toto je průvodce Star Schema vs Snowflake Schema. Tady také diskutujeme o klíčových rozdílech Star Schema vs Snowflake Schema s infografikou a srovnávací tabulkou. Další informace naleznete také v dalších navrhovaných článcích -

  1. Kódování vs dekódování - hlavní rozdíly
  2. Rozdíl mezi malými daty Vs Big Data
  3. Funkční testování vs nefunkční testování
  4. Testování kouře vs. testování hygieny
  5. Co je testování hygieny a jak to funguje?

Kategorie: