Úvod do otázek a odpovědí na rozhovor při skladování dat
Co je datový sklad?
Datový sklad je centrální úložiště, které ukládá heterogenní data z různých zdrojů. Data ve skladu mohou být použita pro analytické výkaznictví, strukturované nebo ad hoc dotazy a použita při rozhodování. Proces sběru dat z více zdrojů a jejich uložení v centrálním úložišti se nazývá Data Warehousing.
Data mohou být několika typů, jako jsou strukturovaná, polostrukturovaná nebo nestrukturovaná data. Data z různých zdrojů se zpracovávají, transformují a přijímají do jediné databáze, která se nazývá datový sklad. Uživatelé mají k těmto zpracovaným datům v datovém skladu přístup prostřednictvím různých nástrojů, jako jsou nástroje Business Intelligence, klienti SQL, tabulky a mnoho dalších nástrojů. Tato data pomáhají provádět operace dolování dat, které pomáhají najít nějaký vzor v datech.
Nyní, pokud hledáte práci, která souvisí s datovým skladováním, musíte se připravit na dotazovací pohovor s datovým skladem 2019. Je pravda, že každý pohovor se liší podle různých profilů práce. Zde jsme připravili důležité otázky a odpovědi týkající se rozhovoru s datovým skladem, které vám pomohou dosáhnout úspěchu v rozhovoru.
Nyní porozumíme některým důležitým otázkám týkajícím se rozhovorů s datovým záznamem 2019, které lze položit v rozhovoru. To však neznamená, že to jsou jediné otázky, které budou položeny v rozhovoru, musíte být důkladně připraveni ohledně každého tématu, o kterém zde diskutujeme. Tyto otázky jsou rozděleny do dvou částí:
1. část - Interview s otázkami skladování dat (základní)
Tato první část zahrnuje základní otázky a odpovědi týkající se datového skladu
Q1. Co je to skladování dat?
Odpovědět:
Data Warehousing je proces sběru dat z různých zdrojů, které je zpracovávají a ukládají do obrovské databáze, takže zpracovaná data mohou být použita pro různé účely, jako je analytické výkaznictví, obchodní zpravodajství nebo dolování dat atd. Základní myšlenkou datového skladu není nic ale ukládání obrovského množství dat.
Q2. Rozdíl mezi databází a datovým skladem?
Odpovědět:
Níže naleznete různé tabulky, které jsou podporovány datovým skladováním:
Databáze | Datový sklad |
Shromažďování dat používaných pro ukládání, přístup a vyhledávání | Shromažďování údajů používaných pro provádění analýzy |
Omezeno na jedinou aplikaci | Lze použít více aplikacemi |
Ukládá normalizovaná data | Data nemusí být normalizována obvykle uložena jako denormalizovaná data |
Na bázi ER a aplikačně orientované | sněhová vločka nebo začít podle schématu a podle předmětu |
Používá se pro zpracování transakcí | Používá se pro modelování a analýzu dat |
Přejdeme k dalším otázkám Interview s datovým skladem
Q3. Jaké jsou fáze ukládání dat?
Odpovědět:
Obecné fáze datového skladu jsou:
- Offline operační databáze: Data jsou zkopírována z operačního systému na jiný server za účelem provádění různých operací.
- Offline datový sklad: Data v datovém skladu jsou pravidelně aktualizována z operační databáze.
- Datový sklad v reálném čase: Datový sklad je aktualizován, když dojde k jakékoli transakci v operačním systému.
- Integrovaný datový sklad: Datový sklad je průběžně aktualizován, když je jakákoli transakce prováděna v operačním systému.
Q4. Co je Business Intelligence (BI)?
Odpovědět:
Toto jsou základní otázky rozhovoru s datovým skladováním, které byly položeny v rozhovoru. BI je technologicky řízený proces pro analýzu dat a prezentaci smysluplných poznatků koncovým uživatelům, které pomáhají při lepším rozhodování. BI zahrnuje různé nástroje, které pomáhají porozumět trendům a vzorcům dat skrytých v datech. Mezi nástroje, které se běžně používají, patří SAP Business Intelligence, MicroStrategy, Science, Tableau a mnoho dalších.
Q5. Jaké jsou komponenty datového skladu?
Odpovědět:
Čtyři komponenty datového skladu jsou:
- Load Manager: Provádí všechny operace spojené s extrakcí a načítáním dat do skladu.
- Správce skladů: Provádí operace spojené s daty ve skladu. Provádí operace, jako je analýza dat, aby byla zajištěna konzistence, tvorba indexů a pohledů a mnoho dalších operací.
- Správce dotazů: Provádí všechny operace související s dotazy uživatelů. Operace této komponenty jsou přímé dotazy do příslušných tabulek.
- Nástroj pro přístup koncového uživatele: Nástroje používané koncovými uživateli pro přístup k datům. Je rozdělen do různých skupin jako
- Nástroje pro hlášení dat
- Dotazovací nástroje
- Nástroje pro vývoj aplikací
- Nástroje EIS
- Nástroje OLAP a Data mining
Část 2 - Rozhovor s otázkami skladování dat (pokročilé)
Podívejme se nyní na pokročilé otázky týkající se datového skladu.
Q6. Co je tabulka Dimension?
Odpovědět:
Tabulka dimenzí v datovém skladu je tabulka ve schématu hvězd. Tabulky dimenzí se používají k ukládání kót nebo atributů, které popisují data v tabulce faktů. Například rozměr produktu může obsahovat název, popis, jednotkovou cenu, hmotnost, barvu a mnoho dalších atributů. Systém generovaný klíč je použit jedinečně k identifikaci řádku v tabulce rozměrů. Tento klíč slouží jako primární klíč v tabulce rozměrů a ve skutečnosti se používá jako cizí klíč ve skutečnosti, který pomáhá spojovat tyto dvě tabulky.
Q7. Co je tabulka faktů?
Odpovědět:
Tabulka faktů je střední tabulka schématu hvězd, obklopená tabulkou rozměrů datového skladu. Fakta se skládá z kvantitativních metrik nebo skutečností obchodního procesu. Fakta tabulka pracuje s tabulkou rozměrů a ukládá data, která mají být analyzována. Tabulka faktů obsahuje sloupec cizího klíče, který funguje jako primární klíč v tabulce rozměrů, který tento klíč umožňuje spojení mezi těmito dvěma tabulkami.
Přejdeme k dalším otázkám Interview s datovým skladem
Q8. Co je Data Mart?
Odpovědět:
Data Mart je podmnožina datového skladu, který obvykle obsahuje specifickou sadu dat souvisejících s konkrétní obchodní linií. Data Mart je malý a používá se při dotazování nebo analýze konkrétní sady dat, například dat vztahujících se k „prodejům“, „zákazníkům“, „objednávkám“ atd.
Q9. Co je úložiště provozních dat (ODS)?
Odpovědět:
Toto jsou nejčastěji kladené otázky týkající se rozhovoru s datovým skladováním. ODS je typ databáze, která ukládá data používaná operačními systémy před uložením do datového skladu. Slouží jako mezilehlá databáze. ODS obsahuje krátkodobá data, zatímco datový sklad obsahuje historická data.
Q10. Vysvětlete architekturu datového skladu.
Odpovědět:
Zahrnuje následující fáze:
- Vrstva zdroje dat: V této fázi jsou data shromažďována z různých zdrojů a ukládána do relační databáze. Data zahrnují data sociálních médií, provozní data, transakční data a mnoho dalších.
- Vrstva Staging Data: V této fázi jsou data ze vrstvy zdroje dat extrahována a zpracována, protože data budou z různých zdrojů a v různých formátech. Extrahovaná data budou podrobena kontrole kvality a konečné výsledky budou čistá a organizovaná data, která budou načtena do datového skladu.
- Vrstva ukládání dat: Tato vrstva je místo, kde budou data z pracovní oblasti uložena jako jediné centrální úložiště. V závislosti na obchodních požadavcích může být úložiště datový sklad, datový server nebo úložiště provozních dat.
- Vrstva prezentace dat: Tato vrstva je používána uživateli k přístupu k datům. Uživatelé mohou provádět různé dotazy nebo provádět některé analýzy k provádění sestav.
Doporučený článek
Toto byl průvodce seznamem otázek a odpovědí na rozhovor s datovým skladováním, aby uchazeč mohl snadno odpovědět na tyto otázky týkající se datového skladu. Zde v tomto příspěvku jsme studovali nejvyšší otázky týkající se datových skladů, které jsou často kladeny v rozhovorech. Další informace naleznete také v následujících článcích -
- RMAN Interview Otázky a odpovědi
- 10 hlavních otázek rozhovoru s analytiky dat
- Nejčastější dotazy týkající se pohovoru v režimu spánku
- Rozhovor s otázkami PowerShell
- Kompletní průvodce skladováním dat Oracle