Úvod do otázek a odpovědí rozhovoru s ETL

Obchodní informace a data jsou dnes nejdůležitějšími věcmi jakéhokoli podnikání. Analýza všech dat a integrace těchto výsledků získala obrovský potenciál na trhu. Existuje mnoho nástrojů pro testování ETL, které pomáhají při organizaci a zjednodušení procesu. ETL testování musí mít dobře definovanou strategii, která celý tento proces usnadní. Proces zahrnuje analýzu požadavku, ověření a odhad testu, plánování testování a návrh testovacího prostředí, přípravu a provedení testovacích dat a vytvoření souhrnné zprávy. Proces extrakce, transformace a načítání vyžaduje spoustu analýz a v důsledku toho vyžaduje řádné testování. Následující otázky vám umožní nahlédnout do všech otázek, které mohou být položeny při rozhovoru.

Nyní, pokud hledáte práci, která souvisí s testováním ETL, musíte se připravit na dotazovací pohovor s dotazem ETL na rok 2019. Je pravda, že každý pohovor se liší podle různých profilů práce. Zde jsme připravili důležité otázky a odpovědi týkající se testování rozhovorů s ETL, které vám pomohou uspět v pohovoru.

V tomto článku 2019 otázek rozhovoru s testy ETL představíme 10 nejdůležitějších a často používaných otázek rozhovoru s testováním ETL. Tyto otázky jsou rozděleny do dvou částí:

Část 1 - Otázky k pohovoru s testováním ETL (základní)

Tato první část se zabývá základními otázkami a odpověďmi na testování rozhovorů ETL

Q1. Co je ETL a vysvětlete, proč je vyžadováno testování ETL?

Odpovědět:
ETL je zkratka pro extrakt, transformaci a načtení. Tento proces se provádí pro data, která se používají k analýze a predikci budoucnosti jakéhokoli podnikání. Extrahování znamená lokalizaci dat a odstranění všech dat ze zdrojového souboru. Transformace je proces přenosu dat do jakéhokoli požadovaného souboru a načtení tohoto souboru do cílového systému ve formátu, který je požadován nebo použitelný. Potřeba testování ETL vyvstává, když musíme sledovat data, která se transformují z jednoho systému do druhého. Musíme také zkontrolovat účinnost a rychlost celého tohoto procesu. Testování ETL zajišťuje, že všechna implementovaná data odpovídají požadavkům klienta a poskytují potřebný výstup.

Q2. Co je náhradní klíč?

Odpovědět:
Náhradní klíč lze označit jako jedinečný identifikátor, který lze použít pro modelování entity nebo objektu. Může to být jedinečný klíč, jehož význam má být primárním identifikátorem jakéhokoli objektu nebo entity, který není odvozen od žádné jiné databáze a nemůže být použit jako primární klíč. Náhradní klíč může být jedinečné pořadové číslo. Náhradní klíč není vždy primární klíč a obvykle závisí na databázi. Vybere, zda je databáze aktuální nebo dočasná. Když je databáze aktuální, ukládá aktuální data a musí mít v datech vztah jeden k jednomu. Pokud jde o dočasnou databázi, může existovat vztah mezi dvěma a dvěma mezi primárními a náhradními klíči.

Vraťme se k dalším otázkám ohledně testování rozhovorů ETL.

Q3. Vysvětlete, co je rozdělení a vysvětlete typy oddílů?

Odpovědět:
Za účelem zlepšení výkonu jsou transakce, které jsou přítomny, rozděleny a tento proces se nazývá rozdělení. Rozdělení oddílů pomáhá serveru Informatica vytvářet různá připojení k různým zdrojům. Typy oddílů jsou:
Round Robin Partitioning: Všechna data jsou rovnoměrně rozdělena mezi všechny oddíly. Ve všech těchto oddílech, kdy je počet řádků přibližně stejný, se použije toto rozdělení.
Hash Partitioning: V tomto rozdělení jsou všechny klíče pro rozdělení rozděleny mezi oddíly a používají hashovací funkci. Slouží k zajištění toho, aby zpracovaná skupina řádků se stejným rozdělovacím klíčem měla stejné oddíly.

Q4. Jaké jsou způsoby aktualizace tabulky při používání SSIS?
Odpovědět:
Toto jsou běžné dotazy na pohovor s ETL. Níže naleznete různé tabulky, které jsou podporovány testováním ETL. Při aktualizaci tabulky pomocí SSIS lze provést následující kroky:

  • Použijte příkaz SQL
  • Použijte pracovní tabulku k ukládání dat fáze
  • Použijte mezipaměť k ukládání dat, která využívají omezený prostor a vyžadují časté aktualizace
  • K plánování úkolů použijte skripty
  • Pro aktualizaci MSSQL použijte úplný název databáze.

Q5. Co je to pracovní plocha a jaký je jeho účel?

Odpovědět:
Staging dat je obvykle soubor procesů, které se používají k přípravě zdrojových systémových dat. Tato data se pak načtou do datového skladu. Staging dat zahrnuje následující kroky:

Extrakce zdrojových dat a transformace dat, kde jsou data restrukturalizována dle požadavků zákazníka Transformace dat zahrnuje proces čištění dat a transformace hodnot. Zahrnuje také proces náhradních klíčových úkolů.

Část 2 - Otázky k pohovoru s testováním ETL (pokročilé)

Podívejme se nyní na pokročilé otázky týkající se testování rozhovorů ETL.

Q6. Vysvětlete rozdíl mezi testováním ETL a testováním databáze?

Odpovědět:
Rozdíl mezi testováním ETL a testováním databáze je následující:

  • Testování ETL se obvykle zaměřuje na reporting obchodních informací, zatímco testování databází zahrnuje integraci dat.
  • Nástroje, které se používají pro testování ETL, jsou Cognos, QuerySurge a Informatica, zatímco QTP a selen se používají k automatizaci testování databáze.
  • Analýza dat v ETL má potenciální dopad na data. Normální testování databáze má dopady na architektonickou implementaci
  • Testování ETL má deformovaná data, zatímco testování databáze používá normalizovaná data.

Q7. Co je to fakt? Vysvětlete typy faktů?

Odpovědět:
Skutečnost je ústřední součástí vícerozměrného modelu, který se skládá z opatření, která mají být analyzována. Fakta se týkají různých dimenzí.

Fakta jsou následující:
Aditivum: Míra může provádět aritmetické výpočty pomocí všech nebo některých rozměrů.
Polo aditivum: U tohoto typu může opatření provádět aritmetický výpočet pomocí pouze některých rozměrů.
Nepřídavné: Míra se nemůže podílet na aritmetických funkcích pomocí dimenze.

Vraťme se k dalším otázkám ohledně testování rozhovorů ETL.

Q8. Jaký je rozdíl mezi náhradním klíčem a primárním klíčem?

Odpovědět:
O náhradním klíči se říká, že má postupně generovaná čísla, která nemají žádný význam. Používá se pouze k jedinečné identifikaci řádků. Na druhé straně primární klíč se používá k jedinečné identifikaci řádků. Je viditelný pro uživatele a může být změněn podle požadavků.

Q9. Definujte pojem pomalu se měnící rozměr.
Odpovědět:
Toto jsou nejčastěji kladené dotazy na pohovor s ETL. Pomalu se měnící rozměry jsou ty, které mají tendenci se měnit velmi pomalu. Údaje obsažené v těchto dimenzích se pomalu mění. Příkladem této dimenze může být město nebo zaměstnanec.
Řádky v těchto datech v rozměrech mohou být buď zcela nahrazeny, aniž by byl zaznamenán žádný záznam, nebo může být vytvořen nebo vložen nový řádek. Pomocí tohoto lze sledovat také pomalé změny.

Q10. Vysvětlete koncept čištění dat?

Odpovědět:
Odstranění části dat z datového skladu se nazývá čištění dat. Tato data, která jsou vymazána, jsou obvykle data, která mají řádky s nulovými hodnotami nebo mezery, které je třeba vyčistit. V tomto procesu se provádí čištění tohoto druhu odpadu nebo nevyžádané hodnoty.

Doporučený článek

Toto byl průvodce seznamem otázek a odpovědí na dotazy týkající se testování ETL, aby uchazeč mohl tyto otázky týkající se testování na zkoušku ETL snadno zakročit. Zde v tomto příspěvku jsme studovali nejvyšší otázky týkající se testování ETL, které jsou často kladeny v rozhovorech. Další informace naleznete také v následujících článcích -

  1. 10 základních otázek rozhovoru Power Bi
  2. Otázky k rozhovoru PowerShell - nejužitečnější
  3. Top 10 MicroStrategy Interview Otázky
  4. JIRA Interview Otázky

Kategorie: