Úvod k otázkám a odpovědím na rozhovor s ETL

ETL znamená Extract-Transform-Load. Jedná se o systémový základ datového skladu, kde jsou data extrahována z různých zdrojů a poté jsou data transformována tam, kde jsou data vynucena nebo zpracována tak, aby byla zajištěna kvalita, konzistence dat ve vhodném formátu prezentace a nakonec data jsou načtena do datového skladu v prezentačním formátu, aby mohla koncovému uživateli pomoci získat informace snadno a učinit rozhodnutí.

Níže je uvedeno prvních 2019 dotazů ETL Interview, které jsou často kladeny v rozhovoru

Pokud hledáte práci, která souvisí s ETL, musíte se připravit na 2019 dotazy na rozhovor s ETL. Přestože je každý rozhovor jiný a rozsah práce je také odlišný, můžeme vám pomoci s top otázkami a odpověďmi na ETL Interview, které vám pomohou udělat krok a získat úspěch v rozhovoru.

Část 1 - Otázky k pohovoru ETL (základní)

Tato první část se zabývá základními otázkami a odpověďmi rozhovoru ETL

1. Rozbalte systém ETL v datovém skladu? Vysvětlit

Odpovědět:
Základem datového skladu je systém Extract-Transform-Load (ETL). Správně navržený systém ETL extrahuje data ze zdrojových systémů, vynucuje standardy kvality a konzistence dat, potvrzuje data tak, aby mohly být společně použity samostatné zdroje, a konečně dodává data ve formátu připraveném pro prezentaci, takže vývojáři aplikací mohou vytvářet aplikace a koncové uživatele. může rozhodovat.

2. Význam systému ETL v datovém skladu?

Odpověď :
Odstraňuje chyby a opravuje chybějící data. Poskytuje zdokumentovaná měřítka důvěry v údaje. Zachycuje tok nadnárodních dat pro úschovu. Upravuje data z více zdrojů tak, aby byla použita společně. Strukturuje data tak, aby byla použitelná pomocí nástrojů koncových uživatelů.

3. Jaký je každodenní proces v systému ETL?

Odpověď :
Sestavte vývojovou / testovací / produkční sadu procesů ETL. Pochopte kompromisy různých datových struktur v zadní místnosti, včetně plochých souborů, normalizovaných schémat, schémat XML a schémat hvězdných spojů (dimenzionálních). Analyzujte a extrahujte zdrojová data. Vytvořte komplexní subsystém čištění dat. Struktura dat do dimenzionálních schémat pro co nejefektivnější doručování koncovým uživatelům, nástroje business intelligence, nástroje dolování dat, kostky OLAP a analytické aplikace. Poskytujte data efektivně do vysoce centralizovaných i hluboce distribuovaných datových skladů pomocí stejných technik. Vyladění celkového procesu ETL pro optimální výkon.

Přejdeme k dalším otázkám rozhovoru ETL.

4. Formáty dat v systému ETL?

Odpověď :
V ETL existují různé datové formáty, některé z nich jsou ploché soubory, datové sady XML, nezávislé pracovní tabulky DBMS, schémata normalizovaných entit / vztahů (E / R) a rozměrové datové modely.

5. Profilování dat v systému ETL?

Odpověď :
Profilování dat je systematické zkoumání kvality, rozsahu a kontextu zdroje dat, aby bylo možné sestavit systém ETL. V jednom extrému vyžaduje velmi čistý zdroj dat, který byl dobře udržován před tím, než dorazí do datového skladu, minimální transformaci a zásah člověka, aby bylo možné načíst přímo do konečných rozměrových tabulek a faktických tabulek.

6. Co je ETL validátor?

Odpověď :
ETL Validator je nástroj pro testování dat, který výrazně zjednodušuje testování projektů integrace dat, datového skladu a migrace dat. Využívá naši patentovanou architekturu ELV k extrahování, načtení a ověření dat ze zdrojů dat, jako jsou databáze, ploché soubory, XML, Hadoop a BI systémy.

Část 2 - Otázky pro rozhovor s ETL (pokročilé)

Pojďme se nyní podívat na pokročilé otázky rozhovoru ETL.

7. Jaké jsou operace v systému ETL?

Odpověď :
Následující tři operace: Extrahuje data z vašeho nadnárodního systému, kterým může být Oracle, Microsoft nebo jakákoli jiná relační databáze. Transformuje data provedením operací čištění dat. Zatížení je proces zápisu dat do cílové databáze.

8. Pojmenujte některé nástroje ETL, které se nejčastěji používají na trhu?

Odpovědět:
Na trhu se používají různé nástroje ETL, ale některé z preferovaných nástrojů ETL
• Oracle Warehouse Builder (OWB)
• SAP Data Services.
• Informační server IBM Infosphere.
• Správa dat SAS.
• Informatické centrum Power Center.
• Elixir Repertoire pro Data ETL.
• Migrátor dat (IBI)
• SQL Server Integration Services (SSIS)

9. Jaké jsou role a povinnosti týmu ETL?

Odpovědět:
Úlohou týmu ETL na nejvyšší úrovni je vybudovat zadní místnost datového skladu.
• Poskytovat data nejefektivněji koncovým uživatelům
• Přidání hodnoty k datům v krokech čištění a přizpůsobení
• Chraňte a dokumentujte řadu dat
• Extrahování dat z původních zdrojů
• Zajištění kvality a čištění dat
• Shoda štítků a opatření v údajích, kterých má být dosaženo
• konzistence napříč původními zdroji
• Poskytování dat ve fyzickém formátu, který lze použít pomocí dotazovacích nástrojů,
• Spisovatelé sestav a dashboardy.

Přejdeme k dalším otázkám rozhovoru ETL.

10. Jaká je role analýzy dopadů v systému ETL?

Odpovědět:
Analýza dopadu zkoumá metadata spojená s objektem (v tomto případě tabulkou nebo sloupcem) a určuje, co je ovlivněno změnou struktury nebo obsahu. Změna objektů pro ukládání dat může narušit procesy, které jsou zásadní pro správné načtení datového skladu. Povolení ad-hoc změn v objektech pro ukládání dat je na újmu úspěchu vašeho projektu. Jakmile je v pracovní oblasti vytvořena tabulka, musíte před provedením jakýchkoli změn provést analýzu dopadu. Mnoho dodavatelů nástrojů ETL poskytuje funkčnost analýzy dopadu, ale tato funkce je často přehlížena během ETL produktu pro ověření konceptu, protože se jedná o funkci back-room a
Není to opravdu důležité, dokud nebude datový sklad spuštěn a nezačne se vyvíjet.

11. Jak zpracujete plochý soubor s pevnou délkou?

Odpovědět:
Rozložení souboru s pevnou délkou by mělo obsahovat název souboru, kde pole začíná; jeho délka; a jeho datový typ (obvykle text nebo číslo). Někdy je dodána koncová poloha. Pokud tomu tak není, musíte vypočítat koncovou polohu každého pole na základě jeho počáteční polohy a délky, pokud to váš nástroj ETL vyžaduje. Ve většině nástrojů ETL budete pravděpodobně muset ručně zadat rozložení souboru plochého souboru jednou. Po zadání rozložení si nástroj zapamatuje rozložení a očekává stejné rozložení při každé interakci se skutečným plochým souborem. Pokud se rozložení souboru změní nebo se data posunou z přiřazených pozic, musí být proces ETL naprogramován tak, aby selhal. Při zpracování plochých souborů s pevnou délkou se pokuste ověřit, zda jsou polohy dat v souboru přesné. Rychlá kontrola k ověření pozic je otestovat každé datum (nebo čas) pole a ujistit se, že je platné datum. Pokud jsou pozice posunuty, datumové pole s největší pravděpodobností obsahuje alfa znaky nebo nelogická čísla. Stejným způsobem lze testovat i jiná pole s velmi specifickými doménami. XML nabízí konkrétnější validační schopnosti. Pokud je ověřování nebo konzistence dat problém, zkuste přesvědčit poskytovatele dat, aby data dodal ve formátu XML.

12.Proč v reálném čase ETL v datovém skladu?

Odpovědět:
Datový sklad potřeboval poskytnout neochvějnou sadu dat pro obchodní rozhodovatele a poskytoval spolehlivé informační patro, na kterém stojí. Pro aktuální hlášení proti blikající databázi byli firemní uživatelé nasměrováni do produkčních aplikací, které provozují tento podnik. Uživatelé proto museli jít do datového skladu, aby získali historický obraz toho, co se v podnikání stalo včera, a museli se podívat na mnoho systémů OLTP, aby zjistili, co se dnes děje. Firemní uživatelé tuto propast nikdy nikdy nepřijali. Datové sklady samozřejmě potřebují neustálé toky informací o zákaznících z provozu, ale operační systémy se stále více spoléhají na obohacení zákaznických informací o datové sklady. Proto je předvídatelné, že organizace začaly zkoumat architektonické alternativy, které mohou podporovat všeobecnější integrační scénáře přesunující provozní data mezi aplikacemi a současně do a ze skladu se stále rostoucí naléhavostí.

Doporučené články

Toto byl průvodce seznamem otázek a odpovědí na rozhovor s ETL, aby uchazeč mohl snadno přijmout tyto dotazy na pohovor. Další informace naleznete také v následujících článcích -

  1. Azure Paas vs Iaas - funkce
  2. 9 Úžasné MapReduce Interview Otázky a odpovědi
  3. Top 11 nejužitečnějších dotazů a odpovědí na rozhovor RDBMS
  4. 10 nejčastějších dotazů na rozhovor s PHP pro zkušené
  5. Seznamte se s 5 nejužitečnějšími dotazy a odpověďmi na rozhovor s DBA

Kategorie: