Úvod do Oracle Data Warehousing
Skladování dat může být obecně definováno jako databáze pro shromažďování obchodních nebo organizačních dat, na kterých lze dosáhnout požadovaných aktivit v obchodních případech. Pravidelné transakční operace jsou odděleny od celkového pracovního vytížení, zatímco ukládání historických záznamů pro analýzu a vylepšení se provádí před skladováním. V tomto článku budeme diskutovat Oracle Data Warehousing.
Přesně, Data Warehousing zahrnuje:
- Hromadění historických záznamů z různých zdrojů dat.
- Kontrola a analýza minulých obchodních záznamů.
- Odvozte informace a požadované informace k řízení obchodních potřeb a motivů.
Operace jsou tedy spíše orientovány na čtení než přímou manipulaci s datovými soubory. Skladování dat Oracle je plně optimalizované, komplexní a spolehlivé databázové pojetí databáze Oracle založené na cloudu. Je primárně postaven na zkušenostech s efektivními a flexibilními databázovými operacemi, díky kterým je výkon na trhu špičkovým.
Charakteristika datového skladu
William H. Inmon, americký počítačový vědec, odkazuje na charakteristiky datového skladu jako:
-
Předmět-orientovaný
Datový sklad je primárně vykreslen za účelem analýzy dat a odvození poznatků. Můžeme na zakázku stavět sklady na konkrétních odděleních ve firmě.
které zase mohou odvodit výkonné žebříčky, cílové zákazníky atd.
-
Integrovaný
Data, která jsou zpracována, se často načítají z různých zdrojů. Za takových okolností by data měla převládat důsledně předcházet konfliktům. Takovou vlastností je integrita.
-
Non Volatile
Pokud jsou data přenesena do skladu, nelze s nimi manipulovat ani je měnit. Vzhledem k tomu, analýza se provádí na data, která nastala.
-
Časová varianta
Aby bylo možné odvodit trendy a regresi historických dat, vyžaduje analytik obrovské množství dat.
Architektura Oracle Data Warehousing
Obecně lze architekturu datového skladu Oracle obecně klasifikovat jako:
1. Jednoúrovňová architektura
Primárním cílem je do značné míry snížit ukládání dat, čímž se odstraní nadbytečnost. Ale v praxi je to mnohem méně zvyklé.
2. Dvouúrovňová architektura
Diskrétní vrstva fyzicky dostupných zdrojů dat a datových skladů. Ve srovnání s tím architektura není rozšiřitelná a také čelí omezením konektivity.
3. Třístupňová architektura
Slavná architektura se skládá z dolní, střední a horní vrstvy.
- Spodní vrstva: Databáze je v této vrstvě, která je převážně relační databázové systémy. Zdroje dat jsou shromažďovány a manipulovány pomocí různých back-end aplikací a dodávány do databáze.
- Střední vrstva: Abstrahovaný vrstvený pohled na databázi, která funguje jako prostředník mezi uživatelem a databází. Oracle podporuje výkonný OLAP, který je implementován ve střední vrstvě a poskytuje v systému zabezpečená, škálovatelná analytická opatření.
- Horní vrstva: Přední vrstva načítá data z databáze a předkládá je klientovi. Může to být kterýkoli z nástrojů pro dotazování založených na Oracle, jako je SQLPlus, vývojář SQL.
Nyní se posuneme dopředu a prozkoumáme podrobnosti o celkové architektuře. Viz obrázek níže:
- Centrální systém, tj. Datový sklad Oracle, sestává především ze surových dat, metadat a souhrnných dat.
- Nezpracovaná data jsou skutečné užitečné zatížení běžného uloženého OLTP, s nímž metadata definují data přítomná uvnitř.
- Na druhé straně souhrnná data obsahují všechny nadbytečné drahé a dlouhodobé operace, které se také nazývají materializovaný pohled.
- Dodávání správného zdroje údajů o kvalitě je důležitější, což zase ovlivňuje kvalitu a údržbu skladování dat v dlouhodobém horizontu.
Zdroje dat
- Ve větších podnicích jsou data často získávána z různých zdrojů.
- Může to být kdekoli od starých dat, externích zdrojů, vertikálních aplikací.
Pracovní plocha
- Před vložením do datového skladu by měla být zpracována a vyčištěna provozní data.
- Pracovní plocha se stará o tento proces, který lze opět spustit programově.
- Pracovní oblast je zodpovědná za konsolidaci a zpracování nestrukturovaných dat z různých zdrojů dat.
- Význam oblasti zastávky lze realizovat při manipulaci s podnikovými sklady, kde by data měla pocházet z kolektivně ve nestrukturovaném formátu, zpracována a konsolidována před jejich dodáním do skladu.
Data Marts
- Kromě manipulace se zdroji dat by podniková společnost často vyžadovala přizpůsobení rozsahu architektury různým skupinám.
- Datové mapy slouží k tomuto účelu, kdy je systém v závislosti na různých odděleních, jako je marketing, účelově oddělený pro účel použití. Datové mapy definují rozsah přístupnosti uživatelů a skupin uživatelů a řídí preventivní způsoby.
- Tým Reporting by například získal přístup k datům prodeje a procesnímu panelu pro podnikání, zatímco prodej používá data analytického týmu k řízení obchodních rozhodnutí. Taková konsolidace a definice rozsahu jsou uvedeny v datových tabulkách.
- Kromě toho mohou být datové servery obvykle umístěny společně se systémem datového skladu Oracle nebo někdy mohou být vytvořeny jako samostatný systém podporující škálovatelnost.
Výhody
- Ve srovnání s tím je sklad Oracle považován za jednoduchý a snadno konfigurovatelný, pokud jsou cíle a zdroje jasné.
- Zaměřuje se především na improvizaci rozhodování v podnikání.
- Zvýšená produktivita a efektivní provozní náklady.
- Podporuje přeměnu velkých surových dat na cenné poznatky.
- Integrita dat může být zaručena rychlou kvalitou.
Nevýhody
Se všemi pochvaly stranou, datové sklady Oracle mají určité nevýhody, jak je vysvětleno níže:
-
Bezpečnostní obavy
Zabezpečení dat lze přesně zaúčtovat jako záruku pouze jako prostředek dodavatele. Také v případě vlastní implementace může být obtížné zajistit důvěryhodný rozsah dostupnosti mezi různými toky ve firmě.
-
Flexibilita dat
Často mají sklady tendenci uchovávat statická data a podléhají vážným strukturám dotazů.
-
Poměr nákladů a přínosů
Údržba a výdaje na pracovní hodiny IT jsou obrovským faktorem při implementaci skladů Oracle Data.
Řízení kvality v Oracle Data Warehousing
- Podporuje komplexní řešení kvality.
- Sleduje metadata a shrnutí úložiště.
- V závislosti na potřebách může vytvořit mapování pro opravy dat.
Role datového skladu ve firmě lze konkrétně kategorizovat jako různé pracovní tituly od Data miner, konzultant / vývojář datového skladu po architekta. IT průmysl je neustále svědkem rychlého růstu specializací na skladování dat v technologiích business intelligence.
Doporučené články
Toto je průvodce Oracle Data Warehousing. Zde diskutujeme o architektuře, charakteristice, výhodách a nevýhodách datového skladu Oracle. Můžete si také prohlédnout naše další doporučené články -
- Komponenty produktu Oracle Warehouse Builder
- Co je to Oracle Database a jeho architektura
- Úvod do funkcí Oracle String
- Snadné kroky k instalaci Oracle
- KPI v Power BI
- Power BI IF Statement
- Co je dotaz a typy dotazů Oracle