Úvod do příkazů Úlu
Příkaz Hive je nástroj infrastruktury datového skladu, který sedí na vrcholu Hadoop a shrnuje velká data. Zpracovává strukturovaná data. Usnadňuje dotazování a analýzu dat. Příkaz Úl se také nazývá „schéma při čtení;“ Úl neověřuje data, když je načtena, k ověření dojde pouze při vydání dotazu. Tato vlastnost Úlu zrychluje počáteční načítání. Je to jako kopírování nebo přesouvání souboru bez jakýchkoli omezení nebo kontrol. Úl byl poprvé vyvinut společností Facebook. Apache Software Foundation to vzal později a dále jej rozvíjel.
Zde jsou komponenty příkazu Hive:
Obr. 1. Složky úlu
https://www.developer.com/
Níže je uveden příkaz Funkce podregistru:
- Prodejny úlů jsou nezpracované a zpracované datové sady v Hadoopu.
- Je určen pro zpracování transakcí OnLine (OLTP). OLTP jsou systémy, které umožňují velkoobjemová data za velmi kratší dobu bez nutnosti spoléhat se na jediný server.
- Je rychlý, škálovatelný a spolehlivý.
- Zde zadaný dotazovací jazyk typu SQL se nazývá HiveQL nebo HQL. To usnadňuje úlohy ETL a další analýzu.
Obr. 2. Vlastnosti podregistru
Zdrojové obrázky: - Google
Existuje také několik omezení příkazu Hive, která jsou uvedena níže:
- Úl nepodporuje poddotazy.
- Úl jistě podporuje přepisování, ale bohužel nepodporuje mazání a aktualizace.
- Úl není určen pro OLTP, ale používá se pro něj.
Chcete-li vstoupit do interaktivní skořápky Úlu:
$ HIVE_HOME / bin / hive
Základní příkazy úlu
-
Vytvořit
Tím vytvoříte novou databázi v Úlu.
-
Pokles
Tato kapka odstraní tabulku z Úlu
-
Změnit
Příkaz Alter vám pomůže přejmenovat tabulku nebo sloupce tabulky.
Například:
úl> ALTER TABLE zaměstnanec PŘEJMĚTE na zaměstnance1;
-
Ukázat
Příkaz Show zobrazí všechny databáze sídlící v Úlu.
-
Popsat
Příkaz Describe vám pomůže s informacemi o schématu tabulky.
Příkazy přechodného úlu
Úl rozděluje tabulku na různě související oddíly na základě sloupců. Pomocí těchto oddílů je snazší vyhledávat data. Tyto oddíly se dále dělí do kbelíků, aby mohl dotaz efektivně spouštět data.
Jinými slovy, kbelíky distribuují data do sady klastrů výpočtem hashového kódu klíče uvedeného v dotazu.
-
Přidání oddílu
Přidání oddílu lze provést změnou tabulky. Řekněme, že máte tabulku „EMP“ s poli, jako je ID, jméno, plat, oddělení, označení a yoj.
úl> ALTER TABLE zaměstnanec
> PŘIDAT ČÁST (rok = '2012')
umístění '/ 2012 / part2012';
-
Přejmenování oddílu
podregistr ALTER TABLE PARTITION (year = '1203')
Přejmenujte na oddíl (Yoj = '1203');
-
Přerušte oddíl
úl> ALTER TABLE zaměstnanec DROP (POKUD existuje)
> PARTITION (year = '1203');
-
Relační operátoři
Relační operátoři se skládají z určité sady operátorů, která pomáhá při získávání relevantních informací.
Například: Řekněme, že vaše tabulka „EMP“ vypadá takto:
Spusťte dotaz Hive, který nám přinese zaměstnance, jehož plat je vyšší než 30000.
úl> VYBRAT * Z EMP KDE Plat> = 40000;
-
Aritmetické operátory
Jsou to operátoři, kteří pomáhají při provádění aritmetických operací na operandech a na oplátku vždy vracejí typy čísel.
Například: Chcete-li přidat dvě čísla, například 22 a 33
úl> VYBRAT 22 + 33 PŘIDAT z temp;
-
Logický operátor
Tito operátoři mají provádět logické operace, které na oplátku vždy vracejí True / False.
úl> VYBRAT * Z EMP KDE Plat> 40000 && Dept = TP;
Rozšířené příkazy Úlu
-
Pohled
Koncept pohledu v Úlu je podobný jako v SQL. Pohled lze vytvořit v okamžiku provedení příkazu SELECT.
Příklad:
úl> VYTVOŘENÍ ZOBRAZENÍ EMP_30000 AS
VÝBĚR * Z EMP
KDE plat> 30000;
-
Načítání dat do tabulky
Podregistr> Načíst data místní inpath '/home/hduser/Desktop/AllStates.csv' do států tabulky;
Zde je „Státy“ již vytvořenou tabulkou v Úlu.
https://www.tutorialspoint.com/hive/
Úl má některé vestavěné funkce, které vám pomohou při získávání výsledků lépe.
Jako kolo, podlaha, BIGINT atd.
-
Připojit
Klauzule join může pomoci při spojování dvou tabulek založených na stejném názvu sloupce.
Příklad:
úl> VYBRAT c.ID, c.NAME, c.AGE, o.AMOUNT
OD ZÁKAZNÍKŮ C PŘIPOJTE SE OBJEDNÁVKY o
ON (c.ID = o.CUSTOMER_ID);
Hive podporuje všechny druhy spojení: Levý vnější spoj, pravý vnější spoj, plný vnější spoj.
Tipy a triky k použití příkazů úlu
Hive umožňuje zpracování dat tak snadné, přímé a rozšiřitelné, že uživatel věnuje menší pozornost optimalizaci dotazů Hive. Při psaní dotazu Úl však věnovat pozornost několika věcem jistě přinese velký úspěch při řízení pracovní zátěže a šetří peníze. Níže uvádíme několik tipů:
- Partitions & Buckets: Hive je velký datový nástroj, který může dotazovat na velké datové sady. Psaní dotazu bez pochopení domény však může v Úlu přinést velké oddíly.
Pokud si uživatel je vědom datové sady, mohly by být relevantní a vysoce používané sloupce seskupeny do stejného oddílu. Pomůže to rychleji a neefektivněji spustit dotaz.
Nakonec ne. operací mapovače a I / O se také sníží.
Obr. 3. Rozdělení disku
Zdrojové obrázky: obrázek Google
Obr. 4 Bucketing
Zdrojové obrázky: - obrázek Google
- Paralelní spuštění: Hive spustí dotaz ve více fázích. V některých případech mohou tyto fáze záviset na jiných fázích, a proto nelze začít, jakmile je předchozí fáze dokončena. Nezávislé úkoly se však mohou spouštět paralelně, čímž se šetří celková doba běhu. Chcete-li povolit paralelní běh v Úlu:
set hive.exec.parallel = true;
To zlepší využití clusteru.
- Blokové vzorkování: Vzorkování dat z tabulky umožní zkoumání dotazů na data.
I přes vyřazování chceme raději vzorkovat datový soubor náhodněji. Blokování vzorkování přichází s různou výkonnou syntaxí, která pomáhá při vzorkování dat různými způsoby.
Vzorkování lze použít k nalezení cca. informace z datového souboru, jako je průměrná vzdálenost mezi původem a cílem.
Dotaz 1% velkých dat dá perfektní odpověď. Průzkum je mnohem jednodušší a efektivnější.
Závěr - Příkazy úlu
Úl je abstrakce vyšší úrovně na vrcholu HDFS, která poskytuje flexibilní jazyk dotazů. Pomáhá při dotazování a zpracování dat snadnějším způsobem.
Úl může být spojen s dalšími velkými datovými prvky, aby plně využil jeho funkčnosti.
Doporučené články
Toto byl průvodce Hive Commands. Zde jsme diskutovali základní i pokročilé příkazy Úlu a některé okamžité příkazy Úlu. Další informace naleznete také v následujícím článku -
- Hive Interview Otázky
- Úl VS Hue - Top 6 užitečných srovnání
- Tableau Příkazy
- Příkazy Adobe Photoshop
- Použití funkce OBJEDNÁVKA BY v Úlu
- Krok za krokem stáhněte a nainstalujte úl