Úvod do příkazů Úlu

Příkaz Hive je nástroj infrastruktury datového skladu, který sedí na vrcholu Hadoop a shrnuje velká data. Zpracovává strukturovaná data. Usnadňuje dotazování a analýzu dat. Příkaz Úl se také nazývá „schéma při čtení;“ Úl neověřuje data, když je načtena, k ověření dojde pouze při vydání dotazu. Tato vlastnost Úlu zrychluje počáteční načítání. Je to jako kopírování nebo přesouvání souboru bez jakýchkoli omezení nebo kontrol. Úl byl poprvé vyvinut společností Facebook. Apache Software Foundation to vzal později a dále jej rozvíjel.

Zde jsou komponenty příkazu Hive:

Obr. 1. Složky úlu

https://www.developer.com/

Níže je uveden příkaz Funkce podregistru:

  1. Prodejny úlů jsou nezpracované a zpracované datové sady v Hadoopu.
  2. Je určen pro zpracování transakcí OnLine (OLTP). OLTP jsou systémy, které umožňují velkoobjemová data za velmi kratší dobu bez nutnosti spoléhat se na jediný server.
  3. Je rychlý, škálovatelný a spolehlivý.
  4. Zde zadaný dotazovací jazyk typu SQL se nazývá HiveQL nebo HQL. To usnadňuje úlohy ETL a další analýzu.

Obr. 2. Vlastnosti podregistru

Zdrojové obrázky: - Google

Existuje také několik omezení příkazu Hive, která jsou uvedena níže:

  1. Úl nepodporuje poddotazy.
  2. Úl jistě podporuje přepisování, ale bohužel nepodporuje mazání a aktualizace.
  3. Úl není určen pro OLTP, ale používá se pro něj.

Chcete-li vstoupit do interaktivní skořápky Úlu:

$ HIVE_HOME / bin / hive

Základní příkazy úlu

  1. Vytvořit

Tím vytvoříte novou databázi v Úlu.

  1. Pokles

Tato kapka odstraní tabulku z Úlu

  1. Změnit

Příkaz Alter vám pomůže přejmenovat tabulku nebo sloupce tabulky.

Například:

úl> ALTER TABLE zaměstnanec PŘEJMĚTE na zaměstnance1;

  1. Ukázat

Příkaz Show zobrazí všechny databáze sídlící v Úlu.

  1. Popsat

Příkaz Describe vám pomůže s informacemi o schématu tabulky.

Příkazy přechodného úlu

Úl rozděluje tabulku na různě související oddíly na základě sloupců. Pomocí těchto oddílů je snazší vyhledávat data. Tyto oddíly se dále dělí do kbelíků, aby mohl dotaz efektivně spouštět data.

Jinými slovy, kbelíky distribuují data do sady klastrů výpočtem hashového kódu klíče uvedeného v dotazu.

  1. Přidání oddílu

Přidání oddílu lze provést změnou tabulky. Řekněme, že máte tabulku „EMP“ s poli, jako je ID, jméno, plat, oddělení, označení a yoj.

úl> ALTER TABLE zaměstnanec

> PŘIDAT ČÁST (rok = '2012')

umístění '/ 2012 / part2012';

  1. Přejmenování oddílu

podregistr ALTER TABLE PARTITION (year = '1203')

Přejmenujte na oddíl (Yoj = '1203');

  1. Přerušte oddíl

úl> ALTER TABLE zaměstnanec DROP (POKUD existuje)

> PARTITION (year = '1203');

  1. Relační operátoři

Relační operátoři se skládají z určité sady operátorů, která pomáhá při získávání relevantních informací.

Například: Řekněme, že vaše tabulka „EMP“ vypadá takto:

Spusťte dotaz Hive, který nám přinese zaměstnance, jehož plat je vyšší než 30000.

úl> VYBRAT * Z EMP KDE Plat> = 40000;

  1. Aritmetické operátory

Jsou to operátoři, kteří pomáhají při provádění aritmetických operací na operandech a na oplátku vždy vracejí typy čísel.

Například: Chcete-li přidat dvě čísla, například 22 a 33

úl> VYBRAT 22 + 33 PŘIDAT z temp;

  1. Logický operátor

Tito operátoři mají provádět logické operace, které na oplátku vždy vracejí True / False.

úl> VYBRAT * Z EMP KDE Plat> 40000 && Dept = TP;

Rozšířené příkazy Úlu

  1. Pohled

Koncept pohledu v Úlu je podobný jako v SQL. Pohled lze vytvořit v okamžiku provedení příkazu SELECT.

Příklad:

úl> VYTVOŘENÍ ZOBRAZENÍ EMP_30000 AS

VÝBĚR * Z EMP

KDE plat> 30000;

  1. Načítání dat do tabulky

Podregistr> Načíst data místní inpath '/home/hduser/Desktop/AllStates.csv' do států tabulky;

Zde je „Státy“ již vytvořenou tabulkou v Úlu.

https://www.tutorialspoint.com/hive/

Úl má některé vestavěné funkce, které vám pomohou při získávání výsledků lépe.

Jako kolo, podlaha, BIGINT atd.

  1. Připojit

Klauzule join může pomoci při spojování dvou tabulek založených na stejném názvu sloupce.

Příklad:

úl> VYBRAT c.ID, c.NAME, c.AGE, o.AMOUNT

OD ZÁKAZNÍKŮ C PŘIPOJTE SE OBJEDNÁVKY o

ON (c.ID = o.CUSTOMER_ID);

Hive podporuje všechny druhy spojení: Levý vnější spoj, pravý vnější spoj, plný vnější spoj.

Tipy a triky k použití příkazů úlu

Hive umožňuje zpracování dat tak snadné, přímé a rozšiřitelné, že uživatel věnuje menší pozornost optimalizaci dotazů Hive. Při psaní dotazu Úl však věnovat pozornost několika věcem jistě přinese velký úspěch při řízení pracovní zátěže a šetří peníze. Níže uvádíme několik tipů:

  1. Partitions & Buckets: Hive je velký datový nástroj, který může dotazovat na velké datové sady. Psaní dotazu bez pochopení domény však může v Úlu přinést velké oddíly.

Pokud si uživatel je vědom datové sady, mohly by být relevantní a vysoce používané sloupce seskupeny do stejného oddílu. Pomůže to rychleji a neefektivněji spustit dotaz.

Nakonec ne. operací mapovače a I / O se také sníží.

Obr. 3. Rozdělení disku

Zdrojové obrázky: obrázek Google

Obr. 4 Bucketing

Zdrojové obrázky: - obrázek Google

  1. Paralelní spuštění: Hive spustí dotaz ve více fázích. V některých případech mohou tyto fáze záviset na jiných fázích, a proto nelze začít, jakmile je předchozí fáze dokončena. Nezávislé úkoly se však mohou spouštět paralelně, čímž se šetří celková doba běhu. Chcete-li povolit paralelní běh v Úlu:

set hive.exec.parallel = true;

To zlepší využití clusteru.

  1. Blokové vzorkování: Vzorkování dat z tabulky umožní zkoumání dotazů na data.

I přes vyřazování chceme raději vzorkovat datový soubor náhodněji. Blokování vzorkování přichází s různou výkonnou syntaxí, která pomáhá při vzorkování dat různými způsoby.

Vzorkování lze použít k nalezení cca. informace z datového souboru, jako je průměrná vzdálenost mezi původem a cílem.

Dotaz 1% velkých dat dá perfektní odpověď. Průzkum je mnohem jednodušší a efektivnější.

Závěr - Příkazy úlu

Úl je abstrakce vyšší úrovně na vrcholu HDFS, která poskytuje flexibilní jazyk dotazů. Pomáhá při dotazování a zpracování dat snadnějším způsobem.

Úl může být spojen s dalšími velkými datovými prvky, aby plně využil jeho funkčnosti.

Doporučené články

Toto byl průvodce Hive Commands. Zde jsme diskutovali základní i pokročilé příkazy Úlu a některé okamžité příkazy Úlu. Další informace naleznete také v následujícím článku -

  1. Hive Interview Otázky
  2. Úl VS Hue - Top 6 užitečných srovnání
  3. Tableau Příkazy
  4. Příkazy Adobe Photoshop
  5. Použití funkce OBJEDNÁVKA BY v Úlu
  6. Krok za krokem stáhněte a nainstalujte úl

Kategorie: