Úvod do tabulky úlu

Klíčové slovo „DROP“ označuje odstranění. Pro vymazání dat požadujeme, aby byla data v úlu přítomna.

V Hadoopu máme dvě funkce:

  1. Datové úložiště
  2. Zpracování dat

Pro ukládání dat přichází do obrazu HDFS (Hadoop Distributed File System). Nyní, když říkáme, že máme data v tabulce úlů, znamená to dvě věci:

  1. Data jsou v HDFS
  2. V tomto souboru HDFS jsme vytvořili tabulku podregistrů a data tohoto souboru HDFS načteme do tabulky podregistrů.

Takže v podstatě, aby tabulka úlu měla data, je datový soubor předpokladem. V tomto článku se podíváme na to, jak zahodit tabulky do úlu, co se stane, když je tabulka upuštěna a všechny věci související s tabulkou v úlu.

Typy přetažení tabulky v Úlu

V úlu jsou dva typy tabulek:

  1. Interní tabulka nebo spravovaná tabulka
  2. Externí tabulka nebo Nespravovaná tabulka

Spravovaná tabulka / vnitřní tabulka:

  1. V Úlu je výchozí adresář uživatel / podregistr / sklad . Interní tabulky jsou ve výchozím nastavení ukládány do tohoto adresáře. Při vytváření tabulky nemusíme místo zadávat ručně.
  2. Příkaz „Drop table“ trvale odstraní data.
  3. Úl spravuje veškeré zabezpečení spravovaných tabulek.

Mám tabulku již v adresáři „uživatel / podregistr / sklad“ nazvanou „kódy“.

Ke kontrole, zda je stávající tabulka spravovaná nebo nespravovaná, můžeme použít příkaz níže:

Syntaxe příkazu:

Popište formátovaný název_tabulky;

Výstup:

Podívejme se, data uvedená v tabulce „kódy“.

Nejprve pomocí příkazu úl -

Za druhé, pomocí Hue (Hadoop User Experience a Web UI)

Příkaz Delete: Drop table table_name;

Výstup:

Nyní, pokud chci vybrat data z „kódů“, dojde mi k chybě, protože tabulka je smazána.

Tuto tabulku také neuvidíme ve výchozím adresáři, který je

„Uživatel / podregistr / sklad“

Pozorujte zde,

Nespravovaná tabulka / externí tabulka:

  1. U externích tabulek jsme povinni zadat cestu, kam potřebujeme tuto tabulku uložit pomocí klíčového slova 'location' v příkazu create table.

Například:

VYTVOŘTE VNĚJŠÍ TABULKU stg_s2_json.products

(řetězec bez názvu produktu, řetězec názvu produktu, popisný řetězec, aktivní řetězec, vytvořený řetězec data, aktualizovaný řetězec data) formát řádků s oddělovači zakončený ', '

LOCATION '/user/data/hive/stg_s2_json.db/products';

  1. Úl pouze odstraní metadata. Data jsou trvalá.
  2. Tyto tabulky může použít kdokoli, kdo má přístup k HDFS, takže musí spravovat zabezpečení na úrovni složek.

Pro pochopení vynechání externí tabulky použijeme tabulku „produkty“.

Zkontrolujte, zda je tabulka interní nebo externí. Příkaz „Opište formátovaný název_tabulky“.

V příkazu select dodržujte „limit 10“. Tabulka Produkty obsahuje níže uvedená data:

Chcete-li to zkontrolovat v odstínu, vypadá to takto:

Uvidíme, co se stane, když tuto tabulku zrušíme:

Syntax:

Drop table table_name;

Výstup:

Nyní, pokud se pokoušíte načíst data tabulky, vyvolá to chybu.

Nejprve pomocí příkazu „select“ na terminálu mi hodí chybu, což znamená, že jsou odstraněna metadata pro externí tabulku.

Zde pozorujte chybu:

Za druhé, kontrola stavu odstínu dat, soubor „products.json“ je stále přítomen v HDFS, což znamená, že data jsou trvalá.

Závěr

Usnadníme vám a poskytnu vám klíčové body pro oba druhy tabulek. Vy rozhodujete, který typ bude vyhovovat vašim požadavkům.

Vnitřní tabulka

Externí tabulka

Také se nazývá „Managed Table“Také se nazývá „Nespravovaná tabulka“
Není třeba uvádět umístění, tato výchozí data spravuje výchozí adresář HivePotřeba poskytnout umístění
Odstraní také metadata tabulky a (Data jsou dočasná)Úl ponechá data nedotčená (Data jsou trvalá)
Samotný úl řídí bezpečnost stoluPotřeba spravovat zabezpečení na úrovni složek

Doporučené články

Toto je průvodce tabulkou úlu. Zde diskutujeme zavedení tabulky úlu, typy tabulek v úlu podél syntaxe. Další informace naleznete také v dalších navrhovaných článcích -

  1. Co je Úl?
  2. Architektura úlu
  3. Příkazy úlu
  4. Co je to databáze Oracle
  5. Hive Order By
  6. Instalace podregistru

Kategorie: