Úvod do tabulky úlu
Klíčové slovo „DROP“ označuje odstranění. Pro vymazání dat požadujeme, aby byla data v úlu přítomna.
V Hadoopu máme dvě funkce:
- Datové úložiště
- Zpracování dat
Pro ukládání dat přichází do obrazu HDFS (Hadoop Distributed File System). Nyní, když říkáme, že máme data v tabulce úlů, znamená to dvě věci:
- Data jsou v HDFS
- V tomto souboru HDFS jsme vytvořili tabulku podregistrů a data tohoto souboru HDFS načteme do tabulky podregistrů.
Takže v podstatě, aby tabulka úlu měla data, je datový soubor předpokladem. V tomto článku se podíváme na to, jak zahodit tabulky do úlu, co se stane, když je tabulka upuštěna a všechny věci související s tabulkou v úlu.
Typy přetažení tabulky v Úlu
V úlu jsou dva typy tabulek:
- Interní tabulka nebo spravovaná tabulka
- Externí tabulka nebo Nespravovaná tabulka
Spravovaná tabulka / vnitřní tabulka:
- V Úlu je výchozí adresář „ uživatel / podregistr / sklad “ . Interní tabulky jsou ve výchozím nastavení ukládány do tohoto adresáře. Při vytváření tabulky nemusíme místo zadávat ručně.
- Příkaz „Drop table“ trvale odstraní data.
- Úl spravuje veškeré zabezpečení spravovaných tabulek.
Mám tabulku již v adresáři „uživatel / podregistr / sklad“ nazvanou „kódy“.
Ke kontrole, zda je stávající tabulka spravovaná nebo nespravovaná, můžeme použít příkaz níže:
Syntaxe příkazu:
Popište formátovaný název_tabulky;
Výstup:
Podívejme se, data uvedená v tabulce „kódy“.
Nejprve pomocí příkazu úl -
Za druhé, pomocí Hue (Hadoop User Experience a Web UI)
Příkaz Delete: Drop table table_name;
Výstup:
Nyní, pokud chci vybrat data z „kódů“, dojde mi k chybě, protože tabulka je smazána.
Tuto tabulku také neuvidíme ve výchozím adresáři, který je
„Uživatel / podregistr / sklad“
Pozorujte zde,
Nespravovaná tabulka / externí tabulka:
- U externích tabulek jsme povinni zadat cestu, kam potřebujeme tuto tabulku uložit pomocí klíčového slova 'location' v příkazu create table.
Například:
VYTVOŘTE VNĚJŠÍ TABULKU stg_s2_json.products
(řetězec bez názvu produktu, řetězec názvu produktu, popisný řetězec, aktivní řetězec, vytvořený řetězec data, aktualizovaný řetězec data) formát řádků s oddělovači zakončený ', '
LOCATION '/user/data/hive/stg_s2_json.db/products';
- Úl pouze odstraní metadata. Data jsou trvalá.
- Tyto tabulky může použít kdokoli, kdo má přístup k HDFS, takže musí spravovat zabezpečení na úrovni složek.
Pro pochopení vynechání externí tabulky použijeme tabulku „produkty“.
Zkontrolujte, zda je tabulka interní nebo externí. Příkaz „Opište formátovaný název_tabulky“.
V příkazu select dodržujte „limit 10“. Tabulka Produkty obsahuje níže uvedená data:
Chcete-li to zkontrolovat v odstínu, vypadá to takto:
Uvidíme, co se stane, když tuto tabulku zrušíme:
Syntax:
Drop table table_name;
Výstup:
Nyní, pokud se pokoušíte načíst data tabulky, vyvolá to chybu.
Nejprve pomocí příkazu „select“ na terminálu mi hodí chybu, což znamená, že jsou odstraněna metadata pro externí tabulku.
Zde pozorujte chybu:
Za druhé, kontrola stavu odstínu dat, soubor „products.json“ je stále přítomen v HDFS, což znamená, že data jsou trvalá.
Závěr
Usnadníme vám a poskytnu vám klíčové body pro oba druhy tabulek. Vy rozhodujete, který typ bude vyhovovat vašim požadavkům.
Vnitřní tabulka |
Externí tabulka |
Také se nazývá „Managed Table“ | Také se nazývá „Nespravovaná tabulka“ |
Není třeba uvádět umístění, tato výchozí data spravuje výchozí adresář Hive | Potřeba poskytnout umístění |
Odstraní také metadata tabulky a (Data jsou dočasná) | Úl ponechá data nedotčená (Data jsou trvalá) |
Samotný úl řídí bezpečnost stolu | Potřeba spravovat zabezpečení na úrovni složek |
Doporučené články
Toto je průvodce tabulkou úlu. Zde diskutujeme zavedení tabulky úlu, typy tabulek v úlu podél syntaxe. Další informace naleznete také v dalších navrhovaných článcích -
- Co je Úl?
- Architektura úlu
- Příkazy úlu
- Co je to databáze Oracle
- Hive Order By
- Instalace podregistru