Příkaz HDFS - Základní pro pokročilé příkazy s tipy a triky

Úvod do příkazů HDFS

Big data je slovo pro datové sady, které jsou tak obrovské nebo složité, že běžný aplikační software pro zpracování dat nestačí k tomu, aby s nimi bylo uzavřeno. Hadoop je otevřený zdrojový programovací rámec založený na Javě, který zřetězuje prostor pro zpracování a ukládání enormně objemných datových souborů v rozšířeném výpočetním prostředí. Softwarová nadace Apache je klíčem k instalaci Hadoop

Vlastnosti HDFS:

HDFS běží na architektuře Master / Slave
HDFS používá soubory k ukládání uživatelských dat
obsahuje obrovskou sadu adresářů a souborů, které jsou uloženy v hierarchickém formátu.
Zevnitř je soubor roztržen do menších bloků a tyto bloky jsou uloženy v sadě Datanodes.
Namenode a Datanode jsou část softwaru určeného ke spuštění na strojích produktů, které klasicky běží na operačním systému GNU / Linux.

Namenode:

Zde je souborový systém udržován jmenným uzlem
Namenode je také zodpovědný za protokolování všech změn systému souborů, navíc udržuje obraz úplného jmenného prostoru souborového systému a souboru Blockmap v paměti
Kontrolní stanovování se provádí pravidelně. proto lze snadno obnovit do fáze před tím, než lze dosáhnout bodu nárazu.

Datanode:

Datanode poskytuje data v souborech v místním systému souborů
Aby bylo možné intimizovat jeho existenci, datový uzel pošle tep do namenodu
Pro každý přijatý 10. tep bude vygenerována bloková zpráva
Replikace se implikuje na data uložená v těchto datových uzlech

Replikace dat:

Sekvence bloků zde tvoří soubor s výchozí velikostí bloků 128 MB
Všechny bloky v souboru kromě finále mají podobnou velikost.
Z každého datového uzlu v klastru obdrží prvek namenode tep
BlockReport obsahuje všechny bloky v Datanode.
obsahuje obrovskou sadu adresářů a souborů, které jsou uloženy v hierarchickém formátu.
Zevnitř je soubor roztržen do menších bloků a tyto bloky jsou uloženy v sadě Datanodes.
Namenode a Datanode jsou část softwaru určeného ke spuštění na strojích produktů, které klasicky běží na operačním systému GNU / Linux.

Sledování úloh: JobTracker debatuje s NameNode a uzavírá pozici dat. Vyhledejte také nejlepší uzly TaskTracker pro provádění úkolů na základě datové lokality

Sledovač úloh: TaskTracker je uzel v klastru, který přijímá úkoly - operace Map, Reduce a Shuffle - z JobTracker.

Uzel sekundárního názvu (nebo) kontrolní bod: Získává EditLog z uzlu jména v pravidelných intervalech a aplikuje se na jeho obraz FS. A během jeho restartování zkopíruje zpět hotový obraz FS do uzlu s názvem. Celým účelem uzlu sekundárního jména je mít kontrolní bod v HDFS.

YARN:

YARN má komponentu centrálního správce zdrojů, která řídí zdroje a přiřazuje zdroje každé aplikaci.
Zde je Správce prostředků master, který rozhoduje o prostředcích spojených s klastrem, správce prostředků je stočený ze dvou komponent, správce aplikací a plánovač, které tyto dvě komponenty společně spravují úlohy v klastrových systémech. další komponenta volá Správce uzlů (NM), který je zodpovědný za správu úloh uživatelů a pracovního postupu v daném uzlu.
Přesnou replikaci dat v aktivním namenodu provádí Standby NameNode. Funguje jako otrok, udržuje dostatek stavu, aby zajistil rychlé převzetí služeb při selhání, pokud je to nezbytné.

Základní příkazy HDFS:

Základní příkazy HDFS
Sr.Ne	Vlastnost příkazu HDFS	Příkaz HDFS
1	Tisk verze hadoopu	$ hadoop verze
2	Vypište obsah kořenového adresáře v systému HDFS	$ hadoop fs -ls
3	Reportujte množství využitého a dostupného místa v aktuálně připojeném souborovém systému	$ hadoop fs -df hdfs: /
4	Vyvažovač HDFS znovu vyrovnává data napříč datovými uzly, přesouvá bloky z příliš využívaných do nedostatečně využívaných uzlů.	$ hadoop balancer
5	Příkaz nápovědy	$ hadoop fs -help

Intermediate HDFS příkazy:

Zprostředkující příkazy HDFS
Sr.Ne	Vlastnost příkazu HDFS	Příkaz HDFS
6	vytvoří adresář v zadaném umístění HDFS	$ hadoop fs -mkdir / user / cloudera /
7	Zkopíruje data z jednoho místa na druhé	$ hadoop fs -put data / sample.txt / user / training / hadoop
8	Podívejte se na prostor, který zabírá konkrétní adresář v HDFS	$ hadoop fs -du -s -h / uživatel / cloudera /
9	Odstraňte adresář v Hadoopu	$ hadoop fs -rm -r / user / cloudera / pigjobs /
10	Odstraní všechny soubory v daném adresáři	$ hadoop fs -rm -skipTrash hadoop / maloobchod / *
11	Vyprázdnění koše	$ hadoop fs -expunge
12	kopíruje data z a na místní do HDFS	$ hadoop fs -copyFromLocal / home / cloudera / sample / / user / cloudera / flume / $ hadoop fs -copyToLocal / user / cloudera / pigjobs / * / home / cloudera / oozie /

Pokročilé příkazy HDFS:

Zprostředkující příkazy HDFS
Sr.Ne	Vlastnost příkazu HDFS	Příkaz HDFS
13	změnit oprávnění souboru	$ sudo -u hdfs hadoop fs -chmod 777 / user / cloudera / flume /
14	nastavit faktor replikace dat pro soubor	$ hadoop fs -setrep -w 5 / user / cloudera / pigjobs /
15	Spočítejte počet adresářů, souborů a bytů v hdfs	$ hadoop fs -count hdfs: /
16	aby namenode existoval v bezpečném režimu	$ sudo -u hdfs hdfs dfsadmin -safemode dovolenou
17	Hadoop naformátuje namenode	$ hadoop namenode -format

HDFS Tipy a triky:

1) Můžeme dosáhnout rychlejší obnovy, když je počet uzlů clusteru vyšší.

2) Zvýšení úložiště za jednotku času zvyšuje dobu zotavení.

3) Namenode hardware musí být velmi spolehlivý.

4) Sofistikované monitorování lze dosáhnout pomocí ambari.

5) Hladování systému lze snížit zvýšením počtu reduktorů.

Doporučené články

Toto byl průvodce příkazy HDFS. Zde jsme diskutovali HDFS příkazy, funkce, základní, střední a pokročilé příkazy s obrázkovou reprezentací, tipy a triky o příkazech. Další informace naleznete také v dalších navrhovaných článcích -

Příkazy uzlu
Příkazy Matlab
Výhody DBMS
Hadoop Ekosystém
Hadoop fs Příkazy

Příkaz HDFS - Základní pro pokročilé příkazy s tipy a triky

Obsah:

Úvod do příkazů HDFS

Vlastnosti HDFS:

Namenode:

Datanode:

Replikace dat:

YARN:

Základní příkazy HDFS:

Intermediate HDFS příkazy:

Pokročilé příkazy HDFS:

HDFS Tipy a triky:

Doporučené články

Znát 8 užitečných srovnání mezi úlem a HBase

Příklad horizontální integrace Top 4 Příklady horizontální integrace

Vzorec návratnosti doby držení Kalkulačka (Excel Excel)

Horizontální integrace Vs Vertikální integrace 5 nejlepších rozdílů, které byste se měli naučit

Jak funguje umělá inteligence? - Základní komponenty a příklady

Příklad úspor z rozsahu Nejlepší 4 příklad úspor z rozsahu

9 účinných strategií vedení, které povedou vaši správu (dovednosti)

6 účinných tipů pro rozhovor pro tazatele (odborné rady)

Věděli jste, že 10 dovedností pro efektivní poslech? (Ochotný)

Příklad ekonomie - Top 4 Příklady ekonomie

Funkce IPMT (vzorec, příklady) Jak používat IPMT v Excelu?

IRA vs 401 (k) - Top 8 nejlepších rozdílů (s infografiky)

Je Blockchain bezpečný - Jak bezpečná je technologie Blockchain

Je blockchain budoucností Budoucnost blockchainu a jeho dopad

Je CSS citlivé na velikost písmen Znát vlastnosti a výhody CSS