Jak nainstalovat Apache

Před vstupem do toho, jak nainstalovat část Apache, bychom nejprve měli obecný přehled o Apache a jak se používá ve vědě o datech.

Co je Apache?

Apache Web Server je HTTP server, který návštěvníkům přicházejícím na váš server představuje webové stránky. Pokud tedy chcete nasadit web pro firmu nebo vaši organizaci, pravděpodobně byste na to použili Apache.

Existují i ​​jiné HTTP servery, jako je IIS, ale Apache je standard, který většina lidí používá, ať už jsou na Linuxu, Windows nebo Mac. Apache je výchozí nastavení, ke kterému většina lidí chodí, protože je dobře známo, je velmi spolehlivé a je zdarma.

Jedinou věcí, kterou si musíte uvědomit u Apache, je to, že je to HTTP server, takže pokud to nainstalujete na Linux nebo Windows nebo Mac, vše, co vám umožní, je představit návštěvníkům přicházejícím na váš server statické webové stránky. Pokud tedy kódujete web HTML bez dalších programovacích jazyků jiných než JavaScript, můžete jej použít pouze se serverem Apache. Můžete připojit všechny své značky k serveru Apache a prezentovat je svým návštěvníkům.

Jak Apache použil v Data Science?

Data Science je nejžádanější studijní obor v moderním světě. Datový vědec je považován za nejsmyslnější práci v 21. století, kdy se profesionálové z různých oborů chtějí učit a stát se datovým vědcem. Apache hraje klíčovou roli v každém nadšenci pro vědu o údajích, protože potřebuje dostatečné znalosti o ekosystému Apache Hadoop.

Ekosystém Apache Hadoop

První věc je, že ekosystém Hadoop není jedním nástrojem. Není to programovací jazyk ani jednotný rámec. Je to skupina nástrojů, které různé společnosti používají v různých doménách pro více úkolů. Každý nástroj projdeme jeden po druhém níže: -

  • Apache HDFS (Hadoop Distributed File System) je paměťová jednotka Hadoop, která může ukládat strukturovaná, polostrukturovaná a nestrukturovaná data. HDFS má metadata, která udržuje soubor protokolu o uložených datech. Má dvě komponenty - NameNode a DataNode.
  • Apache Yarn je vyjednávač zdrojů, který provádí všechny činnosti zpracování, jako jsou plánování úkolů, přidělování zdrojů atd. Má dvě služby - první je správce zdrojů, který naplánuje aplikace běžící na vrcholu příze. Druhým je správce uzlů, který sleduje využití zdrojů .
  • Apache Map Reduce je součást zpracování dat společnosti Hadoop, která zpracovává velké soubory dat pomocí distribuovaných a paralelních výpočtů založených na funkcích Map, Sort and Shuffle a Reduce. Mapová funkce filtruje data, potom se provádí třídění a míchání a na konci Redukce funkce agreguje a shrnuje výsledek.
  • Prase Apache se používá většinou v ETL. Má dvě části - prasečí latinu a prasečí běh. Pig Latin je jazyk používaný pro zpracování dat pomocí dotazu, zatímco Pig runtime je prostředí provádění. Jeden řádek prasečí latiny se téměř rovná 100 řádkům kódu Map Reduce. Proces zahrnuje nejprve načtení dat a poté jejich seskupení, třídění, filtrování a uložení do HDFS.
  • Apache Hive používá dotaz podobný SQL pro analýzu dat v distribuovaném prostředí. Má dvě komponenty - příkazový řádek Hive a server JDBC / ODBC a použitý jazyk se nazývá HiveQL.
  • Apache Mahout je knihovna strojového učení napsaná v Javě a používá se k vytváření aplikací strojového učení, jako je shlukování, klasifikace nebo regrese. Má různé algoritmy zabudované pro různé případy použití.
  • Apache HBase je databáze NoSQL napsaná v Javě, která běží přes Hadoop. Je postaven na BigTable společnosti Google a je schopen zpracovat všechny typy dat.
  • Apache Sqoop je nástroj pro příjem dat, který se používá pro hromadný strukturovaný přenos dat mezi RDBMS a Hadoop.
  • Apache Flume je další nástroj pro příjem dat, který se používá pro polostrukturovaný a nestrukturovaný přenos dat mezi Hadoopem a jinými zdroji dat.
  • ZooKeeper je koordinátor, který zajišťuje koordinaci mezi různými nástroji v ekosystému Hadoop.
  • Apache Ambari je Cluster Manager, který zajišťuje, řídí klastry Hadoop a také sleduje jejich zdravotní stav a stav.
  • Apache Tez je nový nástroj v ekosystému Hadoop, který urychluje zpracování dotazů Hadoop.
  • Apache Presto je open source distribuovaný SQL dotazovací stroj, který umožňuje cross-platformové dotazovací schopnosti.
  • Apache HCatalog je systém správy metadat a tabulek pro Hadoop, který umožňuje interoperabilitu napříč nástroji pro zpracování dat. Pomáhá také uživatelům vybrat nejlepší nástroje pro jejich prostředí.
  • Apache Spark je nejrozšířenější a nejoblíbenější platformou mezi Data Scientist. Jedná se o vysokorychlostní klastrový výpočetní systém, který optimalizuje využití zdrojů v případě mnoha iteračních úkolů. Poskytuje flexibilitu jak pro dávkové zpracování, tak pro analýzu dat v reálném čase.

Níže jsou uvedeny kroky k instalaci Apache

Zatím jsme se dozvěděli o Apache a o tom, jak je užitečné pro každého, kdo se chce naučit Data Science nebo Big Data Analytics. Nyní provedeme ponoření a instalaci apache na Windows na základě níže uvedených kroků.

  • Přejděte na https://httpd.apache.org/ a klikněte na odkaz Stáhnout v sekci Apache httpd 2.4.38 Vydáno.

  • Zobrazí se následující stránka a poté klepněte na Soubory pro Microsoft Windows.

  • Klikněte na Apache Lounge.

  • Podle operačního systému Windows si můžete stáhnout 32bitový nebo 64bitový soubor zip. Zde si stáhneme 64bitovou verzi. Klepnutím na příslušný odkaz ZIP otevřete soubor.

  • Nyní to vyžaduje C ++ redistribuovatelné Visual Studio 2017. Budeme jej stahovat z odpovídajícího 32bitového nebo 64bitového odkazu

  • Po stažení obou souborů přejdeme stažené umístění a nejprve nainstalujeme redistribuovatelné Visual Studio 2017 C ++. Poklepejte na soubor .exe.

  • Zaškrtněte „Souhlasím“ a klikněte na Instalovat.

  • Probíhá instalace Apache.

  • Jakmile je kompletní, dostanete zprávu, jako je tato. Dokončete instalaci klepnutím na Zavřít.

  • Nyní přejděte do složky, kde si stáhnete zip soubor Apache. Klikněte na něj pravým tlačítkem a vyberte výpis.

  • Nyní budeme mít vytvořenou složku Apache24. Zkopírujte tuto složku na jednotku C a poté přidáme cestu k systémovým proměnným prostředí.

Přejděte na Vlastnosti systému -> karta Upřesnit -> Klikněte na tlačítko Proměnné prostředí níže.

  • V proměnných najděte cestu a klikněte na Upravit.

  • Klikněte na Procházet -> Přejít do složky Apache24 na jednotce C -> Vybrat složku s binem -> Klikněte na OK.

  • Nainstalujeme Apache jako službu Windows. Spusťte příkazový řádek jako správce. Zadejte httpd –k install a stiskněte enter.

  • Prověříme instalační službu Apache. Klikněte na ikonu Windows a napište služby. Klikněte na aplikaci Services a najděte službu s názvem Apache24.

  • Chcete-li spustit server Apache, klepněte na něj pravým tlačítkem myši a klepněte na tlačítko Spustit. Stav se změní na „Běh“.

  • Můžeme otestovat pomocí prohlížeče. Otevřete prohlížeč a přejděte na http: // localhost a stiskněte Enter. Zpráva s hlášením „Funguje to!“ se objeví, aby se potvrdila úspěšná instalace Apache.

Doporučené články

Toto byl průvodce, jak nainstalovat Apache. Zde jsme probrali pokyny a různé kroky k instalaci Apache. Další informace naleznete také v následujícím článku -

  1. Apache Interview Otázky
  2. Apache Spark vs Apache Flink
  3. Apache Hadoop vs Apache Spark
  4. Apache Kafka vs Flume
  5. Kafka vs Kinesis | Nejlepší rozdíly

Kategorie: