Jak nainstalovat NLTK?

Následující článek Install NLTK poskytuje přehled pro instalaci NLTK. NLTK je sada knihoven pro zpracování přirozeného jazyka. Je to platforma pro vytváření Pythonových programů pro zpracování přirozeného jazyka. NLTK je psán v programovacím jazyce Python. Byl vyvinut Steven Bird a Edward Loper. Podporuje výzkum a výuku v NLP nebo v úzce souvisejících oblastech, včetně kognitivní vědy, empirické lingvistiky, získávání informací, umělé inteligence a strojového učení. NLTK poskytuje snadno použitelné rozhraní.

NLTK (Natural Language Toolkit)

  • Zpracování přirozeného jazyka (NLP) je součástí umělé inteligence, která zpracovává jazyk používaný lidmi. Pomáhá tak lidem komunikovat s počítači, i když nemají znalosti o tom, jak je používat. Pomocí NLP musí člověk diktovat příkaz počítačům. Díky schopnosti strojového učení je zpracování přirozeného jazyka stále populárnější a snadněji implementovatelné. V zásadě jde o techniku ​​interakce s lidmi a provádění hlasových příkazů.
  • To umožňuje zařízení používat i nováček, který nemá žádné znalosti technologie. Implementace zpracování přirozeného jazyka však není snadná, protože jazyk, kterým lidé mluví, nemá žádnou jednoznačnou strukturu. Je nejednoznačné a závisí na kontextu slov, která mohou mít odlišný význam.
  • NLTK má více než 50 korpusů a lexikálních zdrojů, jako je WordNet, Problem Report Corpus, Penn Treebank Corpus, atd. Dodává se také s průvodcem, který vysvětluje koncepty zpracování jazyka pomocí nástrojů a programovacích základů Pythonu, které usnadňují lidem kteří nemají hluboké znalosti programování. Má širokou škálu balíčků, díky kterým je jednou z výkonných sad nástrojů pro NLP. Tokenizace, Lemmatizace, Stemming, Parsování, Počet znaků, Interpunkce, Počet slov jsou některé z těchto balíčků.

Nainstalujte NLTK pro Windows

Níže jsou uvedeny pokyny k instalaci NLTK ve Windows. Jsou založeny na předpokladu, že Python není v systému nainstalován. NLTK vyžaduje Python verze 2.7.3.5 a vyšší.

Krok 1: Stáhněte si nejnovější verzi Pythonu pro Windows z odkazu níže

https://www.python.org/downloads/

Krok 2: Klikněte na stažený .exe a spusťte jej.

Krok 3: Vyberte možnost přizpůsobit instalaci.

Krok 4: Zkontrolujte všechny funkce, zvláště „pip“, protože pomáhá instalovat NLTK a klikněte na Next.

Krok 5: Na další obrazovce vyberte pokročilé možnosti, vyberte cestu a klikněte na instalaci.

Krok 6: Po úspěšné instalaci v blízkosti okna.

Krok 7: Zkopírujte cestu ke složce Scripts a nainstalujte NLTK do stejné složky.

NLTK lze snadno nainstalovat pomocí instalačního programu „pip“. Musíme také nainstalovat „numpy“.

Krok 8: Chcete-li nainstalovat NLTK, otevřete příkazový řádek a zadejte příkaz níže.

Ujistěte se, že instalace proběhla úspěšně.

Po úspěšné instalaci nyní je čas použít NLTK pro zpracování přirozeného jazyka.

Krok 9: Otevřete Python Shell a napište příkaz níže.

Pokud je importován bez chyby, znamená to, že NLTK je správně nainstalována.

Nainstalujte NLTK pro Mac / Linux

Na rozdíl od Windows, Linux systémy přicházejí s nainstalovaným Pythonem. K instalaci NLTK v Linuxu / Mac se používá instalační program Python's Pip. Chcete-li nainstalovat nebo aktualizovat pip, zadejte do příkazového řádku následující příkazy.

Chcete-li nainstalovat python v Linuxu, použijte následující příkazy.

Krok 1: Chcete-li aktualizovat index balíčku, použijte níže uvedený příkaz.

Krok 2: Pro instalaci Pythonu v systému Linux použijte níže.

Krok 3: Chcete-li nainstalovat „pip“ pro Python 3, zadejte níže uvedený příkaz.

Krok 4: Po instalaci „Pip“ úspěšně nainstalujte NLTK pomocí následujících příkazů.

Datový soubor NLTK

NLTK má k dispozici mnoho datových sad pro zpracování přirozeného jazyka, například WordNet, WikiCorpus, Gutenberg, Lexikón názorů, Tweebank atd. Tyto datové sady se nazývají korpusy. Datová sada NLTK v podstatě obsahuje sadu souborů nebo dokumentů. Každý soubor / dokument obsahuje soubor slov, písmen nebo textu v jednom jazyce. Korpus je tedy hlavně knihovnou pro porozumění / učení se jazyku. Má pravidla gramatiky a struktury jazyka.

Po úspěšné instalaci NLTK jej můžete importovat a také stáhnout jeho korpusy pomocí následujícího příkazu.

NLTK downloader otevře okno pro stažení datových sad. Velikost datového souboru je velká, proto to bude nějakou dobu trvat. Chcete-li otestovat, zda jsou datové sady nainstalovány správně, zkuste importovat datovou sadu a použít ji.

Zpracování NLTK

Existuje 5 hlavních procesů zpracování přirozeného jazyka. Toto jsou kroky související se zpracováním jakéhokoli textu.

  1. Detekce EOS : Detekce konce řeči rozdělí text do sbírky smysluplných vět. Rozděluje dlouhý text na části, které mají nějaký význam.
  2. Tokenizace : Tento krok rozdělí věty na žetony. Žetony neobsahují pouze slova, ale zahrnují také mezery, větné zlomy.
  3. Značení POS : POS znamená pat-of-speech. Zde jsou k tokenu přiřazeny informace. Tato informace naznačuje, jaký typ projevu je napjatý, sloveso, přídavné jméno, podstatné jméno atd.
  4. Chunking : Chunking znamená shromažďování textu na základě značek.
  5. Extrakce: Extrakce je probíhající proces procházení bloků a jejich označení jako pojmenovaných entit, jako jsou lidé, místa, organizace atd.

Závěr:

NLTK se používá pro klasifikaci textu, titulky obrázků, rozpoznávání řeči, odpovídání na otázky, jazykové modelování, shrnutí dokumentů a mnoho dalších operací. Existuje mnoho dalších nástrojů pro zpracování přirozeného jazyka. NLTK má ale širokou škálu knihoven, což z něj dělá jeden z výkonných nástrojů pro zpracování přirozeného jazyka. Je přesnější než jakýkoli jiný nástroj, ale kvůli velkému počtu knihoven je to trochu pomalé. Takže vše záleží na požadavcích uživatele. Pokud chce uživatel rychlost, může dávat přednost i jiným nástrojům, ale pak bude muset kompromitovat přesnost obsahu. Pokud je však přesnost prioritou, měli by rozhodně jít za NLTK.

Doporučené články:

Toto byl průvodce instalací NLTK. Zde diskutujeme základní koncept a různé kroky k instalaci NLTK na Windows a Linux \ Mac. Další informace naleznete také v následujících článcích

  1. Nainstalujte řídicí panel Kubernetes
  2. Jak nainstalovat JDK
  3. Nainstalujte Docker
  4. Jak nainstalovat Magento?
  5. Verze Magento | Vlastnosti verze Magento

Kategorie: