Herunterladen & Installieren Sie NLTK unter Windows / Mac

Inhaltsverzeichnis:

Anonim

In diesem Tutorial lernen Sie -

  • NLTK unter Windows installieren
  • Python unter Windows installieren
  • Installieren von NLTK unter Mac / Linux
  • NLTK über Anaconda installieren
  • NLTK-Datensatz
  • So laden Sie alle NLTK-Pakete herunter
  • Ausführen des NLP-Skripts
  • So führen Sie das NLTK-Skript aus

NLTK unter Windows installieren

In diesem Teil erfahren Sie, wie Sie NLTK über das Terminal einrichten (Eingabeaufforderung in Windows).

Die folgenden Anweisungen basieren auf der Annahme, dass Sie Python nicht installiert haben. Der erste Schritt ist also die Installation von Python.

Python unter Windows installieren:

Schritt 1) Gehen Sie zu verknüpfen https://www.python.org/downloads/ , und wählen Sie die neueste Version für Windows.

Hinweis : Wenn Sie nicht die neueste Version herunterladen möchten, können Sie die Registerkarte "Download" aufrufen und alle Versionen anzeigen.

Schritt 2) Klicken Sie auf die heruntergeladene Datei

Schritt 3) Wählen Sie Installation anpassen

Schritt 4) Klicken Sie auf WEITER

Schritt 5) Im nächsten Bildschirm

  1. Wählen Sie die erweiterten Optionen
  2. Geben Sie einen benutzerdefinierten Installationsort an. In meinem Fall wird ein Ordner auf Laufwerk C ausgewählt, um die Bedienung zu vereinfachen
  3. Klicken Sie auf Installieren

Schritt 6) Klicken Sie nach Abschluss der Installation auf die Schaltfläche Schließen.

Schritt 7) Kopieren Sie den Pfad Ihres Skriptordners.

Schritt 8) In der Windows-Eingabeaufforderung

  • Navigieren Sie zum Speicherort des Pip-Ordners
  • Geben Sie den Befehl ein, um NLTK zu installieren
    pip3 install nltk
  • Die Installation sollte erfolgreich durchgeführt werden

HINWEIS : Für Python2 die commandpip2 verwenden installieren nltk

Schritt 9) Suchen und öffnen Sie im Windows-Startmenü PythonShell

Schritt 10) Sie können überprüfen, ob die Installation korrekt ist, indem Sie den folgenden Befehl eingeben

import nltk

Wenn Sie keinen Fehler sehen, ist die Installation abgeschlossen.

Installieren von NLTK unter Mac / Linux

Für die Installation von NLTK unter Mac / Unix ist Python Package Manager Pip erforderlich, um nltk zu installieren. Wenn pip nicht installiert ist, befolgen Sie bitte die folgenden Anweisungen, um den Vorgang abzuschließen

Schritt 1) Aktualisieren Sie den Paketindex, indem Sie den folgenden Befehl eingeben

sudo apt update

Schritt 2) Installieren von pip für Python 3:

sudo apt install python3-pip

Sie können pip auch mit easy_install installieren.

sudo apt-get install python-setuptools python-dev build-essential 

Jetzt ist easy_install installiert. Führen Sie den folgenden Befehl aus, um pip zu installieren

sudo easy_install pip

Schritt 3) Verwenden Sie den folgenden Befehl, um NLTK zu installieren

sudo pip install -U nltksudo pip3 install -U nltk

NLTK über Anaconda installieren

Schritt 1) Bitte installieren Sie anaconda (mit dem auch verschiedene Pakete installiert werden können) unter https://www.anaconda.com/products/individual und wählen Sie aus, welche Python-Version Sie für anaconda installieren möchten.

Hinweis: In diesem Tutorial finden Sie detaillierte Schritte zur Installation von anaconda

Schritt 2) In der Anaconda-Eingabeaufforderung

  1. Befehl eingeben
    conda install -c anaconda nltk
  2. Überprüfen Sie das Paket-Upgrade, Downgrade, installieren Sie Informationen und geben Sie yes ein
  3. NLTK wird heruntergeladen und installiert

NLTK-Datensatz

Das NLTK-Modul verfügt über viele Datensätze, die Sie herunterladen müssen, um sie verwenden zu können. Technisch heißt es Korpus . Einige der Beispiele sind Stoppwörter , Gutenberg , framenet_v15 , large_grammars und so weiter.

So laden Sie alle NLTK-Pakete herunter

Schritt 1) Führen Sie den Python-Interpreter unter Windows oder Linux aus

Schritt 2)

  1. Geben Sie die Befehle ein
import nltknltk.download ()
  1. NLTK Downloaded Window wird geöffnet. Klicken Sie auf die Schaltfläche Herunterladen, um den Datensatz herunterzuladen. Dieser Vorgang dauert abhängig von Ihrer Internetverbindung einige Zeit

HINWEIS: Sie können den Download-Speicherort ändern, indem Sie auf Datei> Download-Verzeichnis ändern klicken

Schritt 3) Um die installierten Daten zu testen, verwenden Sie den folgenden Code

>>> from nltk.corpus import brown>>>brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'sagte',…]

Ausführen des NLP-Skripts

Wir werden diskutieren, wie das NLP-Skript auf unserem lokalen PC ausgeführt wird. Es gibt viele Bibliotheken für die Verarbeitung natürlicher Sprache auf dem Markt. Die Auswahl einer Bibliothek hängt also von Ihren Anforderungen ab. Hier ist die Liste der NLP-Bibliotheken.

So führen Sie das NLTK-Skript aus

Schritt 1) ​​Kopieren Sie in Ihrem bevorzugten Code-Editor den Code und speichern Sie die Datei als " NLTKsample.py ".

from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)

Code Erläuterung:

  1. In diesem Programm bestand das Ziel darin, alle Arten von Interpunktionen aus dem angegebenen Text zu entfernen. Wir haben "RegexpTokenizer" importiert, ein Modul von NLTK. Es entfernt alle Ausdrücke, Symbole, Zeichen, Zahlen oder andere Dinge, was immer Sie wollen.
  2. Sie haben gerade den regulären Ausdruck an das Modul "RegexpTokenizer" übergeben.
  3. Außerdem haben wir das Wort mit dem Modul "Tokenize" tokenisiert. Die Ausgabe wird in der Variablen "filterdText" gespeichert.
  4. Und druckte sie mit "print ()".

Schritt 2) In der Eingabeaufforderung

  • Navigieren Sie zu dem Speicherort, an dem Sie die Datei gespeichert haben
  • Führen Sie den Befehl Python NLTKsample.py aus

Dies zeigt die Ausgabe als:

['Hallo', 'Guru99', 'Du', 'Hast', 'Build', 'A', 'Sehr', 'Gut', 'Site', 'und', 'Ich', 'Liebe', ' Besuchen Sie ',' Ihre ',' Site ']