In diesem Tutorial lernen Sie -
- NLTK unter Windows installieren
- Python unter Windows installieren
- Installieren von NLTK unter Mac / Linux
- NLTK über Anaconda installieren
- NLTK-Datensatz
- So laden Sie alle NLTK-Pakete herunter
- Ausführen des NLP-Skripts
- So führen Sie das NLTK-Skript aus
NLTK unter Windows installieren
In diesem Teil erfahren Sie, wie Sie NLTK über das Terminal einrichten (Eingabeaufforderung in Windows).
Die folgenden Anweisungen basieren auf der Annahme, dass Sie Python nicht installiert haben. Der erste Schritt ist also die Installation von Python.
Python unter Windows installieren:
Schritt 1) Gehen Sie zu verknüpfen https://www.python.org/downloads/ , und wählen Sie die neueste Version für Windows.
Hinweis : Wenn Sie nicht die neueste Version herunterladen möchten, können Sie die Registerkarte "Download" aufrufen und alle Versionen anzeigen.
Schritt 2) Klicken Sie auf die heruntergeladene Datei
Schritt 3) Wählen Sie Installation anpassen
Schritt 4) Klicken Sie auf WEITER
Schritt 5) Im nächsten Bildschirm
- Wählen Sie die erweiterten Optionen
- Geben Sie einen benutzerdefinierten Installationsort an. In meinem Fall wird ein Ordner auf Laufwerk C ausgewählt, um die Bedienung zu vereinfachen
- Klicken Sie auf Installieren
Schritt 6) Klicken Sie nach Abschluss der Installation auf die Schaltfläche Schließen.
Schritt 7) Kopieren Sie den Pfad Ihres Skriptordners.
Schritt 8) In der Windows-Eingabeaufforderung
- Navigieren Sie zum Speicherort des Pip-Ordners
- Geben Sie den Befehl ein, um NLTK zu installieren
pip3 install nltk
- Die Installation sollte erfolgreich durchgeführt werden
HINWEIS : Für Python2 die commandpip2 verwenden installieren nltk
Schritt 9) Suchen und öffnen Sie im Windows-Startmenü PythonShell
Schritt 10) Sie können überprüfen, ob die Installation korrekt ist, indem Sie den folgenden Befehl eingeben
import nltk
Wenn Sie keinen Fehler sehen, ist die Installation abgeschlossen.
Installieren von NLTK unter Mac / Linux
Für die Installation von NLTK unter Mac / Unix ist Python Package Manager Pip erforderlich, um nltk zu installieren. Wenn pip nicht installiert ist, befolgen Sie bitte die folgenden Anweisungen, um den Vorgang abzuschließen
Schritt 1) Aktualisieren Sie den Paketindex, indem Sie den folgenden Befehl eingeben
sudo apt update
Schritt 2) Installieren von pip für Python 3:
sudo apt install python3-pip
Sie können pip auch mit easy_install installieren.
sudo apt-get install python-setuptools python-dev build-essential
Jetzt ist easy_install installiert. Führen Sie den folgenden Befehl aus, um pip zu installieren
sudo easy_install pip
Schritt 3) Verwenden Sie den folgenden Befehl, um NLTK zu installieren
sudo pip install -U nltksudo pip3 install -U nltk
NLTK über Anaconda installieren
Schritt 1) Bitte installieren Sie anaconda (mit dem auch verschiedene Pakete installiert werden können) unter https://www.anaconda.com/products/individual und wählen Sie aus, welche Python-Version Sie für anaconda installieren möchten.
Hinweis: In diesem Tutorial finden Sie detaillierte Schritte zur Installation von anaconda
Schritt 2) In der Anaconda-Eingabeaufforderung
- Befehl eingeben
conda install -c anaconda nltk
- Überprüfen Sie das Paket-Upgrade, Downgrade, installieren Sie Informationen und geben Sie yes ein
- NLTK wird heruntergeladen und installiert
NLTK-Datensatz
Das NLTK-Modul verfügt über viele Datensätze, die Sie herunterladen müssen, um sie verwenden zu können. Technisch heißt es Korpus . Einige der Beispiele sind Stoppwörter , Gutenberg , framenet_v15 , large_grammars und so weiter.
So laden Sie alle NLTK-Pakete herunter
Schritt 1) Führen Sie den Python-Interpreter unter Windows oder Linux aus
Schritt 2)
- Geben Sie die Befehle ein
import nltknltk.download ()
- NLTK Downloaded Window wird geöffnet. Klicken Sie auf die Schaltfläche Herunterladen, um den Datensatz herunterzuladen. Dieser Vorgang dauert abhängig von Ihrer Internetverbindung einige Zeit
HINWEIS: Sie können den Download-Speicherort ändern, indem Sie auf Datei> Download-Verzeichnis ändern klicken
Schritt 3) Um die installierten Daten zu testen, verwenden Sie den folgenden Code
>>> from nltk.corpus import brown>>>brown.words()
['The', 'Fulton', 'County', 'Grand', 'Jury', 'sagte',…]
Ausführen des NLP-Skripts
Wir werden diskutieren, wie das NLP-Skript auf unserem lokalen PC ausgeführt wird. Es gibt viele Bibliotheken für die Verarbeitung natürlicher Sprache auf dem Markt. Die Auswahl einer Bibliothek hängt also von Ihren Anforderungen ab. Hier ist die Liste der NLP-Bibliotheken.
So führen Sie das NLTK-Skript aus
Schritt 1) Kopieren Sie in Ihrem bevorzugten Code-Editor den Code und speichern Sie die Datei als " NLTKsample.py ".
from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)
Code Erläuterung:
- In diesem Programm bestand das Ziel darin, alle Arten von Interpunktionen aus dem angegebenen Text zu entfernen. Wir haben "RegexpTokenizer" importiert, ein Modul von NLTK. Es entfernt alle Ausdrücke, Symbole, Zeichen, Zahlen oder andere Dinge, was immer Sie wollen.
- Sie haben gerade den regulären Ausdruck an das Modul "RegexpTokenizer" übergeben.
- Außerdem haben wir das Wort mit dem Modul "Tokenize" tokenisiert. Die Ausgabe wird in der Variablen "filterdText" gespeichert.
- Und druckte sie mit "print ()".
Schritt 2) In der Eingabeaufforderung
- Navigieren Sie zu dem Speicherort, an dem Sie die Datei gespeichert haben
- Führen Sie den Befehl Python NLTKsample.py aus
Dies zeigt die Ausgabe als:
['Hallo', 'Guru99', 'Du', 'Hast', 'Build', 'A', 'Sehr', 'Gut', 'Site', 'und', 'Ich', 'Liebe', ' Besuchen Sie ',' Ihre ',' Site ']