Was ist Urllib?
urllib ist ein Python-Modul, das zum Öffnen von URLs verwendet werden kann. Es definiert Funktionen und Klassen, die bei URL-Aktionen helfen.
Mit Python können Sie auch auf Daten wie XML, HTML, JSON usw. zugreifen und diese aus dem Internet abrufen. Sie können Python auch verwenden, um direkt mit diesen Daten zu arbeiten. In diesem Tutorial werden wir sehen, wie wir Daten aus dem Web abrufen können. Hier haben wir beispielsweise eine guru99-Video-URL verwendet, und wir werden mit Python auf diese Video-URL zugreifen sowie eine HTML-Datei dieser URL drucken.
In diesem Tutorial werden wir lernen
- So öffnen Sie eine URL mit Urllib
- So lesen Sie eine HTML-Datei für Ihre URL in Python
So öffnen Sie eine URL mit Urllib
Bevor wir den Code ausführen, um eine Verbindung zu Internetdaten herzustellen, müssen wir die Anweisung für das URL-Bibliotheksmodul oder "urllib" importieren.
- Urllib importieren
- Definieren Sie Ihre Hauptfunktion
- Deklarieren Sie die Variable webUrl
- Rufen Sie dann die Funktion urlopen in der URL lib-Bibliothek auf
- Die URL, die wir öffnen, ist das Guru99-Tutorial auf Youtube
- Als nächstes drucken wir den Ergebniscode
- Der Ergebniscode wird durch Aufrufen der Funktion getcode für die von uns erstellte Variable webUrl abgerufen
- Wir werden das in eine Zeichenfolge konvertieren, damit es mit unserer Zeichenfolge "Ergebniscode" verkettet werden kann.
- Dies ist ein regulärer HTTP-Code "200", der angibt, dass die http-Anforderung erfolgreich verarbeitet wurde
So erhalten Sie die URL der HTML-Dateiform in Python
Sie können die HTML-Datei auch mithilfe der "Lesefunktion" in Python lesen. Wenn Sie den Code ausführen, wird die HTML-Datei in der Konsole angezeigt.
- Rufen Sie die Lesefunktion für die Variable webURL auf
- Lesevariable ermöglicht das Lesen des Inhalts von Datendateien
- Lesen Sie den gesamten Inhalt der URL in eine Variable namens data
- Führen Sie den Code aus. Die Daten werden im HTML-Format gedruckt
Hier ist der vollständige Code
Python 2 Beispiel
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Python 3 Beispiel
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)