Überwachtes und unbeaufsichtigtes Lernen: Hauptunterschiede

Inhaltsverzeichnis:

Anonim

Was ist überwachtes maschinelles Lernen?

Beim überwachten Lernen trainieren Sie die Maschine mit Daten, die gut "beschriftet " sind. Dies bedeutet, dass einige Daten bereits mit der richtigen Antwort versehen sind. Es kann mit dem Lernen verglichen werden, das in Anwesenheit eines Vorgesetzten oder eines Lehrers stattfindet.

Ein überwachter Lernalgorithmus lernt aus gekennzeichneten Trainingsdaten und hilft Ihnen, Ergebnisse für unvorhergesehene Daten vorherzusagen. Das erfolgreiche Erstellen, Skalieren und Bereitstellen eines genauen überwachten maschinellen Lernens Das Data Science-Modell erfordert Zeit und technisches Fachwissen von einem Team hochqualifizierter Datenwissenschaftler. Darüber hinaus muss Data Scientist Modelle neu erstellen, um sicherzustellen, dass die gegebenen Erkenntnisse wahr bleiben, bis sich die Daten ändern.

In diesem Tutorial lernen Sie

  • Was ist überwachtes maschinelles Lernen?
  • Was ist unbeaufsichtigtes Lernen?
  • Warum betreutes Lernen?
  • Warum unbeaufsichtigtes Lernen?
  • Wie funktioniert betreutes Lernen?
  • Wie funktioniert unbeaufsichtigtes Lernen?
  • Arten von überwachten Techniken des maschinellen Lernens
  • Arten von unbeaufsichtigten Techniken des maschinellen Lernens
  • Überwachtes vs. unbeaufsichtigtes Lernen

Was ist unbeaufsichtigtes Lernen?

Unbeaufsichtigtes Lernen ist eine maschinelle Lerntechnik, bei der Sie das Modell nicht überwachen müssen. Stattdessen müssen Sie zulassen, dass das Modell selbstständig arbeitet, um Informationen zu ermitteln. Es befasst sich hauptsächlich mit den unbeschrifteten Daten.

Mit unbeaufsichtigten Lernalgorithmen können Sie im Vergleich zum überwachten Lernen komplexere Verarbeitungsaufgaben ausführen. Unbeaufsichtigtes Lernen kann jedoch im Vergleich zu anderen Methoden des tiefen Lernens und der Stärkung des Lernens unvorhersehbarer sein.

Warum betreutes Lernen?

  • Durch überwachtes Lernen können Sie Daten sammeln oder eine Datenausgabe aus früheren Erfahrungen erstellen.
  • Hilft Ihnen, Leistungskriterien mithilfe von Erfahrung zu optimieren
  • Überwachtes maschinelles Lernen hilft Ihnen, verschiedene Arten von realen Rechenproblemen zu lösen.

Warum unbeaufsichtigtes Lernen?

Hier sind die Hauptgründe für die Verwendung von unbeaufsichtigtem Lernen:

  • Unüberwachtes maschinelles Lernen findet alle Arten von unbekannten Mustern in Daten.
  • Unüberwachte Methoden helfen Ihnen, Funktionen zu finden, die für die Kategorisierung hilfreich sein können.
  • Es findet in Echtzeit statt, sodass alle Eingabedaten in Anwesenheit der Lernenden analysiert und gekennzeichnet werden müssen.
  • Es ist einfacher, unbeschriftete Daten von einem Computer abzurufen als beschriftete Daten, für die manuelle Eingriffe erforderlich sind.

Wie funktioniert betreutes Lernen?

Sie möchten beispielsweise eine Maschine trainieren, um vorherzusagen, wie lange Sie brauchen, um von Ihrem Arbeitsplatz nach Hause zu fahren. Hier erstellen Sie zunächst einen Satz beschrifteter Daten. Diese Daten enthalten

  • Wetterverhältnisse
  • Tageszeit
  • Ferien

Alle diese Details sind Ihre Eingaben. Die Ausgabe ist die Zeit, die benötigt wurde, um an diesem bestimmten Tag nach Hause zu fahren.

Sie wissen instinktiv, dass Sie länger brauchen, um nach Hause zu fahren, wenn es draußen regnet. Die Maschine benötigt jedoch Daten und Statistiken.

Lassen Sie uns nun sehen, wie Sie ein überwachtes Lernmodell dieses Beispiels entwickeln können, mit dessen Hilfe der Benutzer die Pendelzeit bestimmen kann. Das erste, was Sie erstellen müssen, ist ein Trainingsdatensatz. Dieser Trainingssatz enthält die gesamte Pendelzeit und entsprechende Faktoren wie Wetter, Zeit usw. Basierend auf diesem Trainingssatz kann Ihr Gerät feststellen, dass ein direkter Zusammenhang zwischen der Regenmenge und der Zeit besteht, die Sie benötigen, um nach Hause zu kommen.

Es wird also festgestellt, dass je mehr es regnet, desto länger Sie fahren, um zu Ihrem Haus zurückzukehren. Möglicherweise wird auch der Zusammenhang zwischen der Zeit, in der Sie die Arbeit verlassen, und der Zeit, in der Sie unterwegs sind, angezeigt.

Je näher Sie 18 Uhr sind, desto länger dauert es, bis Sie nach Hause kommen. Ihr Computer findet möglicherweise einige der Beziehungen zu Ihren gekennzeichneten Daten.

Dies ist der Beginn Ihres Datenmodells. Es beginnt sich darauf auszuwirken, wie sich Regen auf die Art und Weise auswirkt, wie Menschen fahren. Es zeigt sich auch, dass zu einer bestimmten Tageszeit mehr Menschen reisen.

Wie funktioniert unbeaufsichtigtes Lernen?

Nehmen wir den Fall eines Babys und ihres Familienhundes.

Sie kennt und identifiziert diesen Hund. Einige Wochen später bringt ein Freund der Familie einen Hund mit und versucht, mit dem Baby zu spielen.

Baby hat diesen Hund nicht früher gesehen. Aber es erkennt, dass viele Merkmale (2 Ohren, Augen, Gehen auf 4 Beinen) wie ihr Hund sind. Sie identifiziert ein neues Tier wie einen Hund. Dies ist unbeaufsichtigtes Lernen, bei dem Sie nicht unterrichtet werden, sondern aus den Daten lernen (in diesem Fall Daten über einen Hund). Wäre dieses Lernen überwacht worden, hätte der Freund der Familie dem Baby gesagt, dass es sich um einen Hund handelt.

Arten von überwachten Techniken des maschinellen Lernens

Regression:

Die Regressionstechnik sagt einen einzelnen Ausgabewert unter Verwendung von Trainingsdaten voraus.

Beispiel: Sie können die Regression verwenden, um den Hauspreis anhand von Trainingsdaten vorherzusagen. Die Eingabevariablen sind Lokalität, Größe eines Hauses usw.

Einstufung:

Klassifizierung bedeutet, die Ausgabe innerhalb einer Klasse zu gruppieren. Wenn der Algorithmus versucht, Eingaben in zwei verschiedene Klassen einzuteilen, wird dies als binäre Klassifizierung bezeichnet. Die Auswahl zwischen mehr als zwei Klassen wird als Klassifizierung mehrerer Klassen bezeichnet.

Beispiel : Feststellen, ob jemand ein Schuldner des Kredits ist oder nicht.

Stärken : Ausgaben haben immer eine probabilistische Interpretation, und der Algorithmus kann reguliert werden, um eine Überanpassung zu vermeiden.

Schwächen : Die logistische Regression kann bei mehreren oder nichtlinearen Entscheidungsgrenzen eine Underperformance aufweisen. Diese Methode ist nicht flexibel und erfasst daher keine komplexeren Beziehungen.

Arten von unbeaufsichtigten Techniken des maschinellen Lernens

Unbeaufsichtigte Lernprobleme gruppierten sich weiter in Cluster- und Assoziationsprobleme.

Clustering

Clustering ist ein wichtiges Konzept für unbeaufsichtigtes Lernen. Es geht hauptsächlich darum, eine Struktur oder ein Muster in einer Sammlung nicht kategorisierter Daten zu finden. Clustering-Algorithmen verarbeiten Ihre Daten und finden natürliche Cluster (Gruppen), falls diese in den Daten vorhanden sind. Sie können auch ändern, wie viele Cluster Ihre Algorithmen identifizieren sollen. Hier können Sie die Granularität dieser Gruppen anpassen.

Verband

Mit Zuordnungsregeln können Sie Zuordnungen zwischen Datenobjekten in großen Datenbanken herstellen. Bei dieser unbeaufsichtigten Technik geht es darum, aufregende Beziehungen zwischen Variablen in großen Datenbanken zu entdecken. Zum Beispiel Menschen, die ein neues Zuhause kaufen, kaufen am ehesten neue Möbel.

Andere Beispiele:

  • Eine Untergruppe von Krebspatienten, gruppiert nach ihren Genexpressionsmessungen
  • Käufergruppen basierend auf ihrer Browser- und Kaufhistorie
  • Filmgruppe nach der Bewertung der Filmzuschauer

Überwachtes vs. unbeaufsichtigtes Lernen

Parameter Überwachte maschinelle Lerntechnik Unüberwachte Technik des maschinellen Lernens
Prozess In einem überwachten Lernmodell werden Eingabe- und Ausgabevariablen angegeben. Im unbeaufsichtigten Lernmodell werden nur Eingabedaten angegeben
Eingabedaten Algorithmen werden unter Verwendung von beschrifteten Daten trainiert. Algorithmen werden für Daten verwendet, die nicht beschriftet sind
Verwendete Algorithmen Unterstützung von Vektormaschinen, neuronalen Netzen, linearer und logistischer Regression, zufälligen Wäldern und Klassifizierungsbäumen. Unüberwachte Algorithmen können in verschiedene Kategorien unterteilt werden: wie Cluster-Algorithmen, K-Mittelwerte, hierarchisches Clustering usw.
Rechenkomplexität Betreutes Lernen ist eine einfachere Methode. Unbeaufsichtigtes Lernen ist rechenintensiv
Verwendung von Daten Das überwachte Lernmodell verwendet Trainingsdaten, um eine Verbindung zwischen der Eingabe und den Ausgaben zu lernen. Beim unbeaufsichtigten Lernen werden keine Ausgabedaten verwendet.
Genauigkeit der Ergebnisse Sehr genaue und vertrauenswürdige Methode. Weniger genaue und vertrauenswürdige Methode.
Echtzeit lernen Die Lernmethode findet offline statt. Die Lernmethode findet in Echtzeit statt.
Anzahl der Klassen Anzahl der Klassen ist bekannt. Anzahl der Klassen ist nicht bekannt.
Hauptnachteil Das Klassifizieren von Big Data kann eine echte Herausforderung beim überwachten Lernen sein. Sie können keine genauen Informationen zur Datensortierung erhalten, und die Ausgabe als Daten, die beim unbeaufsichtigten Lernen verwendet werden, ist gekennzeichnet und nicht bekannt.

Zusammenfassung

  • Beim überwachten Lernen trainieren Sie die Maschine mit Daten, die gut "beschriftet" sind.
  • Unbeaufsichtigtes Lernen ist eine maschinelle Lerntechnik, bei der Sie das Modell nicht überwachen müssen.
  • Durch überwachtes Lernen können Sie Daten sammeln oder eine Datenausgabe aus früheren Erfahrungen erstellen.
  • Unüberwachtes maschinelles Lernen hilft Ihnen, alle Arten von unbekannten Mustern in Daten zu finden.
  • Zum Beispiel können Sie die Zeit, die benötigt wird, um zurück zu kommen, basierend auf den Wetterbedingungen, Tageszeiten und Feiertagen bestimmen.
  • Zum Beispiel kann Baby andere Hunde anhand des in der Vergangenheit überwachten Lernens identifizieren.
  • Regression und Klassifikation sind zwei Arten von überwachten Techniken des maschinellen Lernens.
  • Clustering und Assoziation sind zwei Arten von unbeaufsichtigtem Lernen.
  • In einem überwachten Lernmodell werden Eingabe- und Ausgabevariablen angegeben, während bei einem unbeaufsichtigten Lernmodell nur Eingabedaten angegeben werden