Hive Erstellen, Ändern & Drop-Tabelle

Inhaltsverzeichnis:

Anonim

In diesem Lernprogramm können Tabellenoperationen wie das Erstellen, Ändern und Löschen von Tabellen in Hive beobachtet werden.

Im folgenden Screenshot erstellen wir eine Tabelle mit Spalten und ändern den Tabellennamen.

1. Erstellen der Tabelle guru_sample mit zwei Spaltennamen wie "empid" und "empname"

2. Anzeigen von Tabellen in der Guru99-Datenbank

3. Guru_sample wird unter Tabellen angezeigt

4. Ändern der Tabelle "guru_sample" als "guru_sampleNew"

5. Wenn Sie den Befehl "show" erneut ausführen, wird der neue Name Guru_sampleNew angezeigt

Dropping table guru_sampleNew:

Tabellentypen und ihre Verwendung:

Das Kommen zu Tabellen ist genau so, wie wir es in traditionellen relationalen Datenbanken erstellen. Die Funktionen wie Filtern, Verknüpfungen können für die Tabellen ausgeführt werden.

Hive behandelt zwei Arten von Tabellenstrukturen wie interne und externe Tabellen, abhängig vom Laden und Entwerfen des Schemas in Hive.

Interne Tabellen

  • Die interne Tabelle ist eng miteinander verbunden. Bei dieser Art von Tabelle müssen wir zuerst eine Tabelle erstellen und die Daten laden.
  • Wir können dies als Daten im Schema bezeichnen .
  • Durch Löschen dieser Tabelle werden sowohl Daten als auch Schema entfernt.
  • Der gespeicherte Speicherort dieser Tabelle befindet sich in / user / hive / warehouse.

Wann Sie die interne Tabelle auswählen sollten:

  • Wenn die Verarbeitungsdaten im lokalen Dateisystem verfügbar sind
  • Wenn wir möchten, dass Hive den gesamten Lebenszyklus von Daten einschließlich des Löschens verwaltet

Beispielcode-Snippet für interne Tabelle

1. So erstellen Sie die interne Tabelle

 Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';

2. Laden Sie die Daten in die interne Tabelle

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;

3. Zeigen Sie den Inhalt der Tabelle an

 Hive>select * from guruhive_internaltable;

4. Löschen der internen Tabelle

 Hive>DROP TABLE guruhive_internaltable;

Wenn Sie die Datei guruhive_internaltable einschließlich ihrer Metadaten und Daten gelöscht haben, werden sie aus Hive gelöscht.

Aus dem folgenden Screenshot können wir die Ausgabe beobachten

Im obigen Code und aus dem Screenshot machen wir folgende Dinge:

  • Erstellen Sie die interne Tabelle
  • Laden Sie die Daten in die interne Tabelle
  • Zeigen Sie den Inhalt der Tabelle an
  • So löschen Sie die interne Tabelle

Externe Tabellen

  • Der externe Tisch ist von Natur aus lose gekoppelt. Daten werden in HDFS verfügbar sein. Die Tabelle wird für HDFS-Daten erstellt.
  • Auf andere Weise können wir sagen, wie es Schema für Daten erstellt .
  • Zum Zeitpunkt des Löschens der Tabelle wird nur das Schema gelöscht. Die Daten sind weiterhin wie zuvor in HDFS verfügbar.
  • Externe Tabellen bieten die Möglichkeit, mehrere Schemas für die in HDFS gespeicherten Daten zu erstellen, anstatt die Daten jedes Mal zu löschen, wenn das Schema aktualisiert wird

Wann Sie eine externe Tabelle auswählen sollten:

  • Wenn in HDFS verfügbare Daten verarbeitet werden
  • Nützlich, wenn die Dateien außerhalb von Hive verwendet werden

Beispielcode-Snippet für externe Tabelle

1. Erstellen Sie eine externe Tabelle

Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;

2. Wenn wir den Speicherort zum Zeitpunkt der Tabellenerstellung nicht angeben, können wir die Daten manuell laden

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;

3. Zeigen Sie den Inhalt der Tabelle an

 Hive>select * from guruhive_external;

4. Löschen der internen Tabelle

 Hive>DROP TABLE guruhive_external;

Aus dem folgenden Screenshot können wir die Ausgabe beobachten

Im obigen Code machen wir folgende Dinge

  • Erstellen Sie die externe Tabelle
  • Laden Sie die Daten in die externe Tabelle
  • Zeigen Sie den Inhalt der Tabelle an
  • Externe Tabelle löschen

Unterschied zwischen internen und externen Tabellen

Merkmal Intern Extern
Schema Daten zum Schema Schema für Daten
Lagerraum / usr / hive / warehouse HDFS-Standort
Datenverfügbarkeit Innerhalb des lokalen Dateisystems Innerhalb von HDFS