HBase Tabelle mit Beispiel erstellen

Inhaltsverzeichnis:

Anonim

In HBase können wir Tabellenoperationen auf zwei Arten erstellen

  • Shell-Befehl
  • JAVA API

Wir werden lernen, beide zu verwenden, um Tabellen zu erstellen.

  • HBase Tabelle mit Java-API erstellen
  • HBase Tabelle mit Shell erstellen

HBase erstellt eine Tabelle mit Java API

In diesem Abschnitt werden einige der Vorgänge mit Java-Codierung über die Java-API ausgeführt.

Über die Java-API können wir Tabellen in HBase erstellen und Daten mithilfe der Java-Codierung in Tabellen laden.

  • Herstellen einer Verbindung mit HBase über die Java-API
  • Verwenden von Eclipse zum Codieren, Debuggen und Testen von Java

Herstellen einer Verbindung über die Java-API:

Die folgenden Schritte führen uns zur Entwicklung von Java-Code für die Verbindung von HBase über die Java-API.

Schritt 1) In diesem Schritt erstellen wir ein Java-Projekt in Eclipse für die HBase-Verbindung.

Erstellung des neuen Projektnamens "HbaseConnection" in Eclipse.

Für Java-bezogene Projekte Einrichtung oder Erstellung eines Programms

Wenn wir den Screenshot oben beobachten.

  1. Geben Sie in dieses Feld den Projektnamen ein. In unserem Fall haben wir den Projektnamen "HbaseConnection"
  2. Aktivieren Sie dieses Kontrollkästchen, um den Standardspeicherort zu speichern. In diesem / home / hduser / work / HbaseConnection befindet sich der Pfad
  3. Aktivieren Sie hier das Kontrollkästchen für die Java-Umgebung. In diesem JavaSE-1.7 ist die Java Edition
  4. Wählen Sie Ihre Option, in der Sie die Datei speichern möchten. In unserem Fall haben wir die zweite Option "Einen separaten Ordner für Quellen und Klassendateien erstellen" ausgewählt.
  5. Klicken Sie auf die Schaltfläche Fertig stellen.
  • Wenn Sie auf die Schaltfläche Fertig stellen klicken, wird das Projekt "HbaseConnection" in Eclipse erstellt
  • Nach dem Klicken auf die Schaltfläche "Fertig stellen" wird die Eclipse-Startseite direkt aufgerufen.

Schritt 2) Befolgen Sie auf der Eclipse-Homepage die folgenden Schritte

Right click on project -> Select Build Path -> Configure build path

Von oben Screenshot

  1. Klicken Sie mit der rechten Maustaste auf ein Projekt
  2. Wählen Sie den Erstellungspfad
  3. Wählen Sie Build-Pfad konfigurieren

Nachdem Sie auf "Erstellungspfad konfigurieren" geklickt haben, wird ein weiteres Fenster geöffnet (siehe Abbildung unten)

In diesem Schritt fügen wir dem Java-Projekt relevante HBase-Gläser hinzu, wie im Screenshot gezeigt.

  • Wichtige Gläser, die hinzugefügt werden müssen hbase-0.94.8.jar, hadoop-core-1.1.2.jar
  • Klicken Sie auf die Schaltfläche Fertig stellen

  1. Komm in die Bibliotheken
  2. Drücken Sie die Option - Externe Gläser hinzufügen
  3. Wählen Sie die gewünschten wichtigen Gläser aus
  4. Klicken Sie auf die Schaltfläche "Fertig stellen", um diese Dateien unter "Bibliotheken" zu "src" des Java-Projekts hinzuzufügen

Nach dem Hinzufügen dieser Gläser wird sie unter dem Speicherort des Projekts "src" angezeigt. Alle Jar-Dateien, die unter das Projekt fallen, können jetzt mit dem Hadoop-Ökosystem verwendet werden.

Schritt 3) In diesem Schritt wird mithilfe von HBaseConnection.java die HBase-Verbindung über Java-Codierung hergestellt

  • Führen Sie im Eclipse-Hauptmenü ein Java-Programm wie unten gezeigt aus

    Ausführen -> Ausführen als -> Java-Anwendung

  1. Wählen Sie Ausführen
  2. Wählen Sie Als Java-Anwendung ausführen
  • Dieser Code stellt über die Java-API eine Verbindung mit HBase her
  • Nach dem Ausführen dieses Codes wird die 'guru99'-Tabelle in HBase mit zwei Spaltenfamilien mit den Namen "Bildung" und "Projekte" erstellt. Derzeit wird das leere Schema nur in HBase erstellt.

Aus dem obigen Screenshot führen wir folgende Funktionen aus.

  1. Mit HTableDescriptor können wir in HBase eine "guru99" -Tabelle erstellen
  2. Mit der Methode addFamily fügen wir der Tabelle "guru99" "Bildung" und "Projekte" als Spaltennamen hinzu.

Die folgende Codierung wird zu

  • Stellen Sie eine Verbindung mit HBase und her
  • Erstellen Sie eine "guru99" -Tabelle mit zwei Spalten

Code unter dem Dokument HBaseConnection_Java platziert

// Place this code inside Hbase connectionimport java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hbase.HColumnDescriptor;import org.apache.hadoop.hbase.HTableDescriptor;Import org.apache.hadoop.hbase.client.HBaseAdmin;public class HBaseConnection{public static void main(String[] args) throws IOException{HBaseConfigurationhc = new HBaseConfiguration(new Configuration());HTableDescriptorht = new HTableDescriptor("guru99");ht.addFamily( new HColumnDescriptor("education"));ht.addFamily( new HColumnDescriptor("projects"));System.out.println( "connecting" );HBaseAdminhba = new HBaseAdmin( hc );System.out.println( "Creating Table" );hba.createTable( ht );System.out.println("Done… ");}}

Dies ist der erforderliche Code, den Sie in HBaseConnection.java platzieren und ein Java-Programm ausführen müssen

Nach dem Ausführen dieses Programms wird eine Verbindung mit HBase hergestellt und eine Tabelle mit Spaltennamen erstellt.

  • Der Tabellenname lautet "guru99".
  • Spaltennamen sind "Bildung" und "Projekte"

Schritt 4) Wir können überprüfen, ob die Tabelle "guru99" mit zwei Spalten in HBase erstellt wurde oder nicht, indem wir den HBase-Shell-Modus mit dem Befehl "list" verwenden.

Der Befehl "list" enthält Informationen zu allen in HBase erstellten Tabellen.

In diesem Bildschirm werden wir tun

  • Codeprüfung in der HBase-Shell durch Ausführen des Befehls "list".
  • Wenn wir den Befehl "list" ausführen, wird die in HBase erstellte Tabelle wie folgt angezeigt. In unserem Fall können wir sehen, dass die Tabelle "guru99" erstellt wurde

HBase Tabelle mit Shell erstellen

Die Syntax zum Erstellen einer Tabelle lautet

Syntax: create 
, 

Beispiel:-

hbase(main):001:0> create 'education' ,'guru99'0 rows(s) in 0.312 seconds=>Hbase::Table - education

Im obigen Beispiel wird erläutert, wie Sie eine Tabelle in HBase mit dem angegebenen Namen erstellen, der gemäß dem Wörterbuch oder den Spezifikationen gemäß der Spaltenfamilie angegeben wurde. Darüber hinaus können wir auch einige Tabellenbereichsattribute übergeben.

create 'guru99', {NAME=>'Edu', VERSIONS=>213423443}

Zusammenfassung:

HBase ist eine spaltenorientierte NoSQL-Datenbank zum Speichern einer großen Datenmenge über dem Hadoop-Ökosystem. Der Umgang mit Tabellen in HBase ist sehr wichtig, da alle wichtigen Funktionen wie Datenoperationen, Datenverbesserungen und Datenmodellierung nur über Tabellen in HBase ausgeführt werden können. Tabellen führen die folgenden Funktionen aus: 1) Erstellen von Tabellen mit Spaltennamen und Zeilen 2) Einfügen von Werten in Tabellen 3) Abrufen von Werten aus Tabellen