PDF Herunterladen
Im Folgenden finden Sie häufig gestellte Fragen in Interviews für Erstsemester sowie erfahrene HBase-Entwickler.
1) Erklären Sie, was Hbase ist.
Hbase ist ein spaltenorientiertes Datenbankverwaltungssystem, das auf HDFS (Hadoop Distribute File System) ausgeführt wird. Hbase ist kein relationaler Datenspeicher und unterstützt keine strukturierte Abfragesprache wie SQL.
In Hbase regelt ein Masterknoten die Cluster- und Regionsserver, um Teile der Tabellen zu speichern, und führt die Arbeit an den Daten aus.
2) Erklären Sie, warum Sie Hbase verwenden sollten.
- Hochleistungsspeichersystem
- Verteiltes Design für große Tische
- Spaltenorientierte Geschäfte
- Horizontal skalierbar
- Hohe Leistung und Verfügbarkeit
- Das Hauptziel von Hbase sind Millionen von Spalten, Tausende von Versionen und Milliarden von Zeilen
- Im Gegensatz zu HDFS (Hadoop Distribute File System) unterstützt es zufällige Echtzeit-CRUD-Operationen
3) Erwähnen Sie, was die Schlüsselkomponenten von Hbase sind?
- Zookeeper: Er erledigt die Koordinierungsarbeit zwischen dem Kunden und Hbase Maser
- Hbase Master: Hbase Master überwacht den Region Server
- RegionServer: RegionServer überwacht die Region
- Region: Enthält im Speicher Datenspeicher (MemStore) und Hfile.
- Katalogtabellen: Katalogtabellen bestehen aus ROOT und META
4) Erklären Sie, woraus Hbase besteht.
- Hbase besteht aus einer Reihe von Tabellen
- Und jede Tabelle enthält Zeilen und Spalten wie herkömmliche Datenbanken
- Jede Tabelle muss ein Element enthalten, das als Primärschlüssel definiert ist
- Die Spalte Hbase bezeichnet ein Attribut eines Objekts
5) Erwähnen Sie, wie viele Betriebsbefehle in Hbase vorhanden sind?
Der Betriebsbefehl in Hbases besteht aus fünf Typen
- Erhalten
- Stellen
- Löschen
- Scan
- Zuwachs
6) Erklären Sie, was WAL und Hlog in Hbase sind.
WAL (Write Ahead Log) ähnelt dem MySQL BIN-Protokoll. Es zeichnet alle Änderungen auf, die in Daten auftreten. Es ist eine Standardsequenzdatei von Hadoop und speichert HLogkeys. Diese Schlüssel bestehen aus einer fortlaufenden Nummer sowie tatsächlichen Daten und werden verwendet, um noch nicht persistierte Daten nach einem Serverabsturz wiederzugeben. In bar nach einem Serverausfall fungiert WAL als Lebensader und ruft die verlorenen Daten ab.
7) Wann sollten Sie Hbase verwenden?
- Die Datengröße ist riesig: Wenn Sie Tonnen und Millionen von Datensätzen betreiben müssen
- Vollständige Neugestaltung: Wenn Sie RDBMS auf Hbase verschieben, betrachten Sie dies als eine vollständige Neugestaltung, bei der lediglich die Ports geändert werden
- SQL-Less-Befehle: Sie haben verschiedene Funktionen wie Transaktionen; innere Verknüpfungen, typisierte Spalten usw.
- Infrastrukturinvestitionen: Sie benötigen genügend Cluster, damit Hbase wirklich nützlich ist
8) Was sind in Hbase Spaltenfamilien?
Spaltenfamilien bilden die Grundeinheit der physischen Speicherung in Hbase, auf die Funktionen wie Komprimierungen angewendet werden.
9) Erklären Sie, was der Zeilenschlüssel ist.
Der Zeilenschlüssel wird von der Anwendung definiert. Da der kombinierte Schlüssel durch den Zeilenschlüssel vorgegeben ist, kann die Anwendung die gewünschte Sortierreihenfolge definieren. Es ermöglicht auch die logische Gruppierung von Zellen und stellt sicher, dass sich alle Zellen mit demselben Zeilenschlüssel auf demselben Server befinden.
10) Löschen in Hbase erklären? Erwähnen Sie, welche drei Arten von Grabsteinmarkern in Hbase vorhanden sind.
Wenn Sie die Zelle in Hbase löschen, werden die Daten nicht tatsächlich gelöscht, sondern eine Grabsteinmarkierung gesetzt, wodurch die gelöschten Zellen unsichtbar werden. Gelöschte Hbase werden tatsächlich während der Komprimierung entfernt.
Es gibt drei Arten von Grabsteinmarkierungen:
- Versionslöschmarkierung: Zum Löschen wird eine einzelne Version einer Spalte markiert
- Spaltenlöschmarkierung: Zum Löschen werden alle Versionen einer Spalte markiert
- Familienlöschmarkierung: Zum Löschen werden alle Spalten einer Spaltenfamilie markiert
11) Erklären Sie, wie Hbase eine Zeile tatsächlich löscht.
In Hbase wird alles, was Sie schreiben, vom RAM auf die Festplatte gespeichert. Diese Festplattenschreibvorgänge sind unveränderlich, sofern keine Komprimierung erfolgt. Während des Löschvorgangs in Hbase löscht der Hauptverdichtungsprozess den Marker, während kleinere Verdichtungen dies nicht tun. Bei normalen Löschvorgängen wird eine Tombstone-Markierung gelöscht. Diese Löschdaten, die sie darstellen, werden während der Komprimierung entfernt.
Wenn Sie Daten löschen und mehr Daten hinzufügen, jedoch mit einem früheren Zeitstempel als dem Tombstone-Zeitstempel, werden möglicherweise weitere Gets durch die Lösch- / Tombstone-Markierung maskiert, sodass Sie den eingefügten Wert erst nach der Hauptverdichtung erhalten.
12) Erklären Sie, was passiert, wenn Sie die Blockgröße einer Spaltenfamilie in einer bereits belegten Datenbank ändern.
Wenn Sie die Blockgröße der Spaltenfamilie ändern, belegen die neuen Daten die neue Blockgröße, während die alten Daten innerhalb der alten Blockgröße bleiben. Während der Datenkomprimierung nehmen alte Daten die neue Blockgröße an. Neue Dateien haben beim Leeren eine neue Blockgröße, während vorhandene Daten weiterhin korrekt gelesen werden. Alle Daten sollten nach der nächsten größeren Komprimierung in die neue Blockgröße umgewandelt werden.
13) Erwähnen Sie den Unterschied zwischen Hbase und relationaler Datenbank?
Hbase | Relationale Datenbank |
|
|
14) Was ist die HBaseFsck-Klasse?
In HBase ist ein Werkzeugname namens back verfügbar, der von der HBaseFsck-Klasse implementiert wird. Es bietet mehrere Befehlszeilenoptionen, die das Verhalten beeinflussen.
15) Was sind die wichtigsten Schlüsselstrukturen von HBase?
Zeilenschlüssel und Spaltenschlüssel sind die beiden wichtigsten Schlüsselstrukturen, die in HBase verwendet werden
16) Besprechen Sie, wie Sie Filter in Apache HBase verwenden können
Filter in der HBase-Shell. Es wurde in Apache HBase 0.92 eingeführt, mit dem Sie serverseitige Filter für den Zugriff auf HBase über HBase-Shell oder Thrift durchführen können.
17) HBase unterstützt Syntaxstruktur wie SQL Ja oder Nein?
Nein, leider ist die SQL-Unterstützung für HBase derzeit nicht verfügbar. Mit Apache Phoenix können wir jedoch Daten aus SQLase über SQL-Abfragen abrufen.
18) Was bedeutet Verdichtung in HBase?
Bei starken eingehenden Schreibvorgängen ist es unmöglich, eine optimale Leistung zu erzielen, wenn eine Datei pro Speicher vorhanden ist. HBase hilft Ihnen dabei, all diese HFiles zu kombinieren, um die Anzahl der Disk-Seeds für jeden Lesevorgang zu reduzieren. Dieser Vorgang wird als Verdichtung in HBase bezeichnet.
19) Wie werden Sie Joins in HBase implementieren?
HBase unterstützt keine Verknüpfungen direkt, verwendet jedoch MapReduce-Jobs. Verknüpfungsabfragen können implementiert werden, indem Daten mithilfe verschiedener HBase-Tabellen abgerufen werden.
20) Erklären Sie JMX in Bezug auf HBSE
Java Management Extensions oder JMX ist ein Exportstatus von Java-Anwendungen ist der Standard für sie.
21) Was ist die Verwendung von MasterServer?
Mit dem Master-Server können Sie dem Regionsserver auch eine Region zuweisen. Es hilft Ihnen auch beim Lastausgleich, den wir mit dem MasterServer verwenden.
22) Definieren Sie den Begriff Sparsamkeit
Apache Thrift ist in C ++ geschrieben. Es bietet Schema-Compiler für verschiedene Programmiersprachen wie C ++, Perl, PHP, Python, Ruby und mehr.
23) Warum die HColumnDescriptor-Klasse verwenden?
Die Details zur Spaltenfamilie wie Komprimierungseinstellungen, Anzahl der Versionen, werden in HColumnDescriptor gespeichert.
24) Was ist eine Zelle in HBase?
Eine Zelle in HBase ist die kleinste Einheit einer Hbase-Tabelle. Es hilft Ihnen, ein Datenelement in Form eines Tupels (Zeile, Spalte, Version) zu speichern.
25) Was ist ein Bloom-Filter?
HBase unterstützt Bloom Filter und hilft Ihnen, den Gesamtdurchsatz des Clusters zu verbessern. Ein HBase Bloom Filter ist ein platzsparender Mechanismus, um zu testen, ob eine HFile bestimmte Zeilen- oder Zeilen-Col-Zellen enthält.
26) Erzählen Sie mir von den Arten von HBase-Operationen?
Ans. Zwei Arten von HBase-Operationen sind:
- Betrieb lesen
- Schreibvorgang
27) Was ist die Verwendung von HBase HMaster?
Hauptaufgaben eines Masters sind:
- Koordination der Regionsserver
- Admin-Funktionen
28) Mit welcher Technik können Sie in HBase ohne Hilfe von HBase direkt auf HFile zugreifen?
Um direkt auf HBile zuzugreifen, ohne HBase zu verwenden, verwenden wir die HFile.main () -Methode.
29) Kann sich der Regionsserver auf allen DataNodes befinden?
Ja, Regionsserver werden auf denselben Servern wie DataNodes ausgeführt
30) Nennen Sie den Filter, der die Seitengröße als Parameter in HBase akzeptiert
Ein Filter mit dem Namen PageFilter akzeptiert die Seitengröße als Parameter.
Dieses Dokument wurde mit den Sofort-HTML-Konverter-Tools erstellt.
- Nächster