Top 50 Teradata Interview Fragen & Antworten

Anonim

PDF Herunterladen

1) Wie definieren Sie Teradata? Geben Sie einige der Hauptmerkmale derselben an.

Teradata ist im Grunde ein RDMS, mit dem Datamart, Datawarehouse, OLAP, OLTP sowie DSS-Appliances des Unternehmens betrieben werden. Einige der Hauptmerkmale von Teradata sind unten angegeben.

  • Kann sowohl auf Einzelknoten als auch auf Mehrknoten ausgeführt werden.
  • Parallelität ist in das System eingebaut.
  • Sehr gut kompatibel mit den Standards von ANSI.
  • Neigt dazu, sich wie ein Server zu verhalten.
  • Es ist ein offenes System, das grundsätzlich für UNIX MR-RAS, Suse Linux ETC, WIN2K usw. ausgeführt wird.

2) Was sind die neu entwickelten Funktionen von Teradata?

Einige der neu entwickelten Funktionen von Teradata sind:

  • Automatisierte zeitliche Analyse
  • Erweiterung der Komprimierungsfunktionen, die eine flexible Komprimierung von Daten ermöglicht, etwa 20-mal mehr Daten als in der vorherigen Version.
  • Kundenbezogene Innovationen wie Tetradata Viewpoint.

3) Markieren Sie einige wichtige Komponenten von Teradata.

Einige der wichtigen Komponenten von Teradata sind:

  • Bynet
  • Zugriffsmodulprozessor (AMP)
  • Parsing Engine (PE)
  • Virtuelle Festplatte (vDisk)
  • Virtuelles Speichersystem (VSS)

4) Erwähnen Sie die Prozedur, mit der Teradata-Jobs in einer UNIX-Umgebung ausgeführt werden können.

Alles, was Sie tun müssen, ist die Ausführung unter UNIX wie unten beschrieben durchzuführen.

$ Sh> BTEQ <[Skriptpfad]> [Protokolldateipfad]

oder

$ Sh> BTEQ <[Skriptpfad] TEE [Protokolldateipfad]

5) Wie erzeugen wir in Teradata eine Sequenz?

In Teradata generieren wir Sequenzen mithilfe der Identitätsspalte

6) Wie wird die Sequenz während der Anzeigezeit von Teradata generiert?

Sie müssen lediglich CSUM verwenden.

7) Der Tisch wird stündlich mit einer bestimmten Belastung belastet. Der Verkehr am Morgen ist relativ gering und der in der Nacht sehr hoch. Welches Dienstprogramm ist in dieser Situation am ratsamsten und wie soll dieses Dienstprogramm geladen werden?

Das naheliegendste Dienstprogramm hier muss Tpump sein. Durch die Verwendung einer abnehmenden oder zunehmenden Paketgröße kann der Verkehr leicht gehandhabt werden.

8) Wenn das Fast Load Script fehlschlägt und Ihnen nur die Fehlertabellen zur Verfügung gestellt werden, wie werden Sie dann neu starten?

Grundsätzlich gibt es in diesem Fall zwei Möglichkeiten zum Neustart.

  • Ausführen der alten Datei - Stellen Sie sicher, dass Sie die Fehlertabellen nicht vollständig löschen. Versuchen Sie stattdessen, die im Skript oder in der Datei vorhandenen Fehler zu beheben, und führen Sie sie dann erneut aus.
  • Ausführen einer neuen Datei - In diesem Prozess wird das Skript einfach mithilfe von Endlader- und Anfangsanweisungen ausgeführt. Dies hilft beim Entfernen der Sperre, die für die Zieltabelle eingerichtet wurde, und entfernt möglicherweise auch den angegebenen Datensatz aus der Fast-Log-Tabelle. Sobald dies erledigt ist, können Sie das gesamte Skript erneut ausführen.

9) Erwähnen Sie einige der ETL-Tools, die unter Teradata fallen.

Einige der in Teradata häufig verwendeten ETL-Tools sind DataStage, Informatica, SSIS usw.

10) Markieren Sie einige der Vorteile, die ETL-Tools gegenüber TD haben.

Einige der Vorteile, die ETL-Tools gegenüber TD haben, sind:

  • Es können mehrere heterogene Ziele sowie Quellen betrieben werden.
  • Der Debugging-Prozess ist mit Hilfe von ETL-Tools dank der umfassenden GUI-Unterstützung viel einfacher.
  • Komponenten von ETL-Tools können problemlos wiederverwendet werden. Wenn der Hauptserver aktualisiert wird, werden alle entsprechenden mit dem Server verbundenen Anwendungen automatisch aktualisiert.
  • Das Entschwenken und Schwenken kann einfach mit ETL-Tools durchgeführt werden.

11) Was bedeutet Caching in Teradata?

Das Zwischenspeichern wird als zusätzlicher Vorteil der Verwendung von Teradata angesehen, da es hauptsächlich mit der Quelle funktioniert, die in derselben Reihenfolge bleibt, dh sich nicht häufig ändert. Manchmal wird der Cache normalerweise von Anwendungen gemeinsam genutzt.

12) Wie können wir die Version von Teradata überprüfen, die wir derzeit verwenden?

Geben Sie einfach den Befehl .SHOW VERSION.

13) Geben Sie einen berechtigten Grund an, warum Multi-Load NUSI anstelle von USI unterstützt.

Die Index-Untertabellenzeile befindet sich zufällig auf demselben Verstärker wie die Datenzeile in NUSI. Somit wird jeder Verstärker separat und parallel betrieben.

14) Wie wird das MLOAD Client System nach der Ausführung neu gestartet?

Das Skript muss manuell übermittelt werden, damit die Daten problemlos vom letzten Prüfpunkt geladen werden können.

15) Wie wird MLOAD Teradata Server nach der Ausführung neu gestartet?

Der Prozess wird im Wesentlichen vom letzten bekannten Prüfpunkt aus ausgeführt. Sobald die Daten nach Ausführung des MLOAD-Skripts ausgeführt wurden, wird der Server neu gestartet.

16) Was ist mit einem Knoten gemeint?

Ein Knoten wird grundsätzlich als eine Zusammenstellung von Hard- und Softwarekomponenten bezeichnet. Normalerweise wird ein Server als Knoten bezeichnet.

17) Nehmen wir an, es gibt eine Datei, die aus 100 Datensätzen besteht, von denen wir die ersten und die letzten 20 Datensätze überspringen müssen. Was wird das Code-Snippet?

Wir müssen das BTEQ-Dienstprogramm verwenden, um diese Aufgabe zu erledigen. Skip 20 sowie Repeat 60 werden im Skript verwendet.

18) Erklären Sie die PDE.

PDE steht grundsätzlich für Parallel Data Extension. PDE ist im Grunde eine Schnittstellenschicht von Software, die über dem Betriebssystem vorhanden ist, und gibt der Datenbank die Möglichkeit, in einem parallelen Umfeld zu arbeiten.

19) Was ist TPD?

TPD steht im Wesentlichen für Trusted Parallel Database und funktioniert im Wesentlichen unter PDE. Teradata ist zufällig eine Datenbank, die hauptsächlich unter PDE funktioniert. Dies ist der Grund, warum Teradata normalerweise als vertrauenswürdige parallele oder reine parallele Datenbank bezeichnet wird.

20) Was versteht man unter einem Kanaltreiber?

Ein Kanaltreiber ist eine Software, die als Kommunikationsmedium zwischen PEs und allen Anwendungen fungiert, die auf Kanälen ausgeführt werden, die an die Clients angeschlossen sind.

21) Was ist mit Teradata Gateway gemeint?

Genau wie der Kanaltreiber fungiert Teradata Gateway als Kommunikationsmedium zwischen der Parse Engine und Anwendungen, die an Netzwerkclients angeschlossen sind. Pro Knoten wird nur ein Gateway zugewiesen.

22) Was versteht man unter einer virtuellen Festplatte?

Virtual Disk ist im Grunde eine Zusammenstellung einer ganzen Reihe von Zylindern, bei denen es sich um physische Festplatten handelt. Es wird manchmal als Plattenarray bezeichnet.

23) Erklären Sie die Bedeutung von Amp?

Amp steht im Grunde genommen für Access Module Processor und ist zufällig ein Prozessor, der virtuell arbeitet und im Grunde genommen zum Verwalten eines einzelnen Teils der Datenbank verwendet wird. Dieser bestimmte Teil der Datenbank kann von keinem anderen Verstärker gemeinsam genutzt werden. Daher wird diese Form der Architektur allgemein als Shared-Nothing-Architektur bezeichnet.

24) Was enthält Amp und welche Operationen werden ausgeführt?

Amp besteht im Wesentlichen aus einem Database Manager-Subsystem und kann die unten genannten Vorgänge ausführen.

  • DML durchführen
  • DDL durchführen
  • Implementieren von Aggregationen und Joins.
  • Lösen und Anwenden von Schlössern usw.

25) Was versteht man unter einer Parsing Engine?

PE ist zufällig eine Art Vproc. Seine Hauptfunktion besteht darin, SQL-Anforderungen entgegenzunehmen und Antworten in SQL zu liefern. Es besteht aus einer Vielzahl von Softwarekomponenten, mit denen SQL in verschiedene Schritte unterteilt und diese Schritte dann an AMPs gesendet werden.

26) Was meinst du mit Parsen?

Das Parsen ist ein Prozess, der sich mit der Analyse von Symbolen von Zeichenfolgen befasst, die entweder in Computersprache oder in natürlicher Sprache vorliegen.

27) Was sind die Funktionen eines Parsers?

Ein Parser: -

  • Überprüft Semantikfehler
  • Überprüft syntaktische Fehler
  • Überprüft die Existenz von Objekten

28) Was versteht man unter einem Dispatcher?

Der Dispatcher nimmt eine ganze Sammlung von Anforderungen entgegen und speichert sie dann in einer Warteschlange. Die gleiche Warteschlange wird während des gesamten Prozesses beibehalten, um mehrere Sätze von Antworten zu liefern.

29) Wie viele MAX-Sitzungen kann PE zu einem bestimmten Zeitpunkt verarbeiten?

PE kann zu einem bestimmten Zeitpunkt insgesamt 120 Sitzungen abwickeln.

30) Erklären Sie BYNET.

BYNET dient grundsätzlich als Kommunikationsmedium zwischen den Komponenten. Es ist in erster Linie für das Senden von Nachrichten und auch für das Durchführen von Zusammenführungs- und Sortiervorgängen verantwortlich.

31) Was ist mit einer Clique gemeint?

Eine Clique ist im Grunde eine Zusammenstellung von Knoten, die von gemeinsamen Festplatten gemeinsam genutzt werden. Das Vorhandensein von Clique ist immens wichtig, da es dabei hilft, Knotenausfälle zu vermeiden.

32) Was passiert, wenn ein Knoten einen Sturz erleidet?

Bei einem Leistungsabfall eines Knotens werden alle entsprechenden Vprocs sofort vom Fail-Knoten auf einen neuen Knoten migriert, um alle Daten von gemeinsamen Laufwerken zurückzugewinnen.

33) Listen Sie alle Arten von LOCKS auf, die in Teradata verfügbar sind.

Grundsätzlich gibt es vier Arten von LOCKS, die unter Teradata fallen. Diese sind: -

  • Lesen Sie Lock
  • Zugriffssperre
  • Exklusives Schloss
  • Schreibsperre

34) Auf welcher bestimmten Ebene kann ein LOCK in Teradata angewendet werden?

  • Tabellenebene - Alle Zeilen, die in einer Tabelle vorhanden sind, werden mit Sicherheit gesperrt.
  • Sperre auf Datenbankebene - Alle in der Datenbank vorhandenen Objekte werden gesperrt.
  • Zeilen-Hash-Level-Sperre - Es werden nur die Zeilen gesperrt, die der jeweiligen Zeile entsprechen.

35) Wie hoch ist die Punktzahl der aktiv beteiligten AMPs im Primärindex?

Nur ein AMP ist aktiv an einem Primärindex beteiligt.

36) Welche Bedeutung hat der UPSERT-Befehl in Teradata?

UPSERT steht grundsätzlich für Update Else Insert. Diese Option ist nur in Teradata verfügbar.

37) Markieren Sie die Vorteile von PPI (Partition Primary Index).

PPI wird grundsätzlich für bereichsbasierte oder kategorienbasierte Datenspeicherungszwecke verwendet. Wenn es um Bereichsabfragen geht, ist keine vollständige Tabellenscan-Nutzung erforderlich, da diese sofort zur entsprechenden Partition wechselt und alle anderen Partitionen überspringt.

38) Geben Sie die Größen SMALLINT, BYTEINT und INTEGER an.

SMALLINT - 2 Bytes - 16 Bites -> -32768 bis 32767

BYTEINT - 1 Bytes - 8 Bits -> -128 bis 127

INTEGER - 4 Bytes - 32 Bits -> -2.147.483.648 bis 2.147.483.647

39) Was versteht man unter einem Mindestkostenplan?

Ein Plan mit den geringsten Kosten wird im Grunde genommen auf kürzestem Weg in kürzerer Zeit ausgeführt.

40) Markieren Sie die Unterschiede zwischen der Datenbank und dem Benutzer in Teradata.

  • Eine Datenbank ist grundsätzlich passiv, während ein Benutzer aktiv ist.
  • In einer Datenbank werden hauptsächlich alle Objekte der Datenbank gespeichert, während ein Benutzer jedes Objekt speichern kann, unabhängig davon, ob es sich um ein Makro, eine Tabelle, eine Ansicht usw. handelt.
  • Die Datenbank hat kein Passwort, während der Benutzer ein Passwort eingeben muss.

41) Markieren Sie die Unterschiede zwischen Primärschlüssel und Primärindex.

  • Der Primärindex ist obligatorisch, während der Primärschlüssel optional ist.
  • Der Primärindex hat ein Limit von 64 Tabellen / Spalten, während der Primärschlüssel kein Limit hat.
  • Der Primärindex erlaubt Duplikate und Nullen, der Primärschlüssel dagegen nicht.
  • Der Primärindex ist ein physikalischer Mechanismus, während der Primärschlüssel ein rein logischer Mechanismus ist.

42) Erklären Sie, wie der Spool-Speicherplatz verwendet wird.

Der Spool-Speicherplatz in Teradata wird grundsätzlich zum Ausführen von Abfragen verwendet. Von dem gesamten in Teradata verfügbaren Speicherplatz werden 20% des Speicherplatzes im Wesentlichen dem Spool-Speicherplatz zugewiesen.

43) Markieren Sie die Notwendigkeit einer Leistungsoptimierung.

Die Leistungsoptimierung in Teradata wird im Wesentlichen durchgeführt, um alle Engpässe zu identifizieren und sie dann zu beheben.

44) Kommentieren Sie, ob ein Engpass ein Fehler ist oder nicht.

Technisch gesehen ist ein Engpass keine Form von Fehler, aber er verursacht sicherlich eine gewisse Verzögerung im System.

45) Wie können Engpässe erkannt werden?

Grundsätzlich gibt es vier Möglichkeiten, einen Engpass zu identifizieren. Diese sind: -

  • Teradata Visual Explain
  • Erklären Sie den Anforderungsmodifikator
  • Teradata Manager
  • Leistungsüberwachung

46) Was versteht man unter einem Plan mit den höchsten Kosten?

Gemäß dem Plan für die höchsten Kosten ist die Zeit für die Ausführung des Prozesses länger und es wird der längste verfügbare Pfad benötigt.

47) Markieren Sie alle Modi, die unter Konfidenzstufe vorhanden sind.

Niedrig, Nein, Hoch und Verbinden sind die vier Modi, die unter Konfidenzstufe vorhanden sind.

48) Nennen Sie die fünf Phasen, die unter das Dienstprogramm MultiLoad fallen.

Vorphase, DML-Phase, Datenerfassungsphase, Anwendungsphase und Endphase.

49) Markieren Sie die Einschränkungen des TPUMP-Dienstprogramms.

Im Folgenden sind die Einschränkungen des TPUMP-Dienstprogramms aufgeführt: -

  • Wir können die SELECT-Anweisung nicht verwenden.
  • Datendateien können nicht verkettet werden.
  • Aggregat- und Exponentialoperatoren werden nicht unterstützt.
  • Arithmetische Funktionen können nicht unterstützt werden.

50) Wie werden in BTEQ die Sitzungsmodusparameter eingestellt?

.set Sitzungstransaktion BTET -> Teradata-Transaktionsmodus

.set Sitzungstransaktion ANSI -> ANSI-Modus

Diese Befehle funktionieren nur, wenn sie eingegeben werden, bevor Sie sich bei der Sitzung anmelden.