Data Analytics

BigQuery - Erweiterte Funktionen

Partitionierung, Clustering, materialisierte Ansichten, UDFs, verschachtelte Abfragen, STRUCT, ARRAY

20 Interview-Fragen·
Mid-Level
1

Was ist die Hauptaufgabe der Partitionierung in BigQuery?

Antwort

Die Partitionierung teilt eine Tabelle basierend auf einer Spalte (häufig ein Datum) in Segmente auf, was die bei Abfragen gescannte Datenmenge reduziert. Wenn eine Abfrage nach der Partitionsspalte filtert, liest BigQuery nur die relevanten Partitionen, anstatt die gesamte Tabelle zu scannen. Dies verbessert die Leistung und senkt die Abfragekosten, die auf Basis des gescannten Datenvolumens berechnet werden.

2

Welche Partitionierungstypen sind in BigQuery verfügbar?

Antwort

BigQuery bietet drei Partitionierungstypen: nach DATE-, TIMESTAMP- oder DATETIME-Spalte (am häufigsten), nach Integer-Bereich (INTEGER RANGE) und nach Ingestion-Zeit (_PARTITIONTIME). Datumsbasierte Partitionierung wird am häufigsten verwendet, da die meisten Analysen nach Zeiträumen filtern. Integer-Bereich-Partitionierung ist nützlich für numerische Identifikatoren.

3

Was ist ein STRUCT in BigQuery?

Antwort

Ein STRUCT (oder RECORD) ist ein Datentyp, der mehrere benannte Felder potenziell unterschiedlicher Typen in einer einzigen Spalte gruppiert. Ein STRUCT kann beispielsweise einen Namen (STRING), ein Alter (INT64) und eine E-Mail (STRING) enthalten. STRUCTs ermöglichen die Modellierung hierarchischer Daten direkt innerhalb einer Tabelle und vermeiden so kostspielige Joins. Auf Felder wird über die Punktnotation (struct_col.field) zugegriffen.

4

Was ist ein ARRAY in BigQuery?

5

Wozu dient die UNNEST-Funktion in BigQuery?

+17 Interview-Fragen

Meistere Data Analytics für dein nächstes Interview

Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.

Kostenlos starten