Question 1

Was ist die Hauptaufgabe der Partitionierung in BigQuery?

Accepted Answer

Die Partitionierung teilt eine Tabelle basierend auf einer Spalte (häufig ein Datum) in Segmente auf, was die bei Abfragen gescannte Datenmenge reduziert. Wenn eine Abfrage nach der Partitionsspalte filtert, liest BigQuery nur die relevanten Partitionen, anstatt die gesamte Tabelle zu scannen. Dies verbessert die Leistung und senkt die Abfragekosten, die auf Basis des gescannten Datenvolumens berechnet werden.

Question 2

Welche Partitionierungstypen sind in BigQuery verfügbar?

Accepted Answer

BigQuery bietet drei Partitionierungstypen: nach DATE-, TIMESTAMP- oder DATETIME-Spalte (am häufigsten), nach Integer-Bereich (INTEGER RANGE) und nach Ingestion-Zeit (_PARTITIONTIME). Datumsbasierte Partitionierung wird am häufigsten verwendet, da die meisten Analysen nach Zeiträumen filtern. Integer-Bereich-Partitionierung ist nützlich für numerische Identifikatoren.

Question 3

Was ist ein STRUCT in BigQuery?

Accepted Answer

Ein STRUCT (oder RECORD) ist ein Datentyp, der mehrere benannte Felder potenziell unterschiedlicher Typen in einer einzigen Spalte gruppiert. Ein STRUCT kann beispielsweise einen Namen (STRING), ein Alter (INT64) und eine E-Mail (STRING) enthalten. STRUCTs ermöglichen die Modellierung hierarchischer Daten direkt innerhalb einer Tabelle und vermeiden so kostspielige Joins. Auf Felder wird über die Punktnotation (struct_col.field) zugegriffen.

BigQuery - Erweiterte Funktionen

Was ist die Hauptaufgabe der Partitionierung in BigQuery?

Antwort

Welche Partitionierungstypen sind in BigQuery verfügbar?

Antwort

Was ist ein STRUCT in BigQuery?

Antwort

Was ist ein ARRAY in BigQuery?

Wozu dient die UNNEST-Funktion in BigQuery?

Weitere Data Analytics-Interviewthemen

Google Sheets - Grundlagen

Google Sheets - Erweiterte Formeln

SQL - Grundlagen

SQL - Aggregationen und Gruppierungen

SQL - Joins

BigQuery - Grundlagen

Data Cleaning - Datenbereinigung

KPIs und Business-Metriken

Deskriptive Statistik

Zapier und No-Code-Automatisierung

Grundlagen der Datenvisualisierung

Python & Pandas - Grundlagen

Google Sheets - Automatisierte Dashboards

SQL - Unterabfragen und CTEs

SQL - Window Functions

Data Modeling

Funnel- und Conversion-Analyse

Kohorten- und Retention-Analyse

Google Tag Manager und Tracking

APIs und Webhooks

dbt - Grundlagen

AB-Testing und angewandte Statistik

Looker Studio (Google Data Studio)

Power BI - Grundlagen

SQL - Erweiterte analytische Abfragen

dbt - Erweiterte Funktionen

Power BI - DAX und fortgeschrittene Dashboards

Python Analytics - Erweiterte Analyse und ML

Meistere Data Analytics für dein nächstes Interview