
BigQuery - Erweiterte Funktionen
Partitionierung, Clustering, materialisierte Ansichten, UDFs, verschachtelte Abfragen, STRUCT, ARRAY
1Was ist die Hauptaufgabe der Partitionierung in BigQuery?
Was ist die Hauptaufgabe der Partitionierung in BigQuery?
Antwort
Die Partitionierung teilt eine Tabelle basierend auf einer Spalte (häufig ein Datum) in Segmente auf, was die bei Abfragen gescannte Datenmenge reduziert. Wenn eine Abfrage nach der Partitionsspalte filtert, liest BigQuery nur die relevanten Partitionen, anstatt die gesamte Tabelle zu scannen. Dies verbessert die Leistung und senkt die Abfragekosten, die auf Basis des gescannten Datenvolumens berechnet werden.
2Welche Partitionierungstypen sind in BigQuery verfügbar?
Welche Partitionierungstypen sind in BigQuery verfügbar?
Antwort
BigQuery bietet drei Partitionierungstypen: nach DATE-, TIMESTAMP- oder DATETIME-Spalte (am häufigsten), nach Integer-Bereich (INTEGER RANGE) und nach Ingestion-Zeit (_PARTITIONTIME). Datumsbasierte Partitionierung wird am häufigsten verwendet, da die meisten Analysen nach Zeiträumen filtern. Integer-Bereich-Partitionierung ist nützlich für numerische Identifikatoren.
3Was ist ein STRUCT in BigQuery?
Was ist ein STRUCT in BigQuery?
Antwort
Ein STRUCT (oder RECORD) ist ein Datentyp, der mehrere benannte Felder potenziell unterschiedlicher Typen in einer einzigen Spalte gruppiert. Ein STRUCT kann beispielsweise einen Namen (STRING), ein Alter (INT64) und eine E-Mail (STRING) enthalten. STRUCTs ermöglichen die Modellierung hierarchischer Daten direkt innerhalb einer Tabelle und vermeiden so kostspielige Joins. Auf Felder wird über die Punktnotation (struct_col.field) zugegriffen.
Was ist ein ARRAY in BigQuery?
Wozu dient die UNNEST-Funktion in BigQuery?
+17 Interview-Fragen
Weitere Data Analytics-Interviewthemen
Google Sheets - Grundlagen
Google Sheets - Erweiterte Formeln
SQL - Grundlagen
SQL - Aggregationen und Gruppierungen
SQL - Joins
BigQuery - Grundlagen
Data Cleaning - Datenbereinigung
KPIs und Business-Metriken
Deskriptive Statistik
Zapier und No-Code-Automatisierung
Grundlagen der Datenvisualisierung
Python & Pandas - Grundlagen
Google Sheets - Automatisierte Dashboards
SQL - Unterabfragen und CTEs
SQL - Window Functions
Data Modeling
Funnel- und Conversion-Analyse
Kohorten- und Retention-Analyse
Google Tag Manager und Tracking
APIs und Webhooks
dbt - Grundlagen
AB-Testing und angewandte Statistik
Looker Studio (Google Data Studio)
Power BI - Grundlagen
SQL - Erweiterte analytische Abfragen
dbt - Erweiterte Funktionen
Power BI - DAX und fortgeschrittene Dashboards
Python Analytics - Erweiterte Analyse und ML
Meistere Data Analytics für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten