
BigQuery & Cloud Data
BigQuery, groß angelegte SQL-Abfragen, Partitionierung, öffentliche Datensätze, Kosten, Optimierung
1Was ist Google BigQuery?
Was ist Google BigQuery?
Antwort
BigQuery ist ein serverloses, hoch skalierbares und kostengünstiges Data Warehouse von Google Cloud Platform. Dank seiner verteilten Architektur ermöglicht es die Ausführung analytischer SQL-Abfragen auf Petabytes von Daten in Sekunden. Im Gegensatz zu herkömmlichen Datenbanken trennt BigQuery Speicher und Rechenleistung, was eine nutzungsbasierte Abrechnung und nahezu unbegrenzte Skalierbarkeit ermöglicht.
2Was ist der Hauptvorteil der serverlosen Architektur von BigQuery?
Was ist der Hauptvorteil der serverlosen Architektur von BigQuery?
Antwort
Die serverlose Architektur von BigQuery bedeutet, dass keine Infrastruktur verwaltet werden muss: keine Server-Bereitstellung, keine Cluster-Konfiguration, keine Wartung. Google verwaltet Ressourcen automatisch basierend auf der Nachfrage. Dies ermöglicht es, sich auf Abfragen und Analysen zu konzentrieren, anstatt auf Systemadministration, während man von automatischer Skalierbarkeit profitiert.
3Wie berechnet BigQuery Abfragen im On-Demand-Modus?
Wie berechnet BigQuery Abfragen im On-Demand-Modus?
Antwort
Im On-Demand-Modus berechnet BigQuery basierend auf der Menge der von der Abfrage gescannten Daten, nicht nach Ausführungszeit oder zurückgegebenen Zeilen. Das erste Terabyte pro Monat ist kostenlos. Es ist daher entscheidend, Abfragen zu optimieren, indem nur notwendige Spalten ausgewählt und Partitionierung verwendet wird, um Kosten zu senken.
Was ist ein Dataset in BigQuery?
Was ist Tabellenpartitionierung in BigQuery und was ist ihr Hauptvorteil?
+15 Interview-Fragen
Weitere Data Science & ML-Interviewthemen
Python-Grundlagen
Python Objektorientierte Programmierung
Python-Datenstrukturen
Git-Grundlagen
SQL-Grundlagen
NumPy-Grundlagen
Pandas-Grundlagen
Jupyter & Google Colab
SQL Joins & fortgeschrittene Abfragen
Fortgeschrittenes Pandas
Visualisierung mit Matplotlib & Seaborn
Interaktive Visualisierungen mit Plotly
Deskriptive Statistik
Inferenzstatistik
Web Scraping
Feature Engineering
Überwachtes ML: Regression
Überwachtes ML: Klassifikation
Entscheidungsbäume & Ensembles
Unüberwachtes ML
ML-Pipelines & Validierung
Zeitreihen & Prognosen
Grundlagen des Deep Learning
TensorFlow & Keras
CNN und Bildklassifizierung
RNN & Sequenzen
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps und Deployment
Meistere Data Science & ML für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten