Data Engineering

Data Engineering için BigQuery

Serverless mimari, partitioning, clustering, maliyetler, UDF'ler, federated queries, scheduled queries, materialized views

20 mülakat soruları·
Mid-Level
1

BigQuery hangi depolama mimarisini kullanır?

Cevap

BigQuery, Capacitor adı verilen sütun tabanlı depolama ile serverless bir mimari kullanır. Bu mimari, storage ve compute'u ayırarak bağımsız ölçeklendirme ve ayrı faturalandırma sağlar. Sütun tabanlı depolama, yalnızca gerekli sütunların okunmasına izin verdiği için analitik sorgular için optimize edilmiştir ve I/O'yu önemli ölçüde azaltır.

2

BigQuery'de tablo partitioning'in temel avantajı nedir?

Cevap

Partitioning, büyük bir tabloyu bir sütuna (genellikle bir tarih) göre daha küçük segmentlere böler. Sorgular sırasında BigQuery, ilgisiz partition'ları atlayabilir (partition pruning) ve taranan veri miktarını azaltır. Bu, performansı artırır ve maliyetleri düşürür çünkü BigQuery işlenen veri hacmine göre faturalandırma yapar.

3

BigQuery'de hangi partitioning türleri mevcuttur?

Cevap

BigQuery üç partitioning türünü destekler: DATE veya TIMESTAMP sütunu ile (en yaygın), tamsayı aralığı ile (INTEGER RANGE) ve ingestion zamanı ile (_PARTITIONTIME). Tarih filtrelerinde verimli partition pruning sağladığı için tarih partitioning'i zaman serisi verileri için önerilir.

4

BigQuery'de partitioning ile clustering arasındaki fark nedir?

5

BigQuery'de sorgu maliyetleri nasıl optimize edilir?

+17 mülakat soruları

Bir sonraki mülakatın için Data Engineering'de uzmanlaş

Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.

Ücretsiz başla