
SQL Lanjutan untuk Data Engineering
Window functions, CTE rekursif, query analitik, optimisasi, EXPLAIN ANALYZE, indexing, partitioning
1Window function mana yang menetapkan nomor urut unik untuk setiap baris dalam sebuah partisi?
Window function mana yang menetapkan nomor urut unik untuk setiap baris dalam sebuah partisi?
Jawaban
ROW_NUMBER() menetapkan nomor urut unik untuk setiap baris dalam sebuah partisi, dimulai dari 1. Tidak seperti RANK() dan DENSE_RANK() yang dapat menetapkan nomor yang sama untuk nilai yang sama, ROW_NUMBER() selalu menjamin nomor unik, bahkan untuk nilai identik dalam klausa ORDER BY.
2Apa perbedaan utama antara RANK() dan DENSE_RANK()?
Apa perbedaan utama antara RANK() dan DENSE_RANK()?
Jawaban
RANK() meninggalkan celah dalam penomoran setelah nilai yang seri. Misalnya, jika dua baris diberi peringkat 1, baris berikutnya akan diberi peringkat 3. DENSE_RANK() tidak meninggalkan celah: setelah dua baris diberi peringkat 1, baris berikutnya akan diberi peringkat 2. Perbedaan ini penting untuk analisis peringkat di mana celah dapat mengubah statistik.
3Bagaimana menghitung total berjalan (running total) dengan window function?
Bagaimana menghitung total berjalan (running total) dengan window function?
Jawaban
SUM() OVER dengan ORDER BY dan tanpa frame eksplisit secara default menggunakan ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW, yang menghitung jumlah semua baris sebelumnya hingga dan termasuk baris saat ini. Ini adalah perilaku standar untuk membuat total berjalan dalam analisis deret waktu atau berurutan.
Apa peran klausa PARTITION BY dalam window function?
Fungsi mana yang memungkinkan mengakses nilai baris sebelumnya dalam window function?
+17 pertanyaan wawancara
Topik wawancara Data Engineering lainnya
Linux & Shell - Dasar-dasar
Git & GitHub - Dasar-dasar
Python lanjutan untuk Data Engineering
Docker - Dasar-dasar
Google Cloud Platform - Dasar-Dasar
CI/CD dan Kualitas Kode
Docker Compose
FastAPI - API Data
Data Lake - Arsitektur dan Ingesti
BigQuery untuk Data Engineering
PostgreSQL - Administrasi
Data Modeling untuk Data Engineering
Fivetran & Airbyte - Ingesti Data
dbt - Dasar
Apache Airflow - Dasar-Dasar
Kubernetes - Dasar-Dasar
dbt - Fitur lanjutan
Pola ETL / ELT / ETLT
Apache Airflow - Lanjutan
Airflow + dbt - Orkestrasi Pipeline
PySpark - Pemrosesan Skala Besar
Google Pub/Sub - Streaming Data
Apache Beam & Dataflow
Kubernetes - Produksi dan Penskalaan
Terraform - Infrastructure as Code
Database NoSQL
Data Architecture Modern
Monitoring dan Observability
IAM dan Keamanan Data
Kuasai Data Engineering untuk wawancara berikutnya
Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.
Mulai gratis