
Pandas Lanjutan
GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, performa
1Method mana yang memungkinkan menerapkan beberapa fungsi agregasi berbeda ke satu kolom dengan groupby?
Method mana yang memungkinkan menerapkan beberapa fungsi agregasi berbeda ke satu kolom dengan groupby?
Jawaban
Method agg() (atau aggregate()) memungkinkan menerapkan beberapa fungsi agregasi ke kolom yang sama. Anda dapat mengoper list fungsi seperti ['sum', 'mean', 'count'] atau dictionary untuk menentukan fungsi yang berbeda per kolom. Fleksibilitas ini penting untuk membuat laporan statistik komprehensif dalam satu operasi.
2Bagaimana cara menamai secara eksplisit kolom hasil selama agregasi groupby menggunakan sintaks named aggregation?
Bagaimana cara menamai secara eksplisit kolom hasil selama agregasi groupby menggunakan sintaks named aggregation?
Jawaban
Sintaks named aggregation menggunakan agg() dengan named tuple melalui keyword argument. Contoh: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). Pendekatan ini menghasilkan nama kolom yang eksplisit dan mudah dibaca, menghindari MultiIndex pada kolom yang dapat menyulitkan pemrosesan selanjutnya.
3Apa perbedaan utama antara transform() dan apply() dalam konteks groupby?
Apa perbedaan utama antara transform() dan apply() dalam konteks groupby?
Jawaban
transform() mengembalikan hasil dengan ukuran yang sama dengan input, sejajar dengan indeks asli, ideal untuk menambahkan statistik grup ke setiap baris (mis. rata-rata grup). apply() lebih fleksibel dan dapat mengembalikan hasil dengan ukuran berbeda, tetapi umumnya lebih lambat. Gunakan transform() untuk operasi seperti normalisasi grup atau perhitungan z-score.
Bagaimana memfilter grup dalam groupby untuk hanya menyimpan yang memenuhi kondisi (misal grup dengan lebih dari 10 elemen)?
Apa perbedaan antara pd.merge() dengan how='left' dan how='inner'?
+21 pertanyaan wawancara
Topik wawancara Data Science & ML lainnya
Dasar-dasar Python
Pemrograman Berorientasi Objek Python
Struktur Data Python
Dasar-Dasar Git
Dasar-dasar SQL
Dasar-Dasar NumPy
Dasar-dasar Pandas
Jupyter & Google Colab
SQL Joins & Kueri Lanjutan
Visualisasi dengan Matplotlib & Seaborn
Visualisasi Interaktif dengan Plotly
Statistik Deskriptif
Statistik Inferensial
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Terbimbing: Regresi
ML Terbimbing: Klasifikasi
Pohon Keputusan & Ensemble
ML Tanpa Pengawasan
Pipeline ML & Validasi
Deret Waktu & Peramalan
Dasar-Dasar Deep Learning
TensorFlow & Keras
CNN dan klasifikasi gambar
RNN & Sekuens
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps dan Deployment
Kuasai Data Science & ML untuk wawancara berikutnya
Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.
Mulai gratis