Data Science & ML

Pandas Lanjutan

GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, performa

24 pertanyaan wawancara·
Mid-Level
1

Method mana yang memungkinkan menerapkan beberapa fungsi agregasi berbeda ke satu kolom dengan groupby?

Jawaban

Method agg() (atau aggregate()) memungkinkan menerapkan beberapa fungsi agregasi ke kolom yang sama. Anda dapat mengoper list fungsi seperti ['sum', 'mean', 'count'] atau dictionary untuk menentukan fungsi yang berbeda per kolom. Fleksibilitas ini penting untuk membuat laporan statistik komprehensif dalam satu operasi.

2

Bagaimana cara menamai secara eksplisit kolom hasil selama agregasi groupby menggunakan sintaks named aggregation?

Jawaban

Sintaks named aggregation menggunakan agg() dengan named tuple melalui keyword argument. Contoh: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). Pendekatan ini menghasilkan nama kolom yang eksplisit dan mudah dibaca, menghindari MultiIndex pada kolom yang dapat menyulitkan pemrosesan selanjutnya.

3

Apa perbedaan utama antara transform() dan apply() dalam konteks groupby?

Jawaban

transform() mengembalikan hasil dengan ukuran yang sama dengan input, sejajar dengan indeks asli, ideal untuk menambahkan statistik grup ke setiap baris (mis. rata-rata grup). apply() lebih fleksibel dan dapat mengembalikan hasil dengan ukuran berbeda, tetapi umumnya lebih lambat. Gunakan transform() untuk operasi seperti normalisasi grup atau perhitungan z-score.

4

Bagaimana memfilter grup dalam groupby untuk hanya menyimpan yang memenuhi kondisi (misal grup dengan lebih dari 10 elemen)?

5

Apa perbedaan antara pd.merge() dengan how='left' dan how='inner'?

+21 pertanyaan wawancara

Kuasai Data Science & ML untuk wawancara berikutnya

Akses semua pertanyaan, flashcards, tes teknis, latihan code review dan simulator wawancara.

Mulai gratis