Data Science & ML

İleri Pandas

GroupBy, merge, concat, pivot tables, time series, apply/transform, MultiIndex, performans

24 mülakat soruları·
Mid-Level
1

Hangi metot, groupby ile tek bir sütuna birden fazla farklı agregasyon fonksiyonu uygulamaya olanak tanır?

Cevap

agg() (veya aggregate()) metodu, aynı sütunlara birden fazla agregasyon fonksiyonu uygulamaya olanak tanır. ['sum', 'mean', 'count'] gibi bir fonksiyon listesi veya sütun başına farklı fonksiyonlar belirtmek için bir sözlük geçebilirsiniz. Bu esneklik, tek bir işlemde kapsamlı istatistiksel raporlar oluşturmak için gereklidir.

2

Named aggregation sözdizimini kullanarak groupby agregasyonu sırasında sonuç sütunlarını açıkça nasıl adlandırabilirsiniz?

Cevap

Named aggregation sözdizimi, anahtar kelime argümanları aracılığıyla adlandırılmış tuple'larla agg() kullanır. Örneğin: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean')). Bu yaklaşım, sonraki işlemleri zorlaştırabilecek sütunlardaki MultiIndex'i önleyerek açık ve okunabilir sütun adları üretir.

3

groupby bağlamında transform() ve apply() arasındaki temel fark nedir?

Cevap

transform() girdiyle aynı boyutta, orijinal indekse hizalanmış bir sonuç döndürür, her satıra grup istatistikleri (örn. grup ortalaması) eklemek için idealdir. apply() daha esnektir ve farklı boyutta sonuç döndürebilir, ancak genellikle daha yavaştır. Grup normalleştirmesi veya z-score hesaplama gibi işlemler için transform() kullanın.

4

groupby içindeki grupları yalnızca bir koşulu karşılayanları (örneğin 10'dan fazla öğesi olan gruplar) tutmak için nasıl filtrelersiniz?

5

pd.merge() how='left' ile how='inner' arasındaki fark nedir?

+21 mülakat soruları

Bir sonraki mülakatın için Data Science & ML'de uzmanlaş

Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.

Ücretsiz başla