Data Science & ML

Pandas応用

GroupBy、merge、concat、pivot tables、time series、apply/transform、MultiIndex、パフォーマンス

24 面接問題·
Mid-Level
1

groupbyで単一の列に複数の異なる集約関数を適用できるメソッドはどれですか?

回答

agg()(またはaggregate())メソッドは、同じ列に複数の集約関数を適用できます。['sum', 'mean', 'count']のような関数のリストや、列ごとに異なる関数を指定する辞書を渡すことができます。この柔軟性は、単一の操作で包括的な統計レポートを作成するために不可欠です。

2

named aggregation構文を使用してgroupby集約時に結果の列を明示的に命名する方法は?

回答

named aggregation構文では、キーワード引数を介して名前付きタプルを持つagg()を使用します。例: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean'))。このアプローチは、後続の処理を複雑にする可能性のある列のMultiIndexを回避し、明示的で読みやすい列名を生成します。

3

groupbyコンテキストにおけるtransform()とapply()の主な違いは何ですか?

回答

transform()は入力と同じサイズの結果を返し、元のインデックスに整列されており、各行にグループ統計(例: グループ平均)を追加するのに理想的です。apply()はより柔軟で異なるサイズの結果を返すことができますが、一般的に遅いです。グループ正規化やz-score計算などの操作にはtransform()を使用してください。

4

条件を満たすグループだけ(例: 10要素以上のグループ)を保持するためにgroupbyのグループをフィルタリングする方法は?

5

how='left'とhow='inner'を持つpd.merge()の違いは何ですか?

+21 面接問題

次の面接に向けてData Science & MLをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める