Question 1

groupbyで単一の列に複数の異なる集約関数を適用できるメソッドはどれですか?

Accepted Answer

agg()(またはaggregate())メソッドは、同じ列に複数の集約関数を適用できます。['sum', 'mean', 'count']のような関数のリストや、列ごとに異なる関数を指定する辞書を渡すことができます。この柔軟性は、単一の操作で包括的な統計レポートを作成するために不可欠です。

Question 2

named aggregation構文を使用してgroupby集約時に結果の列を明示的に命名する方法は?

Accepted Answer

named aggregation構文では、キーワード引数を介して名前付きタプルを持つagg()を使用します。例: df.groupby('category').agg(total_sales=('sales', 'sum'), avg_price=('price', 'mean'))。このアプローチは、後続の処理を複雑にする可能性のある列のMultiIndexを回避し、明示的で読みやすい列名を生成します。

Question 3

groupbyコンテキストにおけるtransform()とapply()の主な違いは何ですか?

Accepted Answer

transform()は入力と同じサイズの結果を返し、元のインデックスに整列されており、各行にグループ統計(例: グループ平均)を追加するのに理想的です。apply()はより柔軟で異なるサイズの結果を返すことができますが、一般的に遅いです。グループ正規化やz-score計算などの操作にはtransform()を使用してください。

Pandas応用

groupbyで単一の列に複数の異なる集約関数を適用できるメソッドはどれですか?

回答

named aggregation構文を使用してgroupby集約時に結果の列を明示的に命名する方法は?

回答

groupbyコンテキストにおけるtransform()とapply()の主な違いは何ですか?

回答

条件を満たすグループだけ(例: 10要素以上のグループ)を保持するためにgroupbyのグループをフィルタリングする方法は?

how='left'とhow='inner'を持つpd.merge()の違いは何ですか?

その他のData Science & ML面接トピック

Pythonの基礎

Pythonオブジェクト指向プログラミング

Pythonのデータ構造

Git の基礎

SQLの基礎

NumPyの基礎

Pandasの基礎

Jupyter & Google Colab

SQL Joinsと高度なクエリ

Matplotlib & Seabornによる可視化

Plotlyによるインタラクティブな可視化

記述統計

推測統計学

Web Scraping

BigQuery & Cloud Data

Feature Engineering

教師あり機械学習：回帰

教師あり機械学習：分類

決定木とアンサンブル

教師なしML

MLパイプラインと検証

時系列と予測

Deep Learningの基礎

TensorFlow & Keras

CNN と画像分類

RNNとシーケンス

TransformersとAttention

NLPとHugging Face

GenAIとLangChain

MLOps とデプロイ

次の面接に向けてData Science & MLをマスター