Question 1

Pandas Seriesにおけるapply()とmap()メソッドの主な違いは何ですか?

Accepted Answer

map()メソッドは、辞書または関数を使用してSeriesの各値を新しい値にマッピングするように設計されており、Seriesでのみ機能します。対照的に、apply()はより柔軟で、Seriesに対して要素ごとに、またはDataFrameに対して行ごと/列ごとに関数を適用できます。Seriesでの単純な値から値への変換では、map()は一般的により高速で読みやすくなります。

Question 2

異なる列に対して複数の集計関数を同時に使用してデータを集計するために、どのPandasメソッドを使用すべきですか?

Accepted Answer

agg()(またはaggregate())メソッドを使用すると、異なる列に異なる集計関数を一度の操作で適用できます。これはキーが列名で値が適用する関数である辞書を受け入れます。このアプローチは、個別の関数で複数のgroupby呼び出しを連鎖させるよりも効率的で読みやすくなります。

Question 3

Pandasにおけるmerge()とjoin()の違いは何ですか?

Accepted Answer

merge()はより柔軟な関数で、on、left_on/right_onパラメータ、またはインデックスを使用して特定の列で2つのDataFrameを結合します。join()はデフォルトでインデックス上で結合するDataFrameメソッドで、単純なインデックスベースの結合により簡潔です。非インデックス列での複雑な結合では、結合列をより制御できるmerge()が好ましいです。

Python Analytics - 高度な分析とML

Pandas Seriesにおけるapply()とmap()メソッドの主な違いは何ですか?

回答

異なる列に対して複数の集計関数を同時に使用してデータを集計するために、どのPandasメソッドを使用すべきですか?

回答

Pandasにおけるmerge()とjoin()の違いは何ですか?

回答

複数の集計関数を指定してpivot_table()でピボットテーブルを作成するにはどうすればよいですか?

apply()と比較した場合、groupby()コンテキストにおけるtransform()の目的は何ですか?

その他のData Analytics面接トピック

Google Sheets - 基礎

Google Sheets - 高度な数式

SQL - 基礎

SQL - 集計とグルーピング

SQL - 結合

BigQuery - 基礎

Data Cleaning - データクレンジング

KPIとビジネスメトリクス

記述統計

ZapierとNo-Codeオートメーション

データビジュアライゼーションの原則

Python & Pandas - 基礎

Google Sheets - 自動化ダッシュボード

SQL - サブクエリとCTE

SQL - Window Functions

BigQuery - 高度な機能

Data Modeling

ファネルとコンバージョン分析

コホートとリテンション分析

Google Tag Managerとトラッキング

APIとWebhook

dbt - 基礎

ABテストと応用統計学

Looker Studio (Google Data Studio)

Power BI - 基礎

SQL - 高度な分析クエリ

dbt - 高度な機能

Power BI - DAXと高度なダッシュボード

次の面接に向けてData Analyticsをマスター