Data Analytics

Python Analytics - 高度な分析とML

groupby、merge、pivot_table、apply/map、Plotly、Scikit-Learn(回帰、分類、クラスタリング)、train/test split、メトリクス、Jupyter、Google Colab

20 面接問題·
Senior
1

Pandas Seriesにおけるapply()とmap()メソッドの主な違いは何ですか?

回答

map()メソッドは、辞書または関数を使用してSeriesの各値を新しい値にマッピングするように設計されており、Seriesでのみ機能します。対照的に、apply()はより柔軟で、Seriesに対して要素ごとに、またはDataFrameに対して行ごと/列ごとに関数を適用できます。Seriesでの単純な値から値への変換では、map()は一般的により高速で読みやすくなります。

2

異なる列に対して複数の集計関数を同時に使用してデータを集計するために、どのPandasメソッドを使用すべきですか?

回答

agg()(またはaggregate())メソッドを使用すると、異なる列に異なる集計関数を一度の操作で適用できます。これはキーが列名で値が適用する関数である辞書を受け入れます。このアプローチは、個別の関数で複数のgroupby呼び出しを連鎖させるよりも効率的で読みやすくなります。

3

Pandasにおけるmerge()とjoin()の違いは何ですか?

回答

merge()はより柔軟な関数で、on、left_on/right_onパラメータ、またはインデックスを使用して特定の列で2つのDataFrameを結合します。join()はデフォルトでインデックス上で結合するDataFrameメソッドで、単純なインデックスベースの結合により簡潔です。非インデックス列での複雑な結合では、結合列をより制御できるmerge()が好ましいです。

4

複数の集計関数を指定してpivot_table()でピボットテーブルを作成するにはどうすればよいですか?

5

apply()と比較した場合、groupby()コンテキストにおけるtransform()の目的は何ですか?

+17 面接問題

次の面接に向けてData Analyticsをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める