
記述統計
平均、中央値、標準偏差、四分位数、分布、相関、外れ値、歪度
20 面接問題·
Mid-Level
1極端な値(外れ値)を含むデータに最も適した中心傾向の尺度はどれですか?
1
極端な値(外れ値)を含むデータに最も適した中心傾向の尺度はどれですか?
回答
中央値は外れ値に対して最もロバストな中心傾向の尺度です。ソートされたデータの中央値を表し、極端な値の影響を受けないからです。すべての値を合計する平均とは異なり、中央値は位置のみを考慮します。例えば、数人の高給取りの幹部がいる企業の給与の場合、中央値は平均よりも典型的な給与をより適切に表します。
2データセットの分散とは何ですか?
2
データセットの分散とは何ですか?
回答
分散は、データの平均周辺の散らばりを測定します。平均からの偏差の二乗の平均として計算されます。二乗することで常に正の値が得られ、平均から遠い値の影響を増幅します。分散の単位は元のデータ単位の二乗であるため、元の単位で散らばりを解釈するために標準偏差(分散の平方根)がよく使われます。
3標準偏差と分散の関係は何ですか?
3
標準偏差と分散の関係は何ですか?
回答
標準偏差は分散の平方根です。この変換により、散らばりの尺度が元のデータ単位に戻り、解釈が容易になります。例えば、データがユーロ単位の場合、分散はユーロの二乗単位(解釈が困難)になりますが、標準偏差はユーロ単位になります。したがって、データの散らばりを直感的に伝えるには標準偏差が好まれます。
4
分布の第1四分位数(Q1)は何を表しますか?
5
Pearson相関係数が-0.85の場合、どのように解釈しますか?
+17 面接問題
その他のData Science & ML面接トピック
Pythonの基礎
Junior
25問Pythonオブジェクト指向プログラミング
Junior
20問Pythonのデータ構造
Junior
20問Git の基礎
Junior
18問SQLの基礎
Junior
20問NumPyの基礎
Junior
22問Pandasの基礎
Junior
22問Jupyter & Google Colab
Junior
16問SQL Joinsと高度なクエリ
Mid-Level
22問Pandas応用
Mid-Level
24問Matplotlib & Seabornによる可視化
Mid-Level
20問Plotlyによるインタラクティブな可視化
Mid-Level
18問推測統計学
Mid-Level
24問Web Scraping
Mid-Level
18問BigQuery & Cloud Data
Mid-Level
18問Feature Engineering
Mid-Level
22問教師あり機械学習:回帰
Mid-Level
24問教師あり機械学習:分類
Mid-Level
24問決定木とアンサンブル
Mid-Level
24問教師なしML
Mid-Level
22問MLパイプラインと検証
Mid-Level
22問時系列と予測
Mid-Level
22問Deep Learningの基礎
Senior
24問TensorFlow & Keras
Senior
22問CNN と画像分類
Senior
24問RNNとシーケンス
Senior
22問TransformersとAttention
Senior
24問NLPとHugging Face
Senior
24問GenAIとLangChain
Senior
24問MLOps とデプロイ
Senior
24問