
記述統計
平均値と中央値、分散、標準偏差、正規分布、歪度、相関と因果、サンプリングバイアス、パーセンタイル
20 面接問題·
Junior
1ソートされたデータセットを等しい2つの半分に分割する値を表す中心傾向の尺度はどれですか?
1
ソートされたデータセットを等しい2つの半分に分割する値を表す中心傾向の尺度はどれですか?
回答
中央値は昇順にソートされたデータセットの中央の値です。下位50%の値と上位50%の値を正確に分けます。平均値とは異なり、中央値は極端な値の影響を受けないため、所得や不動産価格のような歪んだ分布に対してより堅牢な指標となります。
2平均値と中央値の根本的な違いは何ですか?
2
平均値と中央値の根本的な違いは何ですか?
回答
平均値はすべての値を考慮するため極端な値(外れ値)の影響を受けますが、中央値はソートされたデータの中央位置のみに依存します。例えば、5つの給与が30k、35k、40k、45k、500kの場合、平均は500kによって上方に引き上げられ(130k)ますが、中央値は40kのままで、グループの実態をより良く反映します。
3データセットにおける最頻値とは何ですか?
3
データセットにおける最頻値とは何ですか?
回答
最頻値はデータセット内で最も頻繁に出現する値です。データセットは単峰性(1つの最頻値)、双峰性(2つの最頻値)、または多峰性(複数の最頻値)になり得ます。最頻値は、好きな色や最も売れている製品カテゴリなど、カテゴリカルデータで使用できる唯一の中心傾向の尺度です。
4
データセットにおいて分散は何を測定しますか?
5
分散と標準偏差の関係は何ですか?
+17 面接問題
その他のData Analytics面接トピック
Google Sheets - 基礎
Junior
20問Google Sheets - 高度な数式
Junior
20問SQL - 基礎
Junior
25問SQL - 集計とグルーピング
Junior
20問SQL - 結合
Junior
20問BigQuery - 基礎
Junior
20問Data Cleaning - データクレンジング
Junior
20問KPIとビジネスメトリクス
Junior
20問ZapierとNo-Codeオートメーション
Junior
20問データビジュアライゼーションの原則
Junior
20問Python & Pandas - 基礎
Junior
20問Google Sheets - 自動化ダッシュボード
Mid-Level
20問SQL - サブクエリとCTE
Mid-Level
20問SQL - Window Functions
Mid-Level
20問BigQuery - 高度な機能
Mid-Level
20問Data Modeling
Mid-Level
20問ファネルとコンバージョン分析
Mid-Level
20問コホートとリテンション分析
Mid-Level
20問Google Tag Managerとトラッキング
Mid-Level
20問APIとWebhook
Mid-Level
20問dbt - 基礎
Mid-Level
20問ABテストと応用統計学
Mid-Level
20問Looker Studio (Google Data Studio)
Mid-Level
20問Power BI - 基礎
Mid-Level
20問SQL - 高度な分析クエリ
Senior
20問dbt - 高度な機能
Senior
20問Power BI - DAXと高度なダッシュボード
Senior
20問Python Analytics - 高度な分析とML
Senior
20問