
Statistiques descriptives
Moyenne vs médiane, variance, écart-type, distribution normale, asymétrie, corrélation vs causalité, biais d'échantillonnage, percentiles
1Quelle mesure de tendance centrale représente la valeur qui divise un jeu de données trié en deux moitiés égales ?
Quelle mesure de tendance centrale représente la valeur qui divise un jeu de données trié en deux moitiés égales ?
Réponse
La médiane est la valeur centrale d'un jeu de données trié par ordre croissant. Elle sépare exactement 50 % des valeurs inférieures et 50 % des valeurs supérieures. Contrairement à la moyenne, la médiane n'est pas affectée par les valeurs extrêmes, ce qui en fait un indicateur plus robuste pour les distributions asymétriques comme les revenus ou les prix immobiliers.
2Quelle est la différence fondamentale entre la moyenne et la médiane ?
Quelle est la différence fondamentale entre la moyenne et la médiane ?
Réponse
La moyenne prend en compte toutes les valeurs et est donc sensible aux valeurs extrêmes (outliers), tandis que la médiane ne dépend que de la position centrale des données triées. Par exemple, si cinq salaires sont 30k, 35k, 40k, 45k et 500k, la moyenne est tirée vers le haut par 500k (130k), alors que la médiane reste à 40k, reflétant mieux la réalité du groupe.
3Qu'est-ce que le mode dans un jeu de données ?
Qu'est-ce que le mode dans un jeu de données ?
Réponse
Le mode est la valeur qui apparaît le plus fréquemment dans un jeu de données. Un jeu de données peut être unimodal (un seul mode), bimodal (deux modes) ou multimodal (plusieurs modes). Le mode est la seule mesure de tendance centrale utilisable avec des données catégorielles, comme la couleur préférée ou la catégorie de produit la plus vendue.
Que mesure la variance dans un jeu de données ?
Quel est le lien entre la variance et l'écart-type ?
+17 questions d'entretien
Autres sujets d'entretien Data Analytics
Google Sheets - Les fondamentaux
Google Sheets - Formules avancées
SQL - Les fondamentaux
SQL - Agrégations et groupements
SQL - Jointures
BigQuery - Fondamentaux
Data Cleaning - Nettoyage des données
KPIs et métriques business
Zapier et automatisation No-Code
Principes de data visualisation
Python & Pandas - Fondamentaux
Google Sheets - Dashboards automatisés
SQL - Sous-requêtes et CTEs
SQL - Window Functions
BigQuery - Fonctionnalités avancées
Data Modeling
Analyse de funnels et conversion
Analyse de cohortes et rétention
Google Tag Manager et tracking
APIs et webhooks
dbt - Fondamentaux
AB Testing et statistiques appliquées
Looker Studio (Google Data Studio)
Power BI - Fondamentaux
SQL - Requêtes analytiques avancées
dbt - Fonctionnalités avancées
Power BI - DAX et dashboards avancés
Python Analytics - Analyse avancée et ML
Maîtrise Data Analytics pour ton prochain entretien
Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.
Commencer gratuitement