Data Analytics

Statistiques descriptives

Moyenne vs médiane, variance, écart-type, distribution normale, asymétrie, corrélation vs causalité, biais d'échantillonnage, percentiles

20 questions d'entretien·
Junior
1

Quelle mesure de tendance centrale représente la valeur qui divise un jeu de données trié en deux moitiés égales ?

Réponse

La médiane est la valeur centrale d'un jeu de données trié par ordre croissant. Elle sépare exactement 50 % des valeurs inférieures et 50 % des valeurs supérieures. Contrairement à la moyenne, la médiane n'est pas affectée par les valeurs extrêmes, ce qui en fait un indicateur plus robuste pour les distributions asymétriques comme les revenus ou les prix immobiliers.

2

Quelle est la différence fondamentale entre la moyenne et la médiane ?

Réponse

La moyenne prend en compte toutes les valeurs et est donc sensible aux valeurs extrêmes (outliers), tandis que la médiane ne dépend que de la position centrale des données triées. Par exemple, si cinq salaires sont 30k, 35k, 40k, 45k et 500k, la moyenne est tirée vers le haut par 500k (130k), alors que la médiane reste à 40k, reflétant mieux la réalité du groupe.

3

Qu'est-ce que le mode dans un jeu de données ?

Réponse

Le mode est la valeur qui apparaît le plus fréquemment dans un jeu de données. Un jeu de données peut être unimodal (un seul mode), bimodal (deux modes) ou multimodal (plusieurs modes). Le mode est la seule mesure de tendance centrale utilisable avec des données catégorielles, comme la couleur préférée ou la catégorie de produit la plus vendue.

4

Que mesure la variance dans un jeu de données ?

5

Quel est le lien entre la variance et l'écart-type ?

+17 questions d'entretien

Maîtrise Data Analytics pour ton prochain entretien

Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.

Commencer gratuitement