Data Science & ML

Statistiques descriptives

Moyenne, médiane, écart-type, quartiles, distributions, corrélations, outliers, skewness

20 questions d'entretien·
Confirmé
1

Quelle mesure de tendance centrale est la plus appropriée pour des données contenant des valeurs extrêmes (outliers) ?

Réponse

La médiane est la mesure de tendance centrale la plus robuste face aux outliers car elle représente la valeur centrale des données triées, sans être influencée par les valeurs extrêmes. Contrairement à la moyenne qui additionne toutes les valeurs, la médiane ne considère que la position. Par exemple, pour les salaires d'une entreprise avec quelques dirigeants très bien payés, la médiane donne une meilleure représentation du salaire typique que la moyenne.

2

Qu'est-ce que la variance d'un ensemble de données ?

Réponse

La variance mesure la dispersion des données par rapport à leur moyenne. Elle se calcule comme la moyenne des carrés des écarts à la moyenne. En élevant au carré, on obtient des valeurs toujours positives et on amplifie l'impact des valeurs éloignées de la moyenne. L'unité de la variance est le carré de l'unité des données originales, c'est pourquoi on utilise souvent l'écart-type (racine carrée de la variance) pour interpréter la dispersion dans l'unité originale.

3

Quelle est la relation entre l'écart-type et la variance ?

Réponse

L'écart-type est la racine carrée de la variance. Cette transformation ramène la mesure de dispersion dans l'unité originale des données, ce qui facilite l'interprétation. Par exemple, si les données sont en euros, la variance sera en euros carrés (difficilement interprétable), tandis que l'écart-type sera en euros. L'écart-type est donc préféré pour communiquer la dispersion des données de manière intuitive.

4

Que représente le premier quartile (Q1) d'une distribution ?

5

Comment interpréter un coefficient de corrélation de Pearson égal à -0.85 ?

+17 questions d'entretien

Maîtrise Data Science & ML pour ton prochain entretien

Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.

Commencer gratuitement