
Statistiques descriptives
Moyenne, médiane, écart-type, quartiles, distributions, corrélations, outliers, skewness
1Quelle mesure de tendance centrale est la plus appropriée pour des données contenant des valeurs extrêmes (outliers) ?
Quelle mesure de tendance centrale est la plus appropriée pour des données contenant des valeurs extrêmes (outliers) ?
Réponse
La médiane est la mesure de tendance centrale la plus robuste face aux outliers car elle représente la valeur centrale des données triées, sans être influencée par les valeurs extrêmes. Contrairement à la moyenne qui additionne toutes les valeurs, la médiane ne considère que la position. Par exemple, pour les salaires d'une entreprise avec quelques dirigeants très bien payés, la médiane donne une meilleure représentation du salaire typique que la moyenne.
2Qu'est-ce que la variance d'un ensemble de données ?
Qu'est-ce que la variance d'un ensemble de données ?
Réponse
La variance mesure la dispersion des données par rapport à leur moyenne. Elle se calcule comme la moyenne des carrés des écarts à la moyenne. En élevant au carré, on obtient des valeurs toujours positives et on amplifie l'impact des valeurs éloignées de la moyenne. L'unité de la variance est le carré de l'unité des données originales, c'est pourquoi on utilise souvent l'écart-type (racine carrée de la variance) pour interpréter la dispersion dans l'unité originale.
3Quelle est la relation entre l'écart-type et la variance ?
Quelle est la relation entre l'écart-type et la variance ?
Réponse
L'écart-type est la racine carrée de la variance. Cette transformation ramène la mesure de dispersion dans l'unité originale des données, ce qui facilite l'interprétation. Par exemple, si les données sont en euros, la variance sera en euros carrés (difficilement interprétable), tandis que l'écart-type sera en euros. L'écart-type est donc préféré pour communiquer la dispersion des données de manière intuitive.
Que représente le premier quartile (Q1) d'une distribution ?
Comment interpréter un coefficient de corrélation de Pearson égal à -0.85 ?
+17 questions d'entretien
Autres sujets d'entretien Data Science & ML
Les bases de Python
Programmation Orientée Objet Python
Structures de données Python
Fondamentaux Git
Les bases de SQL
Fondamentaux NumPy
Les bases de Pandas
Jupyter & Google Colab
SQL Joins & Requêtes avancées
Pandas avancé
Visualisation avec Matplotlib & Seaborn
Visualisations interactives avec Plotly
Statistiques inférentielles
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Supervisé : Régression
ML Supervisé : Classification
Arbres de décision & Ensembles
ML Non supervisé
Pipelines ML & Validation
Séries temporelles & Prévisions
Fondamentaux Deep Learning
TensorFlow & Keras
CNN & Classification d'images
RNN & Séquences
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps & Déploiement
Maîtrise Data Science & ML pour ton prochain entretien
Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.
Commencer gratuitement