
ML Supervisé : Classification
Régression logistique, KNN, SVM, métriques (accuracy, precision, recall, F1, ROC-AUC), seuils
1Quel est l'objectif principal d'un algorithme de classification supervisée ?
Quel est l'objectif principal d'un algorithme de classification supervisée ?
Réponse
La classification supervisée vise à prédire une catégorie ou classe (variable discrète) à partir de features d'entrée, en apprenant sur des données étiquetées. Contrairement à la régression qui prédit des valeurs continues, la classification attribue chaque observation à une classe prédéfinie (binaire ou multiclasse).
2Quelle fonction mathématique est utilisée par la régression logistique pour transformer les prédictions en probabilités ?
Quelle fonction mathématique est utilisée par la régression logistique pour transformer les prédictions en probabilités ?
Réponse
La fonction sigmoid (ou logistique) transforme n'importe quelle valeur réelle en une probabilité entre 0 et 1. Elle est définie par sigma(z) = 1/(1+e^(-z)). Cette fonction permet d'interpréter la sortie comme la probabilité d'appartenance à la classe positive.
3Que représentent les coefficients dans un modèle de régression logistique ?
Que représentent les coefficients dans un modèle de régression logistique ?
Réponse
Les coefficients de la régression logistique représentent le changement du log-odds (logarithme du rapport de cotes) pour chaque unité de changement de la feature correspondante. Un coefficient positif augmente la probabilité de la classe positive, tandis qu'un coefficient négatif la diminue. L'exponentielle du coefficient donne l'odds ratio.
Comment fonctionne l'algorithme K-Nearest Neighbors (KNN) pour la classification ?
Quel est l'impact du choix de la valeur k dans l'algorithme KNN ?
+21 questions d'entretien
Autres sujets d'entretien Data Science & ML
Les bases de Python
Programmation Orientée Objet Python
Structures de données Python
Fondamentaux Git
Les bases de SQL
Fondamentaux NumPy
Les bases de Pandas
Jupyter & Google Colab
SQL Joins & Requêtes avancées
Pandas avancé
Visualisation avec Matplotlib & Seaborn
Visualisations interactives avec Plotly
Statistiques descriptives
Statistiques inférentielles
Web Scraping
BigQuery & Cloud Data
Feature Engineering
ML Supervisé : Régression
Arbres de décision & Ensembles
ML Non supervisé
Pipelines ML & Validation
Séries temporelles & Prévisions
Fondamentaux Deep Learning
TensorFlow & Keras
CNN & Classification d'images
RNN & Séquences
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps & Déploiement
Maîtrise Data Science & ML pour ton prochain entretien
Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.
Commencer gratuitement