Question 1

Quel est l'objectif principal d'un algorithme de classification supervisée ?

Accepted Answer

La classification supervisée vise à prédire une catégorie ou classe (variable discrète) à partir de features d'entrée, en apprenant sur des données étiquetées. Contrairement à la régression qui prédit des valeurs continues, la classification attribue chaque observation à une classe prédéfinie (binaire ou multiclasse).

Question 2

Quelle fonction mathématique est utilisée par la régression logistique pour transformer les prédictions en probabilités ?

Accepted Answer

La fonction sigmoid (ou logistique) transforme n'importe quelle valeur réelle en une probabilité entre 0 et 1. Elle est définie par sigma(z) = 1/(1+e^(-z)). Cette fonction permet d'interpréter la sortie comme la probabilité d'appartenance à la classe positive.

Question 3

Que représentent les coefficients dans un modèle de régression logistique ?

Accepted Answer

Les coefficients de la régression logistique représentent le changement du log-odds (logarithme du rapport de cotes) pour chaque unité de changement de la feature correspondante. Un coefficient positif augmente la probabilité de la classe positive, tandis qu'un coefficient négatif la diminue. L'exponentielle du coefficient donne l'odds ratio.

ML Supervisé : Classification

Quel est l'objectif principal d'un algorithme de classification supervisée ?

Réponse

Quelle fonction mathématique est utilisée par la régression logistique pour transformer les prédictions en probabilités ?

Réponse

Que représentent les coefficients dans un modèle de régression logistique ?

Réponse

Comment fonctionne l'algorithme K-Nearest Neighbors (KNN) pour la classification ?

Quel est l'impact du choix de la valeur k dans l'algorithme KNN ?

Autres sujets d'entretien Data Science & ML

Les bases de Python

Programmation Orientée Objet Python

Structures de données Python

Fondamentaux Git

Les bases de SQL

Fondamentaux NumPy

Les bases de Pandas

Jupyter & Google Colab

SQL Joins & Requêtes avancées

Pandas avancé

Visualisation avec Matplotlib & Seaborn

Visualisations interactives avec Plotly

Statistiques descriptives

Statistiques inférentielles

Web Scraping

BigQuery & Cloud Data

Feature Engineering

ML Supervisé : Régression

Arbres de décision & Ensembles

ML Non supervisé

Pipelines ML & Validation

Séries temporelles & Prévisions

Fondamentaux Deep Learning

TensorFlow & Keras

CNN & Classification d'images

RNN & Séquences

Transformers & Attention

NLP & Hugging Face

GenAI & LangChain

MLOps & Déploiement

Maîtrise Data Science & ML pour ton prochain entretien