
Überwachtes ML: Klassifikation
Logistische Regression, KNN, SVM, Metriken (Accuracy, Precision, Recall, F1, ROC-AUC), Schwellenwerte
1Was ist das Hauptziel eines überwachten Klassifikationsalgorithmus?
Was ist das Hauptziel eines überwachten Klassifikationsalgorithmus?
Antwort
Überwachte Klassifikation zielt darauf ab, eine Kategorie oder Klasse (diskrete Variable) aus Eingabe-Features vorherzusagen, indem aus gelabelten Daten gelernt wird. Im Gegensatz zur Regression, die kontinuierliche Werte vorhersagt, weist die Klassifikation jede Beobachtung einer vordefinierten Klasse zu (binär oder Multiklasse).
2Welche mathematische Funktion verwendet die logistische Regression, um Vorhersagen in Wahrscheinlichkeiten umzuwandeln?
Welche mathematische Funktion verwendet die logistische Regression, um Vorhersagen in Wahrscheinlichkeiten umzuwandeln?
Antwort
Die Sigmoid-Funktion (oder logistische Funktion) transformiert jeden reellen Wert in eine Wahrscheinlichkeit zwischen 0 und 1. Sie ist definiert als sigma(z) = 1/(1+e^(-z)). Diese Funktion ermöglicht die Interpretation der Ausgabe als Wahrscheinlichkeit der Zugehörigkeit zur positiven Klasse.
3Was repräsentieren die Koeffizienten in einem logistischen Regressionsmodell?
Was repräsentieren die Koeffizienten in einem logistischen Regressionsmodell?
Antwort
Logistische Regressionskoeffizienten repräsentieren die Veränderung der Log-Odds für jede Einheitsänderung des entsprechenden Features. Ein positiver Koeffizient erhöht die Wahrscheinlichkeit der positiven Klasse, während ein negativer Koeffizient sie verringert. Die Exponentialfunktion des Koeffizienten ergibt das Odds Ratio.
Wie funktioniert der K-Nearest Neighbors (KNN) Algorithmus für die Klassifikation?
Welche Auswirkungen hat die Wahl des Wertes k im KNN-Algorithmus?
+21 Interview-Fragen
Weitere Data Science & ML-Interviewthemen
Python-Grundlagen
Python Objektorientierte Programmierung
Python-Datenstrukturen
Git-Grundlagen
SQL-Grundlagen
NumPy-Grundlagen
Pandas-Grundlagen
Jupyter & Google Colab
SQL Joins & fortgeschrittene Abfragen
Fortgeschrittenes Pandas
Visualisierung mit Matplotlib & Seaborn
Interaktive Visualisierungen mit Plotly
Deskriptive Statistik
Inferenzstatistik
Web Scraping
BigQuery & Cloud Data
Feature Engineering
Überwachtes ML: Regression
Entscheidungsbäume & Ensembles
Unüberwachtes ML
ML-Pipelines & Validierung
Zeitreihen & Prognosen
Grundlagen des Deep Learning
TensorFlow & Keras
CNN und Bildklassifizierung
RNN & Sequenzen
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps und Deployment
Meistere Data Science & ML für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten