Question 1

Was ist das Hauptziel eines überwachten Klassifikationsalgorithmus?

Accepted Answer

Überwachte Klassifikation zielt darauf ab, eine Kategorie oder Klasse (diskrete Variable) aus Eingabe-Features vorherzusagen, indem aus gelabelten Daten gelernt wird. Im Gegensatz zur Regression, die kontinuierliche Werte vorhersagt, weist die Klassifikation jede Beobachtung einer vordefinierten Klasse zu (binär oder Multiklasse).

Question 2

Welche mathematische Funktion verwendet die logistische Regression, um Vorhersagen in Wahrscheinlichkeiten umzuwandeln?

Accepted Answer

Die Sigmoid-Funktion (oder logistische Funktion) transformiert jeden reellen Wert in eine Wahrscheinlichkeit zwischen 0 und 1. Sie ist definiert als sigma(z) = 1/(1+e^(-z)). Diese Funktion ermöglicht die Interpretation der Ausgabe als Wahrscheinlichkeit der Zugehörigkeit zur positiven Klasse.

Question 3

Was repräsentieren die Koeffizienten in einem logistischen Regressionsmodell?

Accepted Answer

Logistische Regressionskoeffizienten repräsentieren die Veränderung der Log-Odds für jede Einheitsänderung des entsprechenden Features. Ein positiver Koeffizient erhöht die Wahrscheinlichkeit der positiven Klasse, während ein negativer Koeffizient sie verringert. Die Exponentialfunktion des Koeffizienten ergibt das Odds Ratio.

Überwachtes ML: Klassifikation

Was ist das Hauptziel eines überwachten Klassifikationsalgorithmus?

Antwort

Welche mathematische Funktion verwendet die logistische Regression, um Vorhersagen in Wahrscheinlichkeiten umzuwandeln?

Antwort

Was repräsentieren die Koeffizienten in einem logistischen Regressionsmodell?

Antwort

Wie funktioniert der K-Nearest Neighbors (KNN) Algorithmus für die Klassifikation?

Welche Auswirkungen hat die Wahl des Wertes k im KNN-Algorithmus?

Weitere Data Science & ML-Interviewthemen

Python-Grundlagen

Python Objektorientierte Programmierung

Python-Datenstrukturen

Git-Grundlagen

SQL-Grundlagen

NumPy-Grundlagen

Pandas-Grundlagen

Jupyter & Google Colab

SQL Joins & fortgeschrittene Abfragen

Fortgeschrittenes Pandas

Visualisierung mit Matplotlib & Seaborn

Interaktive Visualisierungen mit Plotly

Deskriptive Statistik

Inferenzstatistik

Web Scraping

BigQuery & Cloud Data

Feature Engineering

Überwachtes ML: Regression

Entscheidungsbäume & Ensembles

Unüberwachtes ML

ML-Pipelines & Validierung

Zeitreihen & Prognosen

Grundlagen des Deep Learning

TensorFlow & Keras

CNN und Bildklassifizierung

RNN & Sequenzen

Transformers & Attention

NLP & Hugging Face

GenAI & LangChain

MLOps und Deployment

Meistere Data Science & ML für dein nächstes Interview