Question 1

Was ist die Nullhypothese (H₀) bei einem Hypothesentest?

Accepted Answer

Die Nullhypothese (H₀) ist die Standardaussage, die davon ausgeht, dass kein Effekt oder signifikanter Unterschied existiert. Es ist die Hypothese, die wir basierend auf den gesammelten Daten zu verwerfen oder nicht zu verwerfen versuchen. Zum Beispiel könnte H₀ besagen, dass eine neue Behandlung im Vergleich zu einem Placebo keine Wirkung hat. Der statistische Test bewertet, ob die Daten ausreichende Belege liefern, um diese Hypothese zugunsten der Alternativhypothese (H₁) zu verwerfen.

Question 2

Was stellt der p-Wert in einem statistischen Test dar?

Accepted Answer

Der p-Wert ist die Wahrscheinlichkeit, ein Ergebnis zu erhalten, das mindestens so extrem ist wie das beobachtete, unter der Annahme, dass die Nullhypothese wahr ist. Ein niedriger p-Wert (typischerweise < 0,05) zeigt an, dass die beobachteten Daten unter H₀ unwahrscheinlich sind, was zu deren Verwerfung führt. Hinweis: Der p-Wert ist weder die Wahrscheinlichkeit, dass H₀ wahr ist, noch die Wahrscheinlichkeit, dass die Ergebnisse auf Zufall beruhen.

Question 3

Was ist ein Fehler erster Art in der Inferenzstatistik?

Accepted Answer

Ein Fehler erster Art (falsch positiv) tritt auf, wenn wir die Nullhypothese verwerfen, obwohl sie tatsächlich wahr ist. Das Signifikanzniveau α (oft 0,05) repräsentiert die maximal akzeptable Wahrscheinlichkeit, diesen Fehler zu machen. Zum Beispiel stellt die Schlussfolgerung, dass ein Medikament wirksam ist, wenn es das nicht ist, einen Fehler erster Art dar. Dieser Fehler wird durch die Wahl des Signifikanzniveaus kontrolliert.

Inferenzstatistik

Was ist die Nullhypothese (H₀) bei einem Hypothesentest?

Antwort

Was stellt der p-Wert in einem statistischen Test dar?

Antwort

Was ist ein Fehler erster Art in der Inferenzstatistik?

Antwort

Was ist ein Fehler zweiter Art in der Inferenzstatistik?

Was stellt ein 95%-Konfidenzintervall dar?

Weitere Data Science & ML-Interviewthemen

Python-Grundlagen

Python Objektorientierte Programmierung

Python-Datenstrukturen

Git-Grundlagen

SQL-Grundlagen

NumPy-Grundlagen

Pandas-Grundlagen

Jupyter & Google Colab

SQL Joins & fortgeschrittene Abfragen

Fortgeschrittenes Pandas

Visualisierung mit Matplotlib & Seaborn

Interaktive Visualisierungen mit Plotly

Deskriptive Statistik

Web Scraping

BigQuery & Cloud Data

Feature Engineering

Überwachtes ML: Regression

Überwachtes ML: Klassifikation

Entscheidungsbäume & Ensembles

Unüberwachtes ML

ML-Pipelines & Validierung

Zeitreihen & Prognosen

Grundlagen des Deep Learning

TensorFlow & Keras

CNN und Bildklassifizierung

RNN & Sequenzen

Transformers & Attention

NLP & Hugging Face

GenAI & LangChain

MLOps und Deployment

Meistere Data Science & ML für dein nächstes Interview