
Inferenzstatistik
Hypothesentests, Konfidenzintervalle, p-Wert, t-Test, Chi-Quadrat, ANOVA, lineare Regression
1Was ist die Nullhypothese (H₀) bei einem Hypothesentest?
Was ist die Nullhypothese (H₀) bei einem Hypothesentest?
Antwort
Die Nullhypothese (H₀) ist die Standardaussage, die davon ausgeht, dass kein Effekt oder signifikanter Unterschied existiert. Es ist die Hypothese, die wir basierend auf den gesammelten Daten zu verwerfen oder nicht zu verwerfen versuchen. Zum Beispiel könnte H₀ besagen, dass eine neue Behandlung im Vergleich zu einem Placebo keine Wirkung hat. Der statistische Test bewertet, ob die Daten ausreichende Belege liefern, um diese Hypothese zugunsten der Alternativhypothese (H₁) zu verwerfen.
2Was stellt der p-Wert in einem statistischen Test dar?
Was stellt der p-Wert in einem statistischen Test dar?
Antwort
Der p-Wert ist die Wahrscheinlichkeit, ein Ergebnis zu erhalten, das mindestens so extrem ist wie das beobachtete, unter der Annahme, dass die Nullhypothese wahr ist. Ein niedriger p-Wert (typischerweise < 0,05) zeigt an, dass die beobachteten Daten unter H₀ unwahrscheinlich sind, was zu deren Verwerfung führt. Hinweis: Der p-Wert ist weder die Wahrscheinlichkeit, dass H₀ wahr ist, noch die Wahrscheinlichkeit, dass die Ergebnisse auf Zufall beruhen.
3Was ist ein Fehler erster Art in der Inferenzstatistik?
Was ist ein Fehler erster Art in der Inferenzstatistik?
Antwort
Ein Fehler erster Art (falsch positiv) tritt auf, wenn wir die Nullhypothese verwerfen, obwohl sie tatsächlich wahr ist. Das Signifikanzniveau α (oft 0,05) repräsentiert die maximal akzeptable Wahrscheinlichkeit, diesen Fehler zu machen. Zum Beispiel stellt die Schlussfolgerung, dass ein Medikament wirksam ist, wenn es das nicht ist, einen Fehler erster Art dar. Dieser Fehler wird durch die Wahl des Signifikanzniveaus kontrolliert.
Was ist ein Fehler zweiter Art in der Inferenzstatistik?
Was stellt ein 95%-Konfidenzintervall dar?
+21 Interview-Fragen
Weitere Data Science & ML-Interviewthemen
Python-Grundlagen
Python Objektorientierte Programmierung
Python-Datenstrukturen
Git-Grundlagen
SQL-Grundlagen
NumPy-Grundlagen
Pandas-Grundlagen
Jupyter & Google Colab
SQL Joins & fortgeschrittene Abfragen
Fortgeschrittenes Pandas
Visualisierung mit Matplotlib & Seaborn
Interaktive Visualisierungen mit Plotly
Deskriptive Statistik
Web Scraping
BigQuery & Cloud Data
Feature Engineering
Überwachtes ML: Regression
Überwachtes ML: Klassifikation
Entscheidungsbäume & Ensembles
Unüberwachtes ML
ML-Pipelines & Validierung
Zeitreihen & Prognosen
Grundlagen des Deep Learning
TensorFlow & Keras
CNN und Bildklassifizierung
RNN & Sequenzen
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps und Deployment
Meistere Data Science & ML für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten