
CI/CD und Codequalität
Ruff, Pylint, Poetry, GitHub Actions, CI/CD-Pipelines, automatisierte Tests, pre-commit hooks, code coverage
1Was ist Ruff im Python-Ökosystem?
Was ist Ruff im Python-Ökosystem?
Antwort
Ruff ist ein extrem schneller Python-Linter und -Formatter, der in Rust geschrieben ist. Er ersetzt Tools wie Flake8, isort und Black vorteilhaft und bietet 10 bis 100 Mal bessere Leistung. Ruff unterstützt über 700 Linting-Regeln und integriert sich problemlos in CI/CD-Pipelines und pre-commit hooks.
2Was ist die Hauptrolle der pyproject.toml-Datei mit Poetry?
Was ist die Hauptrolle der pyproject.toml-Datei mit Poetry?
Antwort
Die pyproject.toml-Datei ist die zentrale Konfigurationsdatei für ein Python-Projekt mit Poetry. Sie definiert Projekt-Metadaten (Name, Version, Beschreibung), Produktions- und Entwicklungsabhängigkeiten, Skripte und Tool-Konfigurationen wie Ruff oder pytest. Diese standardisierte Datei ersetzt setup.py, requirements.txt und setup.cfg.
3Welcher Poetry-Befehl installiert alle Abhängigkeiten eines bestehenden Projekts?
Welcher Poetry-Befehl installiert alle Abhängigkeiten eines bestehenden Projekts?
Antwort
Der Befehl poetry install liest pyproject.toml und poetry.lock-Dateien, um alle Projektabhängigkeiten in einer isolierten virtuellen Umgebung zu installieren. Wenn poetry.lock existiert, werden exakte Versionen verwendet, um Reproduzierbarkeit zu gewährleisten. Andernfalls löst Poetry die Abhängigkeiten auf und erstellt die Lock-Datei.
Was ist ein pre-commit hook im Git-Kontext?
Wie sieht die Grundstruktur eines GitHub Actions-Workflows aus?
+17 Interview-Fragen
Weitere Data Engineering-Interviewthemen
Linux & Shell - Grundlagen
Git & GitHub - Grundlagen
Fortgeschrittenes Python für Data Engineering
Docker - Grundlagen
Google Cloud Platform - Grundlagen
Docker Compose
FastAPI - Daten-APIs
Fortgeschrittenes SQL für Data Engineering
Data Lake - Architektur und Ingestion
BigQuery für Data Engineering
PostgreSQL - Administration
Data Modeling für Data Engineering
Fivetran & Airbyte - Daten-Ingestion
dbt - Grundlagen
Apache Airflow - Grundlagen
Kubernetes - Grundlagen
dbt - Erweiterte Funktionen
ETL- / ELT- / ETLT-Patterns
Apache Airflow - Fortgeschritten
Airflow + dbt - Pipeline-Orchestrierung
PySpark - Verarbeitung im großen Maßstab
Google Pub/Sub - Daten-Streaming
Apache Beam & Dataflow
Kubernetes - Produktion und Skalierung
Terraform - Infrastructure as Code
NoSQL-Datenbanken
Moderne Data Architecture
Monitoring und Observability
IAM und Datensicherheit
Meistere Data Engineering für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten