Question 1

Was ist Ruff im Python-Ökosystem?

Accepted Answer

Ruff ist ein extrem schneller Python-Linter und -Formatter, der in Rust geschrieben ist. Er ersetzt Tools wie Flake8, isort und Black vorteilhaft und bietet 10 bis 100 Mal bessere Leistung. Ruff unterstützt über 700 Linting-Regeln und integriert sich problemlos in CI/CD-Pipelines und pre-commit hooks.

Question 2

Was ist die Hauptrolle der pyproject.toml-Datei mit Poetry?

Accepted Answer

Die pyproject.toml-Datei ist die zentrale Konfigurationsdatei für ein Python-Projekt mit Poetry. Sie definiert Projekt-Metadaten (Name, Version, Beschreibung), Produktions- und Entwicklungsabhängigkeiten, Skripte und Tool-Konfigurationen wie Ruff oder pytest. Diese standardisierte Datei ersetzt setup.py, requirements.txt und setup.cfg.

Question 3

Welcher Poetry-Befehl installiert alle Abhängigkeiten eines bestehenden Projekts?

Accepted Answer

Der Befehl poetry install liest pyproject.toml und poetry.lock-Dateien, um alle Projektabhängigkeiten in einer isolierten virtuellen Umgebung zu installieren. Wenn poetry.lock existiert, werden exakte Versionen verwendet, um Reproduzierbarkeit zu gewährleisten. Andernfalls löst Poetry die Abhängigkeiten auf und erstellt die Lock-Datei.

CI/CD und Codequalität

Was ist Ruff im Python-Ökosystem?

Antwort

Was ist die Hauptrolle der pyproject.toml-Datei mit Poetry?

Antwort

Welcher Poetry-Befehl installiert alle Abhängigkeiten eines bestehenden Projekts?

Antwort

Was ist ein pre-commit hook im Git-Kontext?

Wie sieht die Grundstruktur eines GitHub Actions-Workflows aus?

Weitere Data Engineering-Interviewthemen

Linux & Shell - Grundlagen

Git & GitHub - Grundlagen

Fortgeschrittenes Python für Data Engineering

Docker - Grundlagen

Google Cloud Platform - Grundlagen

Docker Compose

FastAPI - Daten-APIs

Fortgeschrittenes SQL für Data Engineering

Data Lake - Architektur und Ingestion

BigQuery für Data Engineering

PostgreSQL - Administration

Data Modeling für Data Engineering

Fivetran & Airbyte - Daten-Ingestion

dbt - Grundlagen

Apache Airflow - Grundlagen

Kubernetes - Grundlagen

dbt - Erweiterte Funktionen

ETL- / ELT- / ETLT-Patterns

Apache Airflow - Fortgeschritten

Airflow + dbt - Pipeline-Orchestrierung

PySpark - Verarbeitung im großen Maßstab

Google Pub/Sub - Daten-Streaming

Apache Beam & Dataflow

Kubernetes - Produktion und Skalierung

Terraform - Infrastructure as Code

NoSQL-Datenbanken

Moderne Data Architecture

Monitoring und Observability

IAM und Datensicherheit

Meistere Data Engineering für dein nächstes Interview