Question 1

¿Qué es Ruff en el ecosistema Python?

Accepted Answer

Ruff es un linter y formateador de Python extremadamente rápido escrito en Rust. Reemplaza con ventaja herramientas como Flake8, isort y Black ofreciendo un rendimiento 10 a 100 veces superior. Ruff soporta más de 700 reglas de linting y se integra fácilmente en pipelines CI/CD y pre-commit hooks.

Question 2

¿Cuál es el rol principal del archivo pyproject.toml con Poetry?

Accepted Answer

El archivo pyproject.toml es el archivo de configuración central de un proyecto Python con Poetry. Define los metadatos del proyecto (nombre, versión, descripción), las dependencias de producción y desarrollo, los scripts y las configuraciones de herramientas como Ruff o pytest. Este archivo estandarizado reemplaza setup.py, requirements.txt y setup.cfg.

Question 3

¿Qué comando de Poetry instala todas las dependencias de un proyecto existente?

Accepted Answer

El comando poetry install lee los archivos pyproject.toml y poetry.lock para instalar todas las dependencias del proyecto en un entorno virtual aislado. Si poetry.lock existe, se utilizan las versiones exactas para garantizar la reproducibilidad. De lo contrario, Poetry resuelve las dependencias y crea el archivo lock.

CI/CD y calidad de código

¿Qué es Ruff en el ecosistema Python?

Respuesta

¿Cuál es el rol principal del archivo pyproject.toml con Poetry?

Respuesta

¿Qué comando de Poetry instala todas las dependencias de un proyecto existente?

Respuesta

¿Qué es un pre-commit hook en el contexto de Git?

¿Cuál es la estructura básica de un workflow de GitHub Actions?

Otros temas de entrevista Data Engineering

Linux & Shell - Fundamentos

Git & GitHub - Fundamentos

Python avanzado para Data Engineering

Docker - Fundamentos

Google Cloud Platform - Fundamentos

Docker Compose

FastAPI - APIs de datos

SQL avanzado para Data Engineering

Data Lake - Arquitectura e ingesta

BigQuery para Data Engineering

PostgreSQL - Administración

Data Modeling para Data Engineering

Fivetran & Airbyte - Ingesta de datos

dbt - Fundamentos

Apache Airflow - Fundamentos

Kubernetes - Fundamentos

dbt - Funcionalidades avanzadas

Patrones ETL / ELT / ETLT

Apache Airflow - Avanzado

Airflow + dbt - Orquestación de pipelines

PySpark - Procesamiento a gran escala

Google Pub/Sub - Streaming de datos

Apache Beam & Dataflow

Kubernetes - Producción y escalado

Terraform - Infrastructure as Code

Bases de datos NoSQL

Arquitectura Data moderna

Monitoreo y observabilidad

IAM y seguridad de datos

Domina Data Engineering para tu próxima entrevista