
CI/CD y calidad de código
Ruff, Pylint, Poetry, GitHub Actions, pipelines CI/CD, pruebas automatizadas, pre-commit hooks, code coverage
1¿Qué es Ruff en el ecosistema Python?
¿Qué es Ruff en el ecosistema Python?
Respuesta
Ruff es un linter y formateador de Python extremadamente rápido escrito en Rust. Reemplaza con ventaja herramientas como Flake8, isort y Black ofreciendo un rendimiento 10 a 100 veces superior. Ruff soporta más de 700 reglas de linting y se integra fácilmente en pipelines CI/CD y pre-commit hooks.
2¿Cuál es el rol principal del archivo pyproject.toml con Poetry?
¿Cuál es el rol principal del archivo pyproject.toml con Poetry?
Respuesta
El archivo pyproject.toml es el archivo de configuración central de un proyecto Python con Poetry. Define los metadatos del proyecto (nombre, versión, descripción), las dependencias de producción y desarrollo, los scripts y las configuraciones de herramientas como Ruff o pytest. Este archivo estandarizado reemplaza setup.py, requirements.txt y setup.cfg.
3¿Qué comando de Poetry instala todas las dependencias de un proyecto existente?
¿Qué comando de Poetry instala todas las dependencias de un proyecto existente?
Respuesta
El comando poetry install lee los archivos pyproject.toml y poetry.lock para instalar todas las dependencias del proyecto en un entorno virtual aislado. Si poetry.lock existe, se utilizan las versiones exactas para garantizar la reproducibilidad. De lo contrario, Poetry resuelve las dependencias y crea el archivo lock.
¿Qué es un pre-commit hook en el contexto de Git?
¿Cuál es la estructura básica de un workflow de GitHub Actions?
+17 preguntas de entrevista
Otros temas de entrevista Data Engineering
Linux & Shell - Fundamentos
Git & GitHub - Fundamentos
Python avanzado para Data Engineering
Docker - Fundamentos
Google Cloud Platform - Fundamentos
Docker Compose
FastAPI - APIs de datos
SQL avanzado para Data Engineering
Data Lake - Arquitectura e ingesta
BigQuery para Data Engineering
PostgreSQL - Administración
Data Modeling para Data Engineering
Fivetran & Airbyte - Ingesta de datos
dbt - Fundamentos
Apache Airflow - Fundamentos
Kubernetes - Fundamentos
dbt - Funcionalidades avanzadas
Patrones ETL / ELT / ETLT
Apache Airflow - Avanzado
Airflow + dbt - Orquestación de pipelines
PySpark - Procesamiento a gran escala
Google Pub/Sub - Streaming de datos
Apache Beam & Dataflow
Kubernetes - Producción y escalado
Terraform - Infrastructure as Code
Bases de datos NoSQL
Arquitectura Data moderna
Monitoreo y observabilidad
IAM y seguridad de datos
Domina Data Engineering para tu próxima entrevista
Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.
Empieza gratis