
CI/CD và chất lượng mã
Ruff, Pylint, Poetry, GitHub Actions, pipeline CI/CD, kiểm thử tự động, pre-commit hooks, code coverage
1Ruff trong hệ sinh thái Python là gì?
Ruff trong hệ sinh thái Python là gì?
Câu trả lời
Ruff là một linter và formatter Python cực kỳ nhanh được viết bằng Rust. Nó thay thế các công cụ như Flake8, isort và Black với hiệu suất nhanh hơn 10 đến 100 lần. Ruff hỗ trợ hơn 700 quy tắc linting và dễ dàng tích hợp vào pipeline CI/CD và pre-commit hooks.
2Vai trò chính của tệp pyproject.toml với Poetry là gì?
Vai trò chính của tệp pyproject.toml với Poetry là gì?
Câu trả lời
Tệp pyproject.toml là tệp cấu hình trung tâm cho dự án Python với Poetry. Nó định nghĩa metadata dự án (tên, phiên bản, mô tả), các phụ thuộc production và development, scripts và cấu hình công cụ như Ruff hoặc pytest. Tệp chuẩn hóa này thay thế setup.py, requirements.txt và setup.cfg.
3Lệnh Poetry nào cài đặt tất cả các phụ thuộc của một dự án hiện có?
Lệnh Poetry nào cài đặt tất cả các phụ thuộc của một dự án hiện có?
Câu trả lời
Lệnh poetry install đọc các tệp pyproject.toml và poetry.lock để cài đặt tất cả các phụ thuộc của dự án trong một virtual environment cô lập. Nếu poetry.lock tồn tại, các phiên bản chính xác được sử dụng để đảm bảo khả năng tái tạo. Nếu không, Poetry sẽ giải quyết các phụ thuộc và tạo tệp lock.
Pre-commit hook trong ngữ cảnh Git là gì?
Cấu trúc cơ bản của một workflow GitHub Actions là gì?
+17 câu hỏi phỏng vấn
Các chủ đề phỏng vấn Data Engineering khác
Linux & Shell - Cơ bản
Git & GitHub - Kiến thức cơ bản
Python nâng cao cho Data Engineering
Docker - Cơ bản
Google Cloud Platform - Cơ bản
Docker Compose
FastAPI - API dữ liệu
SQL nâng cao cho Data Engineering
Data Lake - Kiến trúc và nạp dữ liệu
BigQuery cho Data Engineering
PostgreSQL - Quản trị
Data Modeling cho Data Engineering
Fivetran & Airbyte - Nạp dữ liệu
dbt - Kiến thức cơ bản
Apache Airflow - Cơ bản
Kubernetes - Cơ Bản
dbt - Tính năng nâng cao
Mẫu ETL / ELT / ETLT
Apache Airflow - Nâng cao
Airflow + dbt - Điều phối pipeline
PySpark - Xử lý quy mô lớn
Google Pub/Sub - Streaming dữ liệu
Apache Beam & Dataflow
Kubernetes - Production và Scaling
Terraform - Infrastructure as Code
Cơ sở dữ liệu NoSQL
Data Architecture hiện đại
Giám sát và Khả năng quan sát
IAM và Bảo mật Dữ liệu
Nắm vững Data Engineering cho lần phỏng vấn tiếp theo
Truy cập tất cả câu hỏi, flashcards, bài kiểm tra kỹ thuật, bài tập code review và mô phỏng phỏng vấn.
Bắt đầu miễn phí