1
Linux та Shell: основні команди, bash-скрипти, дозволи, cron-завдання
2
Git та GitHub: гілки, merge, rebase, pull request, CI/CD-процеси
3
Розширений Python: ООП, декоратори, генератори, контекстні менеджери, typing, async/await
4
CI/CD: linting (Ruff, Pylint), пакування (Poetry), тести, GitHub Actions, pipeline
5
Docker: Dockerfile, образи, контейнери, томи, мережі, multi-stage build
6
Docker Compose: багатоконтейнерні сервіси, залежності, healthcheck, локальна оркестрація
7
FastAPI: маршрути, моделі Pydantic, залежності, middleware, розгортання
8
Розширений SQL: window function, CTE, аналітичні запити, оптимізація, індексування
9
BigQuery: serverless-архітектура, розділення, кластеризація, витрати, UDF, федеративні запити
10
PostgreSQL: конфігурація, реплікація, індексування (B-tree, GIN, GiST), VACUUM, EXPLAIN ANALYZE
11
Моделювання даних: схема зірки, таблиці фактів/вимірів, нормалізація, SCD, data vault
12
ELT vs ETL vs ETLT: патерни, компроміси, архітектурні рішення
13
Fivetran та Airbyte: конектори, режими синхронізації, CDC, еволюція схеми
14
dbt: моделі, джерела, ref, тести, snapshot, інкрементальні моделі, Jinja-макроси
15
Apache Airflow: DAG, оператори, сенсори, XCom, з'єднання, пули, залежності завдань
16
PySpark: RDD vs DataFrame, трансформації, дії, розділення, broadcast-змінні
17
Streaming: Pub/Sub (теми, підписки), Apache Beam (PCollection, трансформації, windowing), Dataflow
18
Kubernetes: pod, deployment, service, ingress, ConfigMap, Secret, Helm, масштабування
19
Terraform: провайдери, ресурси, стан, модулі, plan/apply, infrastructure as code
20
IAM та безпека: принцип мінімальних привілеїв, сервісні акаунти, ролі GCP
21
NoSQL бази даних: GraphDB (Neo4j), Document DB (MongoDB, Firestore), Wide Column (Cassandra, Bigtable)
22
Архітектура даних: Data Lake vs Data Warehouse vs Data Lakehouse, Data Mesh, Data Contract
23
Моніторинг та спостережуваність: логування, метрики, сповіщення, SLA/SLO/SLI, перевірки якості даних