1
Linux e Shell: comandi essenziali, script bash, permessi, cron job
2
Git e GitHub: branching, merge, rebase, pull request, workflow CI/CD
3
Python avanzato: OOP, decorator, generator, context manager, typing, async/await
4
CI/CD: linting (Ruff, Pylint), packaging (Poetry), test, GitHub Actions, pipeline
5
Docker: Dockerfile, immagini, container, volumi, reti, multi-stage build
6
Docker Compose: servizi multi-container, dipendenze, healthcheck, orchestrazione locale
7
FastAPI: route, modelli Pydantic, dipendenze, middleware, distribuzione
8
SQL avanzato: window function, CTE, query analitiche, ottimizzazione, indicizzazione
9
BigQuery: architettura serverless, partizionamento, clustering, costi, UDF, query federate
10
PostgreSQL: configurazione, replica, indicizzazione (B-tree, GIN, GiST), VACUUM, EXPLAIN ANALYZE
11
Modellazione dati: schema a stella, tabelle fact/dimension, normalizzazione, SCD, data vault
12
ELT vs ETL vs ETLT: pattern, trade-off, scelte architetturali
13
Fivetran e Airbyte: connettori, modalità di sincronizzazione, CDC, evoluzione schema
14
dbt: modelli, source, ref, test, snapshot, modelli incrementali, macro Jinja
15
Apache Airflow: DAG, operatori, sensori, XCom, connessioni, pool, dipendenze dei task
16
PySpark: RDD vs DataFrame, trasformazioni, azioni, partizionamento, variabili broadcast
17
Streaming: Pub/Sub (topic, subscription), Apache Beam (PCollection, trasformazioni, windowing), Dataflow
18
Kubernetes: pod, deployment, service, ingress, ConfigMap, Secret, Helm, scaling
19
Terraform: provider, risorse, state, moduli, plan/apply, infrastructure as code
20
IAM e sicurezza: principio del privilegio minimo, account di servizio, ruoli GCP
21
Database NoSQL: GraphDB (Neo4j), Document DB (MongoDB, Firestore), Wide Column (Cassandra, Bigtable)
22
Architettura dati: Data Lake vs Data Warehouse vs Data Lakehouse, Data Mesh, Data Contract
23
Monitoraggio e osservabilità: logging, metriche, alerting, SLA/SLO/SLI, controlli qualità dati