1
Linux e Shell: comandos essenciais, scripting bash, permissões, cron jobs
2
Git e GitHub: branching, merge, rebase, pull requests, CI/CD workflows
3
Python avançado: POO, decorators, generators, context managers, typing, async/await
4
CI/CD: linting (Ruff, Pylint), packaging (Poetry), tests, GitHub Actions, pipelines
5
Docker: Dockerfile, imagens, contêineres, volumes, networks, multi-stage builds
6
Docker Compose: serviços multi-contêiner, dependências, healthchecks, orquestração local
7
FastAPI: rotas, modelos Pydantic, dependências, middleware, implantação
8
SQL avançado: window functions, CTEs, consultas analíticas, otimização, indexação
9
BigQuery: arquitetura serverless, particionamento, clustering, custos, UDFs, federated queries
10
PostgreSQL: configuração, replicação, indexação (B-tree, GIN, GiST), VACUUM, EXPLAIN ANALYZE
11
Modelagem de Dados: esquema estrela, tabelas fato/dimensão, normalização, SCD, data vault
12
ELT vs ETL vs ETLT: padrões, trade-offs, decisões de arquitetura
13
Fivetran e Airbyte: conectores, modos de sincronização, CDC, evolução de esquema
14
dbt: models, sources, refs, tests, snapshots, incremental models, Jinja macros
15
Apache Airflow: DAGs, operators, sensors, XCom, connections, pools, dependências de tarefas
16
PySpark: RDD vs DataFrame, transformações, actions, partitioning, broadcast variables
17
Streaming: Pub/Sub (topics, subscriptions), Apache Beam (PCollections, transforms, windowing), Dataflow
18
Kubernetes: pods, deployments, services, ingress, ConfigMaps, Secrets, Helm, scaling
19
Terraform: providers, resources, state, modules, plan/apply, infrastructure as code
20
IAM e segurança: princípios de privilégio mínimo, service accounts, roles do GCP
21
Bancos de dados NoSQL: GraphDB (Neo4j), Document DBs (MongoDB, Firestore), Wide Column (Cassandra, Bigtable)
22
Arquitetura de dados: Data Lake vs Data Warehouse vs Data Lakehouse, Data Mesh, Data Contracts
23
Monitoramento e observabilidade: logging, métricas, alertas, SLA/SLO/SLI, data quality checks