1
Linux āđāļĨāļ° Shell: āļāļģāļŠāļąāđāļāļāļ·āđāļāļāļēāļ, bash scripting, āļŠāļīāļāļāļīāđ, cron job
2
Git āđāļĨāļ° GitHub: āļāļēāļĢāđāļāļāļŠāļēāļāļē, merge, rebase, pull request, workflow CI/CD
3
Python āļāļąāđāļāļŠāļđāļ: OOP, decorator, generator, context manager, typing, async/await
4
CI/CD: linting (Ruff, Pylint), āļāļēāļĢāļāļąāļāđāļāđāļāđāļāļ (Poetry), test, GitHub Actions, pipeline
5
Docker: Dockerfile, image, container, volume, network, multi-stage build
6
Docker Compose: āļāļĢāļīāļāļēāļĢāļŦāļĨāļēāļĒ container, āļāļēāļĢāļāļķāđāļāļāļē, healthcheck, āļāļēāļĢāļāļąāļāļāļēāļĢāđāļāđāļāļĢāļ·āđāļāļ
7
FastAPI: route, āđāļĄāđāļāļĨ Pydantic, dependency, middleware, āļāļēāļĢ deploy
8
SQL āļāļąāđāļāļŠāļđāļ: window function, CTE, āļāļīāļ§āļĢāļĩāļ§āļīāđāļāļĢāļēāļ°āļŦāđ, āļāļēāļĢāđāļāļīāđāļĄāļāļĢāļ°āļŠāļīāļāļāļīāļ āļēāļ, index
9
BigQuery: āļŠāļāļēāļāļąāļāļĒāļāļĢāļĢāļĄ serverless, āļāļēāļĢāđāļāđāļāļāļēāļĢāđāļāļīāļāļąāļ, āļāļĨāļąāļŠāđāļāļāļĢāđ, āļāđāļāļāļļāļ, UDF, āļāļīāļ§āļĢāļĩāđāļāļ federated
10
PostgreSQL: āļāļēāļĢāļāļąāđāļāļāđāļē, āļāļēāļĢāļāļģāļĨāļāļ, index (B-tree, GIN, GiST), VACUUM, EXPLAIN ANALYZE
11
āļāļēāļĢāļŠāļĢāđāļēāļāđāļĄāđāļāļĨāļāđāļāļĄāļđāļĨ: star schema, āļāļēāļĢāļēāļ fact/dimension, normalization, SCD, data vault
12
ELT vs ETL vs ETLT: āļĢāļđāļāđāļāļ, āļāļēāļĢāđāļĨāļāđāļāļĨāļĩāđāļĒāļ, āļāļēāļāđāļĨāļ·āļāļāļŠāļāļēāļāļąāļāļĒāļāļĢāļĢāļĄ
13
Fivetran āđāļĨāļ° Airbyte: connector, āđāļŦāļĄāļāļāļēāļĢāļāļīāļāļāđ, CDC, āļāļēāļĢāļāļąāļāļāļē schema
14
dbt: model, source, ref, test, snapshot, model āđāļāļīāđāļĄāļāļĩāļĨāļ°āļŠāđāļ§āļ, Jinja macro
15
Apache Airflow: DAG, operator, sensor, XCom, connection, pool, āļāļēāļĢāļāļķāđāļāļāļēāļāļēāļ
16
PySpark: RDD vs DataFrame, āļāļēāļĢāđāļāļĨāļ, action, āļāļēāļĢāđāļāđāļāļāļēāļĢāđāļāļīāļāļąāļ, āļāļąāļ§āđāļāļĢ broadcast
17
Streaming: Pub/Sub (topic, subscription), Apache Beam (PCollection, transform, windowing), Dataflow
18
Kubernetes: pod, deployment, service, ingress, ConfigMap, Secret, Helm, āļāļēāļĢāļāļĢāļąāļāļāļāļēāļ
19
Terraform: provider, resource, state, module, plan/apply, infrastructure as code
20
IAM āđāļĨāļ°āļāļ§āļēāļĄāļāļĨāļāļāļ āļąāļĒ: āļŦāļĨāļąāļāļŠāļīāļāļāļīāđāļāđāļāļĒāļāļĩāđāļŠāļļāļ, service account, āļāļāļāļēāļ GCP
21
āļāļēāļāļāđāļāļĄāļđāļĨ NoSQL: GraphDB (Neo4j), Document DB (MongoDB, Firestore), Wide Column (Cassandra, Bigtable)
22
āļŠāļāļēāļāļąāļāļĒāļāļĢāļĢāļĄāļāđāļāļĄāļđāļĨ: Data Lake vs Data Warehouse vs Data Lakehouse, Data Mesh, Data Contract
23
āļāļēāļĢāļāļīāļāļāļēāļĄāđāļĨāļ°āļāļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļāđāļāļāļēāļĢāļŠāļąāļāđāļāļ: logging, āđāļĄāļāļĢāļīāļ, āļāļēāļĢāđāļāđāļāđāļāļ·āļāļ, SLA/SLO/SLI, āļāļēāļĢāļāļĢāļ§āļāļŠāļāļāļāļļāļāļ āļēāļāļāđāļāļĄāļđāļĨ