Question 1

Qual è il principio fondamentale da applicare nell'assegnazione dei permessi IAM in GCP?

Accepted Answer

Il principio del minimo privilegio (least privilege) consiste nel concedere solo i permessi strettamente necessari per svolgere un'attività. Nel Data Engineering, ciò significa che una pipeline dovrebbe avere accesso solo ai bucket, dataset e tabelle di cui ha effettivamente bisogno. Questo principio riduce la superficie di attacco e limita i danni potenziali in caso di compromissione di un service account.

Question 2

Qual è la differenza tra un service account e un account utente in GCP?

Accepted Answer

Un service account è un'identità progettata per applicazioni e servizi, mentre un account utente rappresenta una persona. I service account si autenticano usando chiavi JSON o Workload Identity, non hanno password e sono progettati per l'automazione. Nel Data Engineering, ogni pipeline dovrebbe avere il proprio service account con permessi specifici.

Question 3

Qual è la gerarchia dei ruoli IAM in GCP, dal meno al più permissivo?

Accepted Answer

La gerarchia dei ruoli IAM va da Viewer (sola lettura) a Editor (lettura/scrittura senza gestione IAM) a Owner (controllo completo inclusi IAM e fatturazione). Per le pipeline di dati, si consiglia di utilizzare ruoli predefiniti granulari come BigQuery Data Viewer o Storage Object Creator anziché questi ruoli primitivi troppo ampi.

IAM e sicurezza dei dati

Qual è il principio fondamentale da applicare nell'assegnazione dei permessi IAM in GCP?

Risposta

Qual è la differenza tra un service account e un account utente in GCP?

Risposta

Qual è la gerarchia dei ruoli IAM in GCP, dal meno al più permissivo?

Risposta

Perché evitare di usare chiavi JSON di service account in un ambiente di produzione GCP?

Qual è la differenza tra crittografia at rest e crittografia in transit?

Altri argomenti di colloquio Data Engineering

Linux & Shell - Fondamenti

Git & GitHub - Fondamenti

Python avanzato per Data Engineering

Docker - Fondamenti

Google Cloud Platform - Fondamenti

CI/CD e qualità del codice

Docker Compose

FastAPI - API per dati

SQL avanzato per il Data Engineering

Data Lake - Architettura e ingestione

BigQuery per il Data Engineering

PostgreSQL - Amministrazione

Data Modeling per Data Engineering

Fivetran & Airbyte - Ingestione dati

dbt - Fondamenti

Apache Airflow - Fondamenti

Kubernetes - Fondamenti

dbt - Funzionalità avanzate

Pattern ETL / ELT / ETLT

Apache Airflow - Avanzato

Airflow + dbt - Orchestrazione delle pipeline

PySpark - Elaborazione su larga scala

Google Pub/Sub - Streaming di dati

Apache Beam & Dataflow

Kubernetes - Produzione e scaling

Terraform - Infrastructure as Code

Database NoSQL

Data Architecture moderna

Monitoraggio e osservabilità

Padroneggia Data Engineering per il tuo prossimo colloquio