
IAM e sicurezza dei dati
Privilegio minimo, service accounts, ruoli GCP, crittografia at rest/in transit, data masking, audit logs, conformità GDPR, VPC Service Controls
1Qual è il principio fondamentale da applicare nell'assegnazione dei permessi IAM in GCP?
Qual è il principio fondamentale da applicare nell'assegnazione dei permessi IAM in GCP?
Risposta
Il principio del minimo privilegio (least privilege) consiste nel concedere solo i permessi strettamente necessari per svolgere un'attività. Nel Data Engineering, ciò significa che una pipeline dovrebbe avere accesso solo ai bucket, dataset e tabelle di cui ha effettivamente bisogno. Questo principio riduce la superficie di attacco e limita i danni potenziali in caso di compromissione di un service account.
2Qual è la differenza tra un service account e un account utente in GCP?
Qual è la differenza tra un service account e un account utente in GCP?
Risposta
Un service account è un'identità progettata per applicazioni e servizi, mentre un account utente rappresenta una persona. I service account si autenticano usando chiavi JSON o Workload Identity, non hanno password e sono progettati per l'automazione. Nel Data Engineering, ogni pipeline dovrebbe avere il proprio service account con permessi specifici.
3Qual è la gerarchia dei ruoli IAM in GCP, dal meno al più permissivo?
Qual è la gerarchia dei ruoli IAM in GCP, dal meno al più permissivo?
Risposta
La gerarchia dei ruoli IAM va da Viewer (sola lettura) a Editor (lettura/scrittura senza gestione IAM) a Owner (controllo completo inclusi IAM e fatturazione). Per le pipeline di dati, si consiglia di utilizzare ruoli predefiniti granulari come BigQuery Data Viewer o Storage Object Creator anziché questi ruoli primitivi troppo ampi.
Perché evitare di usare chiavi JSON di service account in un ambiente di produzione GCP?
Qual è la differenza tra crittografia at rest e crittografia in transit?
+17 domande da colloquio
Altri argomenti di colloquio Data Engineering
Linux & Shell - Fondamenti
Git & GitHub - Fondamenti
Python avanzato per Data Engineering
Docker - Fondamenti
Google Cloud Platform - Fondamenti
CI/CD e qualità del codice
Docker Compose
FastAPI - API per dati
SQL avanzato per il Data Engineering
Data Lake - Architettura e ingestione
BigQuery per il Data Engineering
PostgreSQL - Amministrazione
Data Modeling per Data Engineering
Fivetran & Airbyte - Ingestione dati
dbt - Fondamenti
Apache Airflow - Fondamenti
Kubernetes - Fondamenti
dbt - Funzionalità avanzate
Pattern ETL / ELT / ETLT
Apache Airflow - Avanzato
Airflow + dbt - Orchestrazione delle pipeline
PySpark - Elaborazione su larga scala
Google Pub/Sub - Streaming di dati
Apache Beam & Dataflow
Kubernetes - Produzione e scaling
Terraform - Infrastructure as Code
Database NoSQL
Data Architecture moderna
Monitoraggio e osservabilità
Padroneggia Data Engineering per il tuo prossimo colloquio
Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.
Inizia gratis