
IAM y seguridad de datos
Privilegio mínimo, service accounts, roles GCP, cifrado at rest/in transit, data masking, audit logs, cumplimiento GDPR, VPC Service Controls
1¿Cuál es el principio fundamental a aplicar al asignar permisos IAM en GCP?
¿Cuál es el principio fundamental a aplicar al asignar permisos IAM en GCP?
Respuesta
El principio de privilegio mínimo (least privilege) consiste en otorgar solo los permisos estrictamente necesarios para realizar una tarea. En Data Engineering, esto significa que un pipeline solo debería tener acceso a los buckets, datasets y tablas que realmente necesita. Este principio reduce la superficie de ataque y limita los daños potenciales en caso de compromiso de un service account.
2¿Cuál es la diferencia entre un service account y una cuenta de usuario en GCP?
¿Cuál es la diferencia entre un service account y una cuenta de usuario en GCP?
Respuesta
Un service account es una identidad diseñada para aplicaciones y servicios, mientras que una cuenta de usuario representa a una persona. Los service accounts se autentican usando claves JSON o Workload Identity, no tienen contraseña y están diseñados para automatización. En Data Engineering, cada pipeline debería tener su propio service account con permisos específicos.
3¿Cuál es la jerarquía de roles IAM en GCP, del menos al más permisivo?
¿Cuál es la jerarquía de roles IAM en GCP, del menos al más permisivo?
Respuesta
La jerarquía de roles IAM va de Viewer (solo lectura) a Editor (lectura/escritura sin gestión IAM) y Owner (control total incluyendo IAM y facturación). Para pipelines de datos, se recomienda usar roles predefinidos granulares como BigQuery Data Viewer o Storage Object Creator en lugar de estos roles primitivos demasiado amplios.
¿Por qué se deben evitar las claves JSON de service account en un entorno de producción GCP?
¿Cuál es la diferencia entre el cifrado at rest y el cifrado in transit?
+17 preguntas de entrevista
Otros temas de entrevista Data Engineering
Linux & Shell - Fundamentos
Git & GitHub - Fundamentos
Python avanzado para Data Engineering
Docker - Fundamentos
Google Cloud Platform - Fundamentos
CI/CD y calidad de código
Docker Compose
FastAPI - APIs de datos
SQL avanzado para Data Engineering
Data Lake - Arquitectura e ingesta
BigQuery para Data Engineering
PostgreSQL - Administración
Data Modeling para Data Engineering
Fivetran & Airbyte - Ingesta de datos
dbt - Fundamentos
Apache Airflow - Fundamentos
Kubernetes - Fundamentos
dbt - Funcionalidades avanzadas
Patrones ETL / ELT / ETLT
Apache Airflow - Avanzado
Airflow + dbt - Orquestación de pipelines
PySpark - Procesamiento a gran escala
Google Pub/Sub - Streaming de datos
Apache Beam & Dataflow
Kubernetes - Producción y escalado
Terraform - Infrastructure as Code
Bases de datos NoSQL
Arquitectura Data moderna
Monitoreo y observabilidad
Domina Data Engineering para tu próxima entrevista
Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.
Empieza gratis