
IAM et sécurité des données
Moindre privilège, service accounts, rôles GCP, chiffrement at rest/in transit, data masking, audit logs, compliance GDPR, VPC Service Controls
1Quel est le principe fondamental à appliquer lors de l'attribution de permissions IAM dans GCP ?
Quel est le principe fondamental à appliquer lors de l'attribution de permissions IAM dans GCP ?
Réponse
Le principe du moindre privilège (least privilege) consiste à accorder uniquement les permissions strictement nécessaires pour accomplir une tâche. En Data Engineering, cela signifie qu'un pipeline ne devrait avoir accès qu'aux buckets, datasets et tables dont il a réellement besoin. Ce principe réduit la surface d'attaque et limite les dégâts potentiels en cas de compromission d'un service account.
2Quelle est la différence entre un service account et un compte utilisateur dans GCP ?
Quelle est la différence entre un service account et un compte utilisateur dans GCP ?
Réponse
Un service account est une identité destinée aux applications et services, tandis qu'un compte utilisateur représente une personne. Les service accounts utilisent des clés JSON ou Workload Identity pour s'authentifier, n'ont pas de mot de passe, et sont conçus pour l'automatisation. En Data Engineering, chaque pipeline devrait avoir son propre service account avec des permissions spécifiques.
3Quelle est la hiérarchie des rôles IAM dans GCP, du moins permissif au plus permissif ?
Quelle est la hiérarchie des rôles IAM dans GCP, du moins permissif au plus permissif ?
Réponse
La hiérarchie des rôles IAM va de Viewer (lecture seule) à Editor (lecture/écriture sans gestion IAM) puis à Owner (contrôle total incluant IAM et facturation). Pour les pipelines de données, il est recommandé d'utiliser des rôles prédéfinis granulaires comme BigQuery Data Viewer ou Storage Object Creator plutôt que ces rôles primitifs trop larges.
Pourquoi éviter d'utiliser des clés de service account JSON dans un environnement de production GCP ?
Quelle est la différence entre le chiffrement at rest et le chiffrement in transit ?
+17 questions d'entretien
Autres sujets d'entretien Data Engineering
Linux & Shell - Fondamentaux
Git & GitHub - Fondamentaux
Python avancé pour le Data Engineering
Docker - Fondamentaux
Google Cloud Platform - Fondamentaux
CI/CD et qualité de code
Docker Compose
FastAPI - APIs de données
SQL avancé pour le Data Engineering
Data Lake - Architecture et ingestion
BigQuery pour le Data Engineering
PostgreSQL - Administration
Data Modeling pour le Data Engineering
Fivetran & Airbyte - Ingestion de données
dbt - Fondamentaux
Apache Airflow - Fondamentaux
Kubernetes - Fondamentaux
dbt - Fonctionnalités avancées
Patterns ETL / ELT / ETLT
Apache Airflow - Avancé
Airflow + dbt - Orchestration de pipelines
PySpark - Traitement à grande échelle
Google Pub/Sub - Streaming de données
Apache Beam & Dataflow
Kubernetes - Production et scaling
Terraform - Infrastructure as Code
Bases de données NoSQL
Architecture Data moderne
Monitoring et observabilité
Maîtrise Data Engineering pour ton prochain entretien
Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.
Commencer gratuitement