
IAM und Datensicherheit
Least Privilege, Service Accounts, GCP-Rollen, Verschlüsselung at rest/in transit, Data Masking, Audit Logs, GDPR-Compliance, VPC Service Controls
1Was ist das grundlegende Prinzip beim Zuweisen von IAM-Berechtigungen in GCP?
Was ist das grundlegende Prinzip beim Zuweisen von IAM-Berechtigungen in GCP?
Antwort
Das Prinzip der geringsten Berechtigung (least privilege) bedeutet, nur die strikt notwendigen Berechtigungen zur Erfüllung einer Aufgabe zu erteilen. Im Data Engineering bedeutet dies, dass eine Pipeline nur Zugriff auf die Buckets, Datasets und Tabellen haben sollte, die sie tatsächlich benötigt. Dieses Prinzip reduziert die Angriffsfläche und begrenzt potenzielle Schäden bei Kompromittierung eines Service Accounts.
2Was ist der Unterschied zwischen einem Service Account und einem Benutzerkonto in GCP?
Was ist der Unterschied zwischen einem Service Account und einem Benutzerkonto in GCP?
Antwort
Ein Service Account ist eine Identität für Anwendungen und Dienste, während ein Benutzerkonto eine Person darstellt. Service Accounts authentifizieren sich über JSON-Schlüssel oder Workload Identity, haben kein Passwort und sind für die Automatisierung konzipiert. Im Data Engineering sollte jede Pipeline einen eigenen Service Account mit spezifischen Berechtigungen haben.
3Wie ist die IAM-Rollenhierarchie in GCP, von der am wenigsten zur am meisten berechtigten?
Wie ist die IAM-Rollenhierarchie in GCP, von der am wenigsten zur am meisten berechtigten?
Antwort
Die IAM-Rollenhierarchie reicht von Viewer (nur Lesen) über Editor (Lesen/Schreiben ohne IAM-Verwaltung) bis zu Owner (vollständige Kontrolle einschließlich IAM und Abrechnung). Für Datenpipelines wird empfohlen, granulare vordefinierte Rollen wie BigQuery Data Viewer oder Storage Object Creator anstelle dieser zu breit gefassten primitiven Rollen zu verwenden.
Warum sollten JSON-Service-Account-Schlüssel in einer GCP-Produktionsumgebung vermieden werden?
Was ist der Unterschied zwischen Verschlüsselung at rest und Verschlüsselung in transit?
+17 Interview-Fragen
Weitere Data Engineering-Interviewthemen
Linux & Shell - Grundlagen
Git & GitHub - Grundlagen
Fortgeschrittenes Python für Data Engineering
Docker - Grundlagen
Google Cloud Platform - Grundlagen
CI/CD und Codequalität
Docker Compose
FastAPI - Daten-APIs
Fortgeschrittenes SQL für Data Engineering
Data Lake - Architektur und Ingestion
BigQuery für Data Engineering
PostgreSQL - Administration
Data Modeling für Data Engineering
Fivetran & Airbyte - Daten-Ingestion
dbt - Grundlagen
Apache Airflow - Grundlagen
Kubernetes - Grundlagen
dbt - Erweiterte Funktionen
ETL- / ELT- / ETLT-Patterns
Apache Airflow - Fortgeschritten
Airflow + dbt - Pipeline-Orchestrierung
PySpark - Verarbeitung im großen Maßstab
Google Pub/Sub - Daten-Streaming
Apache Beam & Dataflow
Kubernetes - Produktion und Skalierung
Terraform - Infrastructure as Code
NoSQL-Datenbanken
Moderne Data Architecture
Monitoring und Observability
Meistere Data Engineering für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten