Question 1

Was ist das grundlegende Prinzip beim Zuweisen von IAM-Berechtigungen in GCP?

Accepted Answer

Das Prinzip der geringsten Berechtigung (least privilege) bedeutet, nur die strikt notwendigen Berechtigungen zur Erfüllung einer Aufgabe zu erteilen. Im Data Engineering bedeutet dies, dass eine Pipeline nur Zugriff auf die Buckets, Datasets und Tabellen haben sollte, die sie tatsächlich benötigt. Dieses Prinzip reduziert die Angriffsfläche und begrenzt potenzielle Schäden bei Kompromittierung eines Service Accounts.

Question 2

Was ist der Unterschied zwischen einem Service Account und einem Benutzerkonto in GCP?

Accepted Answer

Ein Service Account ist eine Identität für Anwendungen und Dienste, während ein Benutzerkonto eine Person darstellt. Service Accounts authentifizieren sich über JSON-Schlüssel oder Workload Identity, haben kein Passwort und sind für die Automatisierung konzipiert. Im Data Engineering sollte jede Pipeline einen eigenen Service Account mit spezifischen Berechtigungen haben.

Question 3

Wie ist die IAM-Rollenhierarchie in GCP, von der am wenigsten zur am meisten berechtigten?

Accepted Answer

Die IAM-Rollenhierarchie reicht von Viewer (nur Lesen) über Editor (Lesen/Schreiben ohne IAM-Verwaltung) bis zu Owner (vollständige Kontrolle einschließlich IAM und Abrechnung). Für Datenpipelines wird empfohlen, granulare vordefinierte Rollen wie BigQuery Data Viewer oder Storage Object Creator anstelle dieser zu breit gefassten primitiven Rollen zu verwenden.

IAM und Datensicherheit

Was ist das grundlegende Prinzip beim Zuweisen von IAM-Berechtigungen in GCP?

Antwort

Was ist der Unterschied zwischen einem Service Account und einem Benutzerkonto in GCP?

Antwort

Wie ist die IAM-Rollenhierarchie in GCP, von der am wenigsten zur am meisten berechtigten?

Antwort

Warum sollten JSON-Service-Account-Schlüssel in einer GCP-Produktionsumgebung vermieden werden?

Was ist der Unterschied zwischen Verschlüsselung at rest und Verschlüsselung in transit?

Weitere Data Engineering-Interviewthemen

Linux & Shell - Grundlagen

Git & GitHub - Grundlagen

Fortgeschrittenes Python für Data Engineering

Docker - Grundlagen

Google Cloud Platform - Grundlagen

CI/CD und Codequalität

Docker Compose

FastAPI - Daten-APIs

Fortgeschrittenes SQL für Data Engineering

Data Lake - Architektur und Ingestion

BigQuery für Data Engineering

PostgreSQL - Administration

Data Modeling für Data Engineering

Fivetran & Airbyte - Daten-Ingestion

dbt - Grundlagen

Apache Airflow - Grundlagen

Kubernetes - Grundlagen

dbt - Erweiterte Funktionen

ETL- / ELT- / ETLT-Patterns

Apache Airflow - Fortgeschritten

Airflow + dbt - Pipeline-Orchestrierung

PySpark - Verarbeitung im großen Maßstab

Google Pub/Sub - Daten-Streaming

Apache Beam & Dataflow

Kubernetes - Produktion und Skalierung

Terraform - Infrastructure as Code

NoSQL-Datenbanken

Moderne Data Architecture

Monitoring und Observability

Meistere Data Engineering für dein nächstes Interview