Question 1

Jaka jest fundamentalna zasada przy przypisywaniu uprawnień IAM w GCP?

Accepted Answer

Zasada najmniejszych uprawnień (least privilege) polega na przyznawaniu tylko tych uprawnień, które są ściśle niezbędne do wykonania zadania. W Data Engineering oznacza to, że pipeline powinien mieć dostęp tylko do bucketów, datasetów i tabel, których faktycznie potrzebuje. Ta zasada zmniejsza powierzchnię ataku i ogranicza potencjalne szkody w przypadku naruszenia service account.

Question 2

Jaka jest różnica między service account a kontem użytkownika w GCP?

Accepted Answer

Service account to tożsamość zaprojektowana dla aplikacji i usług, podczas gdy konto użytkownika reprezentuje osobę. Service accounts uwierzytelniają się za pomocą kluczy JSON lub Workload Identity, nie mają hasła i są zaprojektowane do automatyzacji. W Data Engineering każdy pipeline powinien mieć własny service account z określonymi uprawnieniami.

Question 3

Jaka jest hierarchia ról IAM w GCP, od najmniej do najbardziej uprzywilejowanej?

Accepted Answer

Hierarchia ról IAM przebiega od Viewer (tylko odczyt) przez Editor (odczyt/zapis bez zarządzania IAM) do Owner (pełna kontrola łącznie z IAM i rozliczeniami). W przypadku potoków danych zaleca się stosowanie szczegółowych predefiniowanych ról, takich jak BigQuery Data Viewer lub Storage Object Creator, zamiast tych zbyt szerokich pierwotnych ról.

IAM i bezpieczeństwo danych

Jaka jest fundamentalna zasada przy przypisywaniu uprawnień IAM w GCP?

Odpowiedź

Jaka jest różnica między service account a kontem użytkownika w GCP?

Odpowiedź

Jaka jest hierarchia ról IAM w GCP, od najmniej do najbardziej uprzywilejowanej?

Odpowiedź

Dlaczego należy unikać kluczy JSON service account w środowisku produkcyjnym GCP?

Jaka jest różnica między szyfrowaniem at rest a szyfrowaniem in transit?

Inne tematy rekrutacyjne Data Engineering

Linux & Shell - Podstawy

Git & GitHub - Podstawy

Zaawansowany Python dla Data Engineering

Docker - Podstawy

Google Cloud Platform - Podstawy

CI/CD i jakość kodu

Docker Compose

FastAPI - API danych

Zaawansowany SQL dla Data Engineering

Data Lake - Architektura i wprowadzanie danych

BigQuery dla Data Engineering

PostgreSQL - Administracja

Data Modeling dla Data Engineering

Fivetran & Airbyte - Pozyskiwanie danych

dbt - Podstawy

Apache Airflow - Podstawy

Kubernetes - Podstawy

dbt - Zaawansowane funkcje

Wzorce ETL / ELT / ETLT

Apache Airflow - Zaawansowany

Airflow + dbt - Orkiestracja pipeline'ów

PySpark - Przetwarzanie na dużą skalę

Google Pub/Sub - Streaming danych

Apache Beam & Dataflow

Kubernetes - Produkcja i skalowanie

Terraform - Infrastructure as Code

Bazy danych NoSQL

Nowoczesna Data Architecture

Monitorowanie i obserwowalność

Opanuj Data Engineering na następną rozmowę