
IAM i bezpieczeństwo danych
Zasada najmniejszych uprawnień, service accounts, role GCP, szyfrowanie at rest/in transit, data masking, audit logs, zgodność z GDPR, VPC Service Controls
1Jaka jest fundamentalna zasada przy przypisywaniu uprawnień IAM w GCP?
Jaka jest fundamentalna zasada przy przypisywaniu uprawnień IAM w GCP?
Odpowiedź
Zasada najmniejszych uprawnień (least privilege) polega na przyznawaniu tylko tych uprawnień, które są ściśle niezbędne do wykonania zadania. W Data Engineering oznacza to, że pipeline powinien mieć dostęp tylko do bucketów, datasetów i tabel, których faktycznie potrzebuje. Ta zasada zmniejsza powierzchnię ataku i ogranicza potencjalne szkody w przypadku naruszenia service account.
2Jaka jest różnica między service account a kontem użytkownika w GCP?
Jaka jest różnica między service account a kontem użytkownika w GCP?
Odpowiedź
Service account to tożsamość zaprojektowana dla aplikacji i usług, podczas gdy konto użytkownika reprezentuje osobę. Service accounts uwierzytelniają się za pomocą kluczy JSON lub Workload Identity, nie mają hasła i są zaprojektowane do automatyzacji. W Data Engineering każdy pipeline powinien mieć własny service account z określonymi uprawnieniami.
3Jaka jest hierarchia ról IAM w GCP, od najmniej do najbardziej uprzywilejowanej?
Jaka jest hierarchia ról IAM w GCP, od najmniej do najbardziej uprzywilejowanej?
Odpowiedź
Hierarchia ról IAM przebiega od Viewer (tylko odczyt) przez Editor (odczyt/zapis bez zarządzania IAM) do Owner (pełna kontrola łącznie z IAM i rozliczeniami). W przypadku potoków danych zaleca się stosowanie szczegółowych predefiniowanych ról, takich jak BigQuery Data Viewer lub Storage Object Creator, zamiast tych zbyt szerokich pierwotnych ról.
Dlaczego należy unikać kluczy JSON service account w środowisku produkcyjnym GCP?
Jaka jest różnica między szyfrowaniem at rest a szyfrowaniem in transit?
+17 pytań z rozmów
Inne tematy rekrutacyjne Data Engineering
Linux & Shell - Podstawy
Git & GitHub - Podstawy
Zaawansowany Python dla Data Engineering
Docker - Podstawy
Google Cloud Platform - Podstawy
CI/CD i jakość kodu
Docker Compose
FastAPI - API danych
Zaawansowany SQL dla Data Engineering
Data Lake - Architektura i wprowadzanie danych
BigQuery dla Data Engineering
PostgreSQL - Administracja
Data Modeling dla Data Engineering
Fivetran & Airbyte - Pozyskiwanie danych
dbt - Podstawy
Apache Airflow - Podstawy
Kubernetes - Podstawy
dbt - Zaawansowane funkcje
Wzorce ETL / ELT / ETLT
Apache Airflow - Zaawansowany
Airflow + dbt - Orkiestracja pipeline'ów
PySpark - Przetwarzanie na dużą skalę
Google Pub/Sub - Streaming danych
Apache Beam & Dataflow
Kubernetes - Produkcja i skalowanie
Terraform - Infrastructure as Code
Bazy danych NoSQL
Nowoczesna Data Architecture
Monitorowanie i obserwowalność
Opanuj Data Engineering na następną rozmowę
Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.
Zacznij za darmo