Data Engineering

IAM та безпека даних

Принцип найменших привілеїв, service accounts, ролі GCP, шифрування at rest/in transit, data masking, audit logs, відповідність GDPR, VPC Service Controls

20 питань зі співбесід·
Senior
1

Який фундаментальний принцип слід застосовувати при призначенні дозволів IAM у GCP?

Відповідь

Принцип найменших привілеїв (least privilege) полягає у наданні лише тих дозволів, які суворо необхідні для виконання завдання. У Data Engineering це означає, що pipeline повинен мати доступ лише до bucket, dataset і таблиць, які йому дійсно потрібні. Цей принцип зменшує поверхню атаки та обмежує потенційну шкоду у разі компрометації service account.

2

У чому різниця між service account та обліковим записом користувача в GCP?

Відповідь

Service account — це ідентичність, призначена для додатків та сервісів, тоді як обліковий запис користувача представляє людину. Service accounts автентифікуються за допомогою JSON-ключів або Workload Identity, не мають пароля та призначені для автоматизації. У Data Engineering кожен pipeline повинен мати власний service account з конкретними дозволами.

3

Яка ієрархія ролей IAM у GCP, від найменш до найбільш привілейованої?

Відповідь

Ієрархія ролей IAM іде від Viewer (тільки читання) до Editor (читання/запис без керування IAM) і Owner (повний контроль, включаючи IAM та білінг). Для конвеєрів даних рекомендується використовувати деталізовані попередньо визначені ролі, такі як BigQuery Data Viewer або Storage Object Creator, замість цих надто широких примітивних ролей.

4

Чому слід уникати JSON-ключів service account у виробничому середовищі GCP?

5

У чому різниця між шифруванням at rest та шифруванням in transit?

+17 питань зі співбесід

Інші теми співбесід Data Engineering

Linux & Shell - Основи

Junior
20 запитань

Git & GitHub - Основи

Junior
20 запитань

Просунутий Python для Data Engineering

Junior
25 запитань

Docker - Основи

Junior
25 запитань

Google Cloud Platform - Основи

Junior
20 запитань

CI/CD та якість коду

Mid-Level
20 запитань

Docker Compose

Mid-Level
20 запитань

FastAPI - API даних

Mid-Level
20 запитань

Просунутий SQL для Data Engineering

Mid-Level
20 запитань

Data Lake - Архітектура та завантаження даних

Mid-Level
20 запитань

BigQuery для Data Engineering

Mid-Level
20 запитань

PostgreSQL - Адміністрування

Mid-Level
20 запитань

Data Modeling для Data Engineering

Mid-Level
20 запитань

Fivetran & Airbyte - Завантаження даних

Mid-Level
20 запитань

dbt - Основи

Mid-Level
20 запитань

Apache Airflow - Основи

Mid-Level
20 запитань

Kubernetes - Основи

Mid-Level
20 запитань

dbt - Розширені можливості

Senior
20 запитань

Патерни ETL / ELT / ETLT

Senior
20 запитань

Apache Airflow - Просунутий

Senior
20 запитань

Airflow + dbt - Оркестрація пайплайнів

Senior
20 запитань

PySpark - Великомасштабна обробка

Senior
20 запитань

Google Pub/Sub - Стрімінг даних

Senior
20 запитань

Apache Beam & Dataflow

Senior
20 запитань

Kubernetes - Продакшн та масштабування

Senior
20 запитань

Terraform - Infrastructure as Code

Senior
20 запитань

Бази даних NoSQL

Senior
20 запитань

Сучасна Data Architecture

Senior
20 запитань

Моніторинг та спостережуваність

Senior
20 запитань

Опануй Data Engineering для наступної співбесіди

Отримай доступ до всіх питань, flashcards, технічних тестів, вправ code review та симуляторів співбесід.

Почни безкоштовно