Data Engineering

Бази даних NoSQL

GraphDB (Neo4j), Document DBs (MongoDB, Firestore), Wide Column (Cassandra, Bigtable), теорема CAP, випадки використання

20 питань зі співбесід·
Senior
1

Що таке теорема CAP і які три її властивості?

Відповідь

Теорема CAP стверджує, що розподілена система може одночасно гарантувати лише дві з трьох властивостей: Consistency (усі вузли бачать однакові дані), Availability (система завжди відповідає) і Partition tolerance (система продовжує працювати, незважаючи на мережеві розділи). Ця теорема є фундаментальною для розуміння архітектурних компромісів у базах NoSQL.

2

Яка основна відмінність між базою даних Document (MongoDB) і базою Wide Column (Cassandra)?

Відповідь

Бази Document, такі як MongoDB, зберігають документи JSON/BSON з гнучкими схемами та дозволяють складні запити на будь-якому полі. Бази Wide Column, такі як Cassandra, організовують дані в column family з partition key, оптимізовані для масових записів і читань за ключем. MongoDB чудово підходить для ієрархічних даних, Cassandra — для високошвидкісних часових рядів.

3

У якому випадку використання слід надавати перевагу Neo4j перед MongoDB або Cassandra?

Відповідь

Neo4j — це графова база даних, оптимізована для складних багаторівневих зв'язків між сутностями. Вона чудово підходить для соціальних мереж, систем рекомендацій, виявлення шахрайства та аналізу залежностей. Мова Cypher дозволяє обходити мільйони зв'язків за мілісекунди, тоді як SQL join або NoSQL lookup були б непридатними з точки зору продуктивності.

4

Що таке partition key у Cassandra і чому він критично важливий для продуктивності?

5

Який синтаксис Cypher для пошуку всіх друзів друзів користувача в Neo4j?

+17 питань зі співбесід

Інші теми співбесід Data Engineering

Linux & Shell - Основи

Junior
20 запитань

Git & GitHub - Основи

Junior
20 запитань

Просунутий Python для Data Engineering

Junior
25 запитань

Docker - Основи

Junior
25 запитань

Google Cloud Platform - Основи

Junior
20 запитань

CI/CD та якість коду

Mid-Level
20 запитань

Docker Compose

Mid-Level
20 запитань

FastAPI - API даних

Mid-Level
20 запитань

Просунутий SQL для Data Engineering

Mid-Level
20 запитань

Data Lake - Архітектура та завантаження даних

Mid-Level
20 запитань

BigQuery для Data Engineering

Mid-Level
20 запитань

PostgreSQL - Адміністрування

Mid-Level
20 запитань

Data Modeling для Data Engineering

Mid-Level
20 запитань

Fivetran & Airbyte - Завантаження даних

Mid-Level
20 запитань

dbt - Основи

Mid-Level
20 запитань

Apache Airflow - Основи

Mid-Level
20 запитань

Kubernetes - Основи

Mid-Level
20 запитань

dbt - Розширені можливості

Senior
20 запитань

Патерни ETL / ELT / ETLT

Senior
20 запитань

Apache Airflow - Просунутий

Senior
20 запитань

Airflow + dbt - Оркестрація пайплайнів

Senior
20 запитань

PySpark - Великомасштабна обробка

Senior
20 запитань

Google Pub/Sub - Стрімінг даних

Senior
20 запитань

Apache Beam & Dataflow

Senior
20 запитань

Kubernetes - Продакшн та масштабування

Senior
20 запитань

Terraform - Infrastructure as Code

Senior
20 запитань

Сучасна Data Architecture

Senior
20 запитань

Моніторинг та спостережуваність

Senior
20 запитань

IAM та безпека даних

Senior
20 запитань

Опануй Data Engineering для наступної співбесіди

Отримай доступ до всіх питань, flashcards, технічних тестів, вправ code review та симуляторів співбесід.

Почни безкоштовно