
Bazy danych NoSQL
GraphDB (Neo4j), Document DBs (MongoDB, Firestore), Wide Column (Cassandra, Bigtable), twierdzenie CAP, przypadki użycia
1Czym jest twierdzenie CAP i jakie są jego trzy właściwości?
Czym jest twierdzenie CAP i jakie są jego trzy właściwości?
Odpowiedź
Twierdzenie CAP stwierdza, że system rozproszony może jednocześnie gwarantować tylko dwie z trzech właściwości: Consistency (wszystkie węzły widzą te same dane), Availability (system zawsze odpowiada) i Partition tolerance (system działa pomimo partycji sieciowych). To twierdzenie jest fundamentalne dla zrozumienia kompromisów architektonicznych w bazach NoSQL.
2Jaka jest główna różnica między bazą Document (MongoDB) a bazą Wide Column (Cassandra)?
Jaka jest główna różnica między bazą Document (MongoDB) a bazą Wide Column (Cassandra)?
Odpowiedź
Bazy Document jak MongoDB przechowują dokumenty JSON/BSON z elastycznymi schematami i pozwalają na złożone zapytania na dowolnym polu. Bazy Wide Column jak Cassandra organizują dane w column family z partition key, zoptymalizowane dla masowych zapisów i odczytów po kluczu. MongoDB doskonale radzi sobie z danymi hierarchicznymi, Cassandra z szybkimi seriami czasowymi.
3W jakim przypadku użycia należy preferować Neo4j zamiast MongoDB lub Cassandra?
W jakim przypadku użycia należy preferować Neo4j zamiast MongoDB lub Cassandra?
Odpowiedź
Neo4j to baza danych grafowa zoptymalizowana pod kątem złożonych wielopoziomowych relacji między encjami. Doskonale sprawdza się w sieciach społecznościowych, systemach rekomendacji, wykrywaniu oszustw i analizie zależności. Język Cypher umożliwia przemierzanie milionów relacji w milisekundach, podczas gdy złączenia SQL lub lookupy NoSQL byłyby zbyt wolne pod względem wydajności.
Czym jest partition key w Cassandra i dlaczego jest krytyczny dla wydajności?
Jaka jest składnia Cypher do znalezienia wszystkich znajomych znajomych użytkownika w Neo4j?
+17 pytań z rozmów
Inne tematy rekrutacyjne Data Engineering
Linux & Shell - Podstawy
Git & GitHub - Podstawy
Zaawansowany Python dla Data Engineering
Docker - Podstawy
Google Cloud Platform - Podstawy
CI/CD i jakość kodu
Docker Compose
FastAPI - API danych
Zaawansowany SQL dla Data Engineering
Data Lake - Architektura i wprowadzanie danych
BigQuery dla Data Engineering
PostgreSQL - Administracja
Data Modeling dla Data Engineering
Fivetran & Airbyte - Pozyskiwanie danych
dbt - Podstawy
Apache Airflow - Podstawy
Kubernetes - Podstawy
dbt - Zaawansowane funkcje
Wzorce ETL / ELT / ETLT
Apache Airflow - Zaawansowany
Airflow + dbt - Orkiestracja pipeline'ów
PySpark - Przetwarzanie na dużą skalę
Google Pub/Sub - Streaming danych
Apache Beam & Dataflow
Kubernetes - Produkcja i skalowanie
Terraform - Infrastructure as Code
Nowoczesna Data Architecture
Monitorowanie i obserwowalność
IAM i bezpieczeństwo danych
Opanuj Data Engineering na następną rozmowę
Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.
Zacznij za darmo