Data Engineering

NoSQL-databases

GraphDB (Neo4j), Document DBs (MongoDB, Firestore), Wide Column (Cassandra, Bigtable), CAP-theorema, use cases

20 gespreksvragen·
Senior
1

Wat is het CAP-theorema en wat zijn de drie eigenschappen?

Antwoord

Het CAP-theorema stelt dat een gedistribueerd systeem slechts twee van de drie eigenschappen tegelijk kan garanderen: Consistency (alle nodes zien dezelfde data), Availability (het systeem reageert altijd) en Partition tolerance (het systeem blijft werken ondanks netwerkpartities). Dit theorema is fundamenteel om de architecturale afwegingen in NoSQL-databases te begrijpen.

2

Wat is het belangrijkste verschil tussen een Document-database (MongoDB) en een Wide Column-database (Cassandra)?

Antwoord

Document-databases zoals MongoDB slaan JSON/BSON-documenten op met flexibele schema's en staan complexe queries op elk veld toe. Wide Column-databases zoals Cassandra organiseren data in column families met partition keys, geoptimaliseerd voor massale writes en key-gebaseerde reads. MongoDB blinkt uit voor hiërarchische data, Cassandra voor time series met hoge snelheid.

3

In welk gebruiksgeval moet Neo4j worden verkozen boven MongoDB of Cassandra?

Antwoord

Neo4j is een graph database die is geoptimaliseerd voor complexe multi-level relaties tussen entiteiten. Het blinkt uit voor sociale netwerken, aanbevelingssystemen, fraudedetectie en afhankelijkheidsanalyse. De Cypher-taal maakt het mogelijk om miljoenen relaties in milliseconden te doorlopen, waar SQL-joins of NoSQL-lookups qua prestaties prohibitief zouden zijn.

4

Wat is een partition key in Cassandra en waarom is deze cruciaal voor de prestaties?

5

Wat is de Cypher-syntaxis om alle vrienden van vrienden van een gebruiker in Neo4j te vinden?

+17 gespreksvragen

Beheers Data Engineering voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis