Data Engineering

Database NoSQL

GraphDB (Neo4j), Document DBs (MongoDB, Firestore), Wide Column (Cassandra, Bigtable), teorema CAP, casi d'uso

20 domande da colloquio·
Senior
1

Cos'è il teorema CAP e quali sono le sue tre proprietà?

Risposta

Il teorema CAP afferma che un sistema distribuito può garantire solo due delle tre proprietà simultaneamente: Consistency (tutti i nodi vedono gli stessi dati), Availability (il sistema risponde sempre) e Partition tolerance (il sistema continua a funzionare nonostante partizioni di rete). Questo teorema è fondamentale per comprendere i compromessi architetturali nei database NoSQL.

2

Qual è la differenza principale tra un database Document (MongoDB) e un database Wide Column (Cassandra)?

Risposta

I database Document come MongoDB memorizzano documenti JSON/BSON con schemi flessibili e permettono query complesse su qualsiasi campo. I database Wide Column come Cassandra organizzano i dati in column family con partition key, ottimizzati per scritture massive e letture per chiave. MongoDB eccelle per dati gerarchici, Cassandra per serie temporali ad alta velocità.

3

In quale caso d'uso si dovrebbe preferire Neo4j rispetto a MongoDB o Cassandra?

Risposta

Neo4j è un database graph ottimizzato per relazioni complesse multi-livello tra entità. Eccelle per reti sociali, sistemi di raccomandazione, rilevamento frodi e analisi delle dipendenze. Il linguaggio Cypher permette di attraversare milioni di relazioni in millisecondi, dove i join SQL o i lookup NoSQL sarebbero proibitivi in termini di prestazioni.

4

Cos'è una partition key in Cassandra e perché è critica per le prestazioni?

5

Qual è la sintassi Cypher per trovare tutti gli amici degli amici di un utente in Neo4j?

+17 domande da colloquio

Padroneggia Data Engineering per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis