Data Engineering

NoSQL-Datenbanken

GraphDB (Neo4j), Document DBs (MongoDB, Firestore), Wide Column (Cassandra, Bigtable), CAP-Theorem, Anwendungsfälle

20 Interview-Fragen·
Senior
1

Was ist das CAP-Theorem und welche drei Eigenschaften hat es?

Antwort

Das CAP-Theorem besagt, dass ein verteiltes System nur zwei von drei Eigenschaften gleichzeitig garantieren kann: Consistency (alle Knoten sehen dieselben Daten), Availability (das System antwortet immer) und Partition tolerance (das System funktioniert trotz Netzwerkpartitionen weiter). Dieses Theorem ist grundlegend für das Verständnis architektonischer Kompromisse in NoSQL-Datenbanken.

2

Was ist der Hauptunterschied zwischen einer Document-Datenbank (MongoDB) und einer Wide-Column-Datenbank (Cassandra)?

Antwort

Document-Datenbanken wie MongoDB speichern JSON/BSON-Dokumente mit flexiblen Schemas und ermöglichen komplexe Abfragen auf jedem Feld. Wide-Column-Datenbanken wie Cassandra organisieren Daten in Column Families mit Partition Keys, optimiert für massive Schreibvorgänge und schlüsselbasierte Lesevorgänge. MongoDB glänzt bei hierarchischen Daten, Cassandra bei Zeitreihen mit hoher Geschwindigkeit.

3

In welchem Anwendungsfall sollte Neo4j gegenüber MongoDB oder Cassandra bevorzugt werden?

Antwort

Neo4j ist eine Graph-Datenbank, die für komplexe mehrstufige Beziehungen zwischen Entitäten optimiert ist. Sie glänzt bei sozialen Netzwerken, Empfehlungssystemen, Betrugserkennung und Abhängigkeitsanalysen. Die Cypher-Sprache ermöglicht das Durchlaufen von Millionen von Beziehungen in Millisekunden, wo SQL-Joins oder NoSQL-Lookups leistungstechnisch prohibitiv wären.

4

Was ist ein Partition Key in Cassandra und warum ist er für die Leistung entscheidend?

5

Wie lautet die Cypher-Syntax, um alle Freunde von Freunden eines Benutzers in Neo4j zu finden?

+17 Interview-Fragen

Meistere Data Engineering für dein nächstes Interview

Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.

Kostenlos starten