Data Engineering

Bases de datos NoSQL

GraphDB (Neo4j), Document DBs (MongoDB, Firestore), Wide Column (Cassandra, Bigtable), teorema CAP, casos de uso

20 preguntas de entrevista·
Senior
1

¿Qué es el teorema CAP y cuáles son sus tres propiedades?

Respuesta

El teorema CAP establece que un sistema distribuido solo puede garantizar dos de tres propiedades simultáneamente: Consistency (todos los nodos ven los mismos datos), Availability (el sistema siempre responde) y Partition tolerance (el sistema sigue funcionando a pesar de particiones de red). Este teorema es fundamental para entender los compromisos arquitectónicos en bases NoSQL.

2

¿Cuál es la diferencia principal entre una base de datos Document (MongoDB) y una base Wide Column (Cassandra)?

Respuesta

Las bases Document como MongoDB almacenan documentos JSON/BSON con esquemas flexibles y permiten consultas complejas sobre cualquier campo. Las bases Wide Column como Cassandra organizan los datos en familias de columnas con partition keys, optimizadas para escrituras masivas y lecturas por clave. MongoDB destaca para datos jerárquicos, Cassandra para series temporales de alta velocidad.

3

¿En qué caso de uso se debe preferir Neo4j sobre MongoDB o Cassandra?

Respuesta

Neo4j es una base de datos de grafos optimizada para relaciones complejas y multinivel entre entidades. Destaca para redes sociales, sistemas de recomendación, detección de fraude y análisis de dependencias. El lenguaje Cypher permite atravesar millones de relaciones en milisegundos, donde los joins SQL o los lookups NoSQL serían prohibitivamente lentos en rendimiento.

4

¿Qué es una partition key en Cassandra y por qué es crítica para el rendimiento?

5

¿Cuál es la sintaxis Cypher para encontrar todos los amigos de los amigos de un usuario en Neo4j?

+17 preguntas de entrevista

Domina Data Engineering para tu próxima entrevista

Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.

Empieza gratis