
Bancos de dados NoSQL
GraphDB (Neo4j), Document DBs (MongoDB, Firestore), Wide Column (Cassandra, Bigtable), teorema CAP, casos de uso
1O que é o teorema CAP e quais são suas três propriedades?
O que é o teorema CAP e quais são suas três propriedades?
Resposta
O teorema CAP afirma que um sistema distribuído só pode garantir duas das três propriedades simultaneamente: Consistency (todos os nós veem os mesmos dados), Availability (o sistema sempre responde) e Partition tolerance (o sistema continua operando apesar de partições de rede). Esse teorema é fundamental para entender os trade-offs arquiteturais em bancos NoSQL.
2Qual é a principal diferença entre um banco de dados Document (MongoDB) e um banco Wide Column (Cassandra)?
Qual é a principal diferença entre um banco de dados Document (MongoDB) e um banco Wide Column (Cassandra)?
Resposta
Bancos Document como MongoDB armazenam documentos JSON/BSON com schemas flexíveis e permitem queries complexas em qualquer campo. Bancos Wide Column como Cassandra organizam dados em column families com partition keys, otimizadas para escritas massivas e leituras por chave. MongoDB se destaca para dados hierárquicos, Cassandra para séries temporais de alta velocidade.
3Em qual caso de uso o Neo4j deve ser preferido em vez de MongoDB ou Cassandra?
Em qual caso de uso o Neo4j deve ser preferido em vez de MongoDB ou Cassandra?
Resposta
Neo4j é um banco de dados de grafos otimizado para relacionamentos complexos e multinível entre entidades. Destaca-se para redes sociais, sistemas de recomendação, detecção de fraude e análise de dependências. A linguagem Cypher permite atravessar milhões de relacionamentos em milissegundos, onde joins SQL ou lookups NoSQL seriam proibitivamente lentos em desempenho.
O que é uma partition key no Cassandra e por que é crítica para o desempenho?
Qual é a sintaxe Cypher para encontrar todos os amigos dos amigos de um usuário no Neo4j?
+17 perguntas de entrevista
Outros temas de entrevista Data Engineering
Linux & Shell - Fundamentos
Git & GitHub - Fundamentos
Python avançado para Data Engineering
Docker - Fundamentos
Google Cloud Platform - Fundamentos
CI/CD e qualidade de código
Docker Compose
FastAPI - APIs de dados
SQL avançado para Data Engineering
Data Lake - Arquitetura e ingestão
BigQuery para Data Engineering
PostgreSQL - Administração
Data Modeling para Data Engineering
Fivetran & Airbyte - Ingestão de dados
dbt - Fundamentos
Apache Airflow - Fundamentos
Kubernetes - Fundamentos
dbt - Recursos avançados
Padrões ETL / ELT / ETLT
Apache Airflow - Avançado
Airflow + dbt - Orquestração de pipelines
PySpark - Processamento em grande escala
Google Pub/Sub - Streaming de dados
Apache Beam & Dataflow
Kubernetes - Produção e escalabilidade
Terraform - Infrastructure as Code
Arquitetura Data moderna
Monitoramento e observabilidade
IAM e segurança de dados
Domine Data Engineering para sua proxima entrevista
Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.
Comece gratis