Data Engineering

NoSQL 데이터베이스

GraphDB (Neo4j), Document DBs (MongoDB, Firestore), Wide Column (Cassandra, Bigtable), CAP 정리, 사용 사례

20 면접 질문·
Senior
1

CAP 정리란 무엇이며 그 세 가지 속성은 무엇입니까?

답변

CAP 정리는 분산 시스템이 세 가지 속성 중 동시에 두 가지만 보장할 수 있다고 명시합니다: Consistency(모든 노드가 동일한 데이터를 봄), Availability(시스템이 항상 응답함), Partition tolerance(네트워크 파티션에도 시스템이 계속 작동함). 이 정리는 NoSQL 데이터베이스의 아키텍처 트레이드오프를 이해하는 데 기본입니다.

2

Document 데이터베이스(MongoDB)와 Wide Column 데이터베이스(Cassandra)의 주요 차이점은 무엇입니까?

답변

MongoDB와 같은 Document 데이터베이스는 유연한 스키마로 JSON/BSON 문서를 저장하고 모든 필드에 대한 복잡한 쿼리를 허용합니다. Cassandra와 같은 Wide Column 데이터베이스는 partition key가 있는 컬럼 패밀리로 데이터를 구성하며, 대량 쓰기 및 키 기반 읽기에 최적화되어 있습니다. MongoDB는 계층적 데이터에 뛰어나고 Cassandra는 고속 시계열 데이터에 뛰어납니다.

3

어떤 사용 사례에서 MongoDB나 Cassandra보다 Neo4j를 선호해야 합니까?

답변

Neo4j는 엔티티 간의 복잡한 다단계 관계에 최적화된 그래프 데이터베이스입니다. 소셜 네트워크, 추천 시스템, 사기 탐지 및 의존성 분석에 탁월합니다. Cypher 언어는 SQL 조인이나 NoSQL 조회로는 성능상 금지될 수백만 개의 관계를 밀리초 단위로 순회할 수 있게 해줍니다.

4

Cassandra의 partition key는 무엇이며 왜 성능에 중요합니까?

5

Neo4j에서 사용자의 친구의 친구를 모두 찾는 Cypher 구문은 무엇입니까?

+17 면접 질문

다음 면접을 위해 Data Engineering을 마스터하세요

모든 질문, flashcards, 기술 테스트, 코드 리뷰 연습, 면접 시뮬레이터에 접근하세요.

무료로 시작하기