Data Engineering

ฐานข้อมูล NoSQL

GraphDB (Neo4j), Document DBs (MongoDB, Firestore), Wide Column (Cassandra, Bigtable), ทฤษฎีบท CAP, กรณีการใช้งาน

20 คำถามสัมภาษณ์·
Senior
1

ทฤษฎีบท CAP คืออะไรและคุณสมบัติทั้งสามของมันคืออะไร?

คำตอบ

ทฤษฎีบท CAP ระบุว่าระบบแบบกระจายสามารถรับประกันคุณสมบัติเพียงสองในสามอย่างพร้อมกันเท่านั้น: Consistency (โหนดทั้งหมดเห็นข้อมูลเดียวกัน), Availability (ระบบตอบสนองเสมอ) และ Partition tolerance (ระบบทำงานต่อไปแม้จะมีการแบ่งเครือข่าย) ทฤษฎีบทนี้เป็นพื้นฐานสำหรับการทำความเข้าใจการแลกเปลี่ยนด้านสถาปัตยกรรมในฐานข้อมูล NoSQL

2

ความแตกต่างหลักระหว่างฐานข้อมูล Document (MongoDB) และฐานข้อมูล Wide Column (Cassandra) คืออะไร?

คำตอบ

ฐานข้อมูล Document เช่น MongoDB เก็บเอกสาร JSON/BSON ด้วย schema ที่ยืดหยุ่นและรองรับ query ที่ซับซ้อนบนฟิลด์ใดๆ ฐานข้อมูล Wide Column เช่น Cassandra จัดระเบียบข้อมูลในรูปแบบ column family พร้อม partition key ซึ่งปรับให้เหมาะกับการเขียนจำนวนมากและการอ่านตาม key MongoDB เก่งในข้อมูลแบบลำดับชั้น Cassandra เก่งในข้อมูลอนุกรมเวลาความเร็วสูง

3

ในกรณีการใช้งานใดควรเลือก Neo4j มากกว่า MongoDB หรือ Cassandra?

คำตอบ

Neo4j เป็นฐานข้อมูลกราฟที่ปรับให้เหมาะกับความสัมพันธ์ที่ซับซ้อนหลายระดับระหว่างเอนทิตี เก่งในด้านโซเชียลเน็ตเวิร์ก ระบบแนะนำ การตรวจจับการฉ้อโกง และการวิเคราะห์การพึ่งพา ภาษา Cypher ช่วยให้สามารถข้ามผ่านความสัมพันธ์นับล้านในไม่กี่มิลลิวินาที ในที่ที่ SQL join หรือ NoSQL lookup จะช้าเกินไปในแง่ของประสิทธิภาพ

4

Partition key ใน Cassandra คืออะไรและทำไมจึงสำคัญต่อประสิทธิภาพ?

5

ไวยากรณ์ Cypher ในการค้นหาเพื่อนของเพื่อนทั้งหมดของผู้ใช้ใน Neo4j คืออะไร?

+17 คำถามสัมภาษณ์

หัวข้อสัมภาษณ์ Data Engineering อื่นๆ

Linux & Shell - พื้นฐาน

Junior
20 คำถาม

Git & GitHub - พื้นฐาน

Junior
20 คำถาม

Python ขั้นสูงสำหรับ Data Engineering

Junior
25 คำถาม

Docker - พื้นฐาน

Junior
25 คำถาม

Google Cloud Platform - พื้นฐาน

Junior
20 คำถาม

CI/CD และคุณภาพโค้ด

Mid-Level
20 คำถาม

Docker Compose

Mid-Level
20 คำถาม

FastAPI - Data API

Mid-Level
20 คำถาม

SQL ขั้นสูงสำหรับ Data Engineering

Mid-Level
20 คำถาม

Data Lake - สถาปัตยกรรมและการนำเข้าข้อมูล

Mid-Level
20 คำถาม

BigQuery สำหรับ Data Engineering

Mid-Level
20 คำถาม

PostgreSQL - การดูแลระบบ

Mid-Level
20 คำถาม

Data Modeling สำหรับ Data Engineering

Mid-Level
20 คำถาม

Fivetran & Airbyte - การนำเข้าข้อมูล

Mid-Level
20 คำถาม

dbt - พื้นฐาน

Mid-Level
20 คำถาม

Apache Airflow - พื้นฐาน

Mid-Level
20 คำถาม

Kubernetes - พื้นฐาน

Mid-Level
20 คำถาม

dbt - ฟีเจอร์ขั้นสูง

Senior
20 คำถาม

รูปแบบ ETL / ELT / ETLT

Senior
20 คำถาม

Apache Airflow - ขั้นสูง

Senior
20 คำถาม

Airflow + dbt - การจัดการ Pipeline

Senior
20 คำถาม

PySpark - การประมวลผลขนาดใหญ่

Senior
20 คำถาม

Google Pub/Sub - การสตรีมข้อมูล

Senior
20 คำถาม

Apache Beam & Dataflow

Senior
20 คำถาม

Kubernetes - Production และ Scaling

Senior
20 คำถาม

Terraform - Infrastructure as Code

Senior
20 คำถาม

Data Architecture สมัยใหม่

Senior
20 คำถาม

การมอนิเตอร์และการสังเกตการณ์

Senior
20 คำถาม

IAM และความปลอดภัยของข้อมูล

Senior
20 คำถาม

เชี่ยวชาญ Data Engineering สำหรับการสัมภาษณ์ครั้งถัดไป

เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์

เริ่มใช้ฟรี