
Data Cleaning - การทำความสะอาดข้อมูล
ค่าที่หายไป, รายการซ้ำ, outlier, กฎทางธุรกิจ, การแปลง, คุณภาพข้อมูล
1missing value ในชุดข้อมูลคืออะไร?
missing value ในชุดข้อมูลคืออะไร?
คำตอบ
missing value แสดงถึงข้อมูลที่ขาดหายไปหรือไม่ได้กรอกในฟิลด์ อาจปรากฏเป็นเซลล์ว่าง NULL ในฐานข้อมูล หรือ NaN ใน DataFrame การระบุ missing value เป็นขั้นตอนแรกของการทำความสะอาดข้อมูลเพราะอาจทำให้การวิเคราะห์ทางสถิติและการรวมข้อมูลคลาดเคลื่อน
2ความแตกต่างระหว่างค่า NULL กับสตริงว่างในฐานข้อมูลคืออะไร?
ความแตกต่างระหว่างค่า NULL กับสตริงว่างในฐานข้อมูลคืออะไร?
คำตอบ
NULL หมายถึงค่าที่ไม่ทราบหรือไม่มีอยู่ ในขณะที่สตริงว่างคือค่าที่ทราบแต่ว่างเปล่า ความแตกต่างนี้เป็นพื้นฐานใน SQL เพราะ NULL ไม่สามารถเปรียบเทียบด้วยตัวดำเนินการ = (ต้องใช้ IS NULL) ในขณะที่สตริงว่างสามารถเปรียบเทียบได้ตามปกติด้วย = ''
3รายการซ้ำ (duplicate) ในชุดข้อมูลคืออะไร?
รายการซ้ำ (duplicate) ในชุดข้อมูลคืออะไร?
คำตอบ
รายการซ้ำคือเรกคอร์ดที่ปรากฏมากกว่าหนึ่งครั้งในชุดข้อมูล โดยอาจเป็นแบบตรงทุกประการ (ทุกคอลัมน์เหมือนกัน) หรือบางส่วน (บางคอลัมน์คีย์เหมือนกัน) รายการซ้ำทำให้การนับ การรวม และการเฉลี่ยคลาดเคลื่อน การตรวจหามักอาศัยการระบุคอลัมน์คีย์ที่ควรจะไม่ซ้ำกัน
เทคนิคใดที่ช่วยให้สามารถตรวจจับรายการซ้ำที่ตรงทุกประการใน SQL ได้?
outlier (ค่าผิดปกติ) ในชุดข้อมูลคืออะไร?
+17 คำถามสัมภาษณ์
หัวข้อสัมภาษณ์ Data Analytics อื่นๆ
Google Sheets - พื้นฐาน
Google Sheets - สูตรขั้นสูง
SQL - พื้นฐาน
SQL - การรวมและการจัดกลุ่ม
SQL - Joins
BigQuery - พื้นฐาน
KPI และเมตริกทางธุรกิจ
สถิติเชิงพรรณนา
Zapier และระบบอัตโนมัติ No-Code
หลักการ Data Visualization
Python & Pandas - พื้นฐาน
Google Sheets - แดชบอร์ดอัตโนมัติ
SQL - Subquery และ CTE
SQL - Window Functions
BigQuery - ฟีเจอร์ขั้นสูง
Data Modeling
การวิเคราะห์ Funnel และ Conversion
การวิเคราะห์ Cohort และ Retention
Google Tag Manager และการติดตาม
API และ Webhook
dbt - พื้นฐาน
AB Testing และสถิติประยุกต์
Looker Studio (Google Data Studio)
Power BI - พื้นฐาน
SQL - การคิวรีเชิงวิเคราะห์ขั้นสูง
dbt - ฟีเจอร์ขั้นสูง
Power BI - DAX และแดชบอร์ดขั้นสูง
Python Analytics - การวิเคราะห์ขั้นสูงและ ML
เชี่ยวชาญ Data Analytics สำหรับการสัมภาษณ์ครั้งถัดไป
เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์
เริ่มใช้ฟรี