Data Science & ML

BigQuery & Cloud Data

BigQuery, การคิวรี SQL ขนาดใหญ่, การแบ่งพาร์ติชัน, ชุดข้อมูลสาธารณะ, ต้นทุน, การเพิ่มประสิทธิภาพ

18 คำถามสัมภาษณ์·
Mid-Level
1

Google BigQuery คืออะไร?

คำตอบ

BigQuery เป็น data warehouse แบบ serverless ที่ปรับขนาดได้สูงและคุ้มค่าซึ่งให้บริการโดย Google Cloud Platform ช่วยให้สามารถรันคิวรี SQL เชิงวิเคราะห์บนข้อมูลระดับเพตะไบต์ได้ในไม่กี่วินาทีด้วยสถาปัตยกรรมแบบกระจาย ต่างจากฐานข้อมูลแบบดั้งเดิม BigQuery แยกการจัดเก็บออกจากการประมวลผล ทำให้สามารถคิดค่าใช้จ่ายตามการใช้งานและขยายขนาดได้แทบไม่จำกัด

2

อะไรคือข้อได้เปรียบหลักของสถาปัตยกรรม serverless ของ BigQuery?

คำตอบ

สถาปัตยกรรม serverless ของ BigQuery หมายความว่าไม่มีโครงสร้างพื้นฐานที่ต้องจัดการ: ไม่ต้องจัดเตรียมเซิร์ฟเวอร์ ไม่ต้องกำหนดค่าคลัสเตอร์ ไม่ต้องบำรุงรักษา Google จัดการทรัพยากรโดยอัตโนมัติตามความต้องการ สิ่งนี้ช่วยให้สามารถมุ่งเน้นไปที่การคิวรีและการวิเคราะห์แทนการดูแลระบบ พร้อมรับประโยชน์จากความสามารถในการปรับขนาดอัตโนมัติ

3

BigQuery คิดค่าใช้จ่ายสำหรับคิวรีในโหมด on-demand อย่างไร?

คำตอบ

ในโหมด on-demand BigQuery คิดค่าใช้จ่ายตามจำนวนข้อมูลที่สแกนโดยคิวรี ไม่ใช่เวลาในการดำเนินการหรือจำนวนแถวที่ส่งคืน เทอราไบต์แรกที่สแกนต่อเดือนฟรี ดังนั้นจึงเป็นสิ่งสำคัญที่จะปรับคิวรีให้เหมาะสมโดยเลือกเฉพาะคอลัมน์ที่จำเป็นและใช้การแบ่งพาร์ติชันเพื่อลดต้นทุน

4

Dataset ใน BigQuery คืออะไร?

5

การแบ่งพาร์ติชันตารางใน BigQuery คืออะไรและข้อได้เปรียบหลักคืออะไร?

+15 คำถามสัมภาษณ์

หัวข้อสัมภาษณ์ Data Science & ML อื่นๆ

พื้นฐาน Python

Junior
25 คำถาม

การเขียนโปรแกรมเชิงวัตถุด้วย Python

Junior
20 คำถาม

โครงสร้างข้อมูล Python

Junior
20 คำถาม

พื้นฐาน Git

Junior
18 คำถาม

พื้นฐาน SQL

Junior
20 คำถาม

พื้นฐาน NumPy

Junior
22 คำถาม

พื้นฐาน Pandas

Junior
22 คำถาม

Jupyter & Google Colab

Junior
16 คำถาม

SQL Joins และคิวรีขั้นสูง

Mid-Level
22 คำถาม

Pandas ขั้นสูง

Mid-Level
24 คำถาม

การแสดงผลข้อมูลด้วย Matplotlib & Seaborn

Mid-Level
20 คำถาม

การแสดงผลแบบโต้ตอบด้วย Plotly

Mid-Level
18 คำถาม

สถิติเชิงพรรณนา

Mid-Level
20 คำถาม

สถิติเชิงอนุมาน

Mid-Level
24 คำถาม

Web Scraping

Mid-Level
18 คำถาม

Feature Engineering

Mid-Level
22 คำถาม

ML แบบมีผู้สอน: การถดถอย

Mid-Level
24 คำถาม

ML แบบมีผู้สอน: การจำแนกประเภท

Mid-Level
24 คำถาม

Decision Trees และ Ensembles

Mid-Level
24 คำถาม

Unsupervised ML

Mid-Level
22 คำถาม

ML Pipelines และการตรวจสอบ

Mid-Level
22 คำถาม

Time Series และการพยากรณ์

Mid-Level
22 คำถาม

พื้นฐาน Deep Learning

Senior
24 คำถาม

TensorFlow & Keras

Senior
22 คำถาม

CNN และการจำแนกภาพ

Senior
24 คำถาม

RNN และซีเควนซ์

Senior
22 คำถาม

Transformers และ Attention

Senior
24 คำถาม

NLP และ Hugging Face

Senior
24 คำถาม

GenAI และ LangChain

Senior
24 คำถาม

MLOps และการ Deploy

Senior
24 คำถาม

เชี่ยวชาญ Data Science & ML สำหรับการสัมภาษณ์ครั้งถัดไป

เข้าถึงคำถามทั้งหมด flashcards แบบทดสอบเทคนิค แบบฝึกหัด code review และตัวจำลองสัมภาษณ์

เริ่มใช้ฟรี