Data Science & ML

CNN và phân loại hình ảnh

Convolutions, pooling, kiến trúc (VGG, ResNet), transfer learning, data augmentation, fine-tuning

24 câu hỏi phỏng vấn·
Senior
1

Phép convolution trong CNN là gì?

Câu trả lời

Convolution là một phép toán toán học áp dụng bộ lọc (kernel) lên hình ảnh bằng cách trượt bộ lọc này trên đầu vào và tính tích vô hướng tại mỗi vị trí. Điều này cho phép trích xuất các feature cục bộ như cạnh, texture hoặc mẫu. Khác với mạng dense nơi mỗi nơ-ron được kết nối với tất cả đầu vào, convolution khai thác cấu trúc không gian của hình ảnh bằng cách chia sẻ trọng số bộ lọc trên toàn bộ hình ảnh.

2

Vai trò của stride trong lớp convolution là gì?

Câu trả lời

Stride xác định kích thước bước khi di chuyển bộ lọc qua hình ảnh. Stride bằng 1 di chuyển bộ lọc một pixel mỗi bước, trong khi stride bằng 2 di chuyển nó 2 pixel, do đó giảm kích thước đầu ra. Tăng stride cho phép giảm kích thước không gian của feature map và chi phí tính toán, nhưng cũng có thể gây mất thông tin nếu stride quá lớn.

3

Mục đích của padding trong lớp convolution là gì?

Câu trả lời

Padding bao gồm việc thêm các pixel (thường là số không) xung quanh hình ảnh đầu vào trước khi áp dụng convolution. Điều này cho phép kiểm soát kích thước đầu ra và bảo toàn thông tin ở các cạnh hình ảnh. Với padding 'same', đầu ra có cùng kích thước với đầu vào, trong khi với 'valid' (không padding), kích thước giảm. Padding cũng ngăn các pixel ở cạnh bị thiếu đại diện trong feature map.

4

Sự khác biệt giữa Max Pooling và Average Pooling là gì?

5

Feature map trong CNN là gì?

+21 câu hỏi phỏng vấn

Nắm vững Data Science & ML cho lần phỏng vấn tiếp theo

Truy cập tất cả câu hỏi, flashcards, bài kiểm tra kỹ thuật, bài tập code review và mô phỏng phỏng vấn.

Bắt đầu miễn phí