Data Science & ML

CNN y clasificación de imágenes

Convolutions, pooling, arquitecturas (VGG, ResNet), transfer learning, data augmentation, fine-tuning

24 preguntas de entrevista·
Senior
1

¿Qué es una operación de convolution en un CNN?

Respuesta

Una convolution es una operación matemática que aplica un filtro (kernel) sobre una imagen deslizando ese filtro por la entrada y calculando el producto escalar en cada posición. Esto permite extraer features locales como bordes, texturas o patrones. A diferencia de las redes densas, donde cada neurona se conecta a todas las entradas, la convolution aprovecha la estructura espacial de las imágenes compartiendo los pesos del filtro en toda la imagen.

2

¿Cuál es el rol del stride en una capa de convolution?

Respuesta

El stride define el tamaño del paso al mover el filtro sobre la imagen. Un stride de 1 desplaza el filtro un píxel en cada paso, mientras que un stride de 2 lo desplaza 2 píxeles, reduciendo así el tamaño de salida. Aumentar el stride permite reducir la dimensión espacial de la feature map y el coste computacional, pero también puede causar pérdida de información si el stride es demasiado grande.

3

¿Cuál es el objetivo del padding en una capa de convolution?

Respuesta

El padding consiste en añadir píxeles (generalmente ceros) alrededor de la imagen de entrada antes de aplicar la convolution. Esto permite controlar el tamaño de salida y preservar la información en los bordes de la imagen. Con padding 'same', la salida tiene el mismo tamaño que la entrada, mientras que con 'valid' (sin padding), el tamaño disminuye. El padding también evita que los píxeles de los bordes estén subrepresentados en las feature maps.

4

¿Cuál es la diferencia entre Max Pooling y Average Pooling?

5

¿Qué es una feature map en un CNN?

+21 preguntas de entrevista

Domina Data Science & ML para tu próxima entrevista

Accede a todas las preguntas, flashcards, tests técnicos, ejercicios de code review y simuladores de entrevista.

Empieza gratis