Data Science & ML

CNN e classificação de imagens

Convolutions, pooling, arquiteturas (VGG, ResNet), transfer learning, data augmentation, fine-tuning

24 perguntas de entrevista·
Senior
1

O que é uma operação de convolution em uma CNN?

Resposta

Uma convolution é uma operação matemática que aplica um filtro (kernel) sobre uma imagem deslizando esse filtro pela entrada e calculando o produto escalar em cada posição. Isso permite extrair features locais como bordas, texturas ou padrões. Diferente das redes densas, onde cada neurônio é conectado a todas as entradas, a convolution explora a estrutura espacial das imagens compartilhando os pesos do filtro em toda a imagem.

2

Qual é o papel do stride em uma camada de convolution?

Resposta

O stride define o tamanho do passo ao mover o filtro pela imagem. Um stride de 1 move o filtro um pixel a cada passo, enquanto um stride de 2 o move 2 pixels, reduzindo assim o tamanho de saída. Aumentar o stride permite reduzir a dimensão espacial da feature map e o custo computacional, mas também pode causar perda de informação se o stride for muito grande.

3

Qual é o objetivo do padding em uma camada de convolution?

Resposta

O padding consiste em adicionar pixels (geralmente zeros) ao redor da imagem de entrada antes de aplicar a convolution. Isso permite controlar o tamanho de saída e preservar as informações nas bordas da imagem. Com padding 'same', a saída tem o mesmo tamanho que a entrada, enquanto com 'valid' (sem padding), o tamanho diminui. O padding também evita que os pixels das bordas fiquem sub-representados nas feature maps.

4

Qual é a diferença entre Max Pooling e Average Pooling?

5

O que é uma feature map em uma CNN?

+21 perguntas de entrevista

Domine Data Science & ML para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis