Data Science & ML

CNN i klasyfikacja obrazów

Convolutions, pooling, architektury (VGG, ResNet), transfer learning, data augmentation, fine-tuning

24 pytań z rozmów·
Senior
1

Czym jest operacja convolution w CNN?

Odpowiedź

Convolution to operacja matematyczna, która stosuje filtr (kernel) na obrazie, przesuwając ten filtr po wejściu i obliczając iloczyn skalarny w każdej pozycji. Pozwala to wyodrębnić lokalne feature, takie jak krawędzie, tekstury lub wzorce. W przeciwieństwie do sieci dense, gdzie każdy neuron jest połączony ze wszystkimi wejściami, convolution wykorzystuje strukturę przestrzenną obrazów, dzieląc wagi filtra w całym obrazie.

2

Jaka jest rola stride w warstwie convolution?

Odpowiedź

Stride definiuje rozmiar kroku podczas przesuwania filtra po obrazie. Stride 1 przesuwa filtr o jeden piksel w każdym kroku, podczas gdy stride 2 przesuwa go o 2 piksele, zmniejszając w ten sposób rozmiar wyjścia. Zwiększenie stride pozwala zmniejszyć wymiar przestrzenny feature map i koszt obliczeniowy, ale może również powodować utratę informacji, jeśli stride jest zbyt duży.

3

Jaki jest cel paddingu w warstwie convolution?

Odpowiedź

Padding polega na dodaniu pikseli (zwykle zer) wokół obrazu wejściowego przed zastosowaniem convolution. Pozwala to kontrolować rozmiar wyjścia i zachować informacje na krawędziach obrazu. Z paddingiem 'same' wyjście ma taki sam rozmiar jak wejście, podczas gdy z 'valid' (bez paddingu) rozmiar maleje. Padding zapobiega również niedoreprezentowaniu pikseli krawędziowych w feature map.

4

Jaka jest różnica między Max Pooling a Average Pooling?

5

Czym jest feature map w CNN?

+21 pytań z rozmów

Opanuj Data Science & ML na następną rozmowę

Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.

Zacznij za darmo