Data Science & ML

CNN e classificazione di immagini

Convolutions, pooling, architetture (VGG, ResNet), transfer learning, data augmentation, fine-tuning

24 domande da colloquio·
Senior
1

Cos'è un'operazione di convolution in una CNN?

Risposta

Una convolution è un'operazione matematica che applica un filtro (kernel) su un'immagine facendo scorrere questo filtro sull'input e calcolando il prodotto scalare in ogni posizione. Questo permette di estrarre feature locali come bordi, texture o pattern. A differenza delle reti dense, dove ogni neurone è connesso a tutti gli input, la convolution sfrutta la struttura spaziale delle immagini condividendo i pesi del filtro su tutta l'immagine.

2

Qual è il ruolo dello stride in un livello di convolution?

Risposta

Lo stride definisce la dimensione del passo quando si muove il filtro attraverso l'immagine. Uno stride di 1 sposta il filtro di un pixel a ogni passo, mentre uno stride di 2 lo sposta di 2 pixel, riducendo così la dimensione di output. Aumentare lo stride permette di ridurre la dimensione spaziale della feature map e il costo computazionale, ma può anche causare perdita di informazione se lo stride è troppo grande.

3

Qual è lo scopo del padding in un livello di convolution?

Risposta

Il padding consiste nell'aggiungere pixel (generalmente zeri) attorno all'immagine di input prima di applicare la convolution. Questo permette di controllare la dimensione di output e di preservare le informazioni ai bordi dell'immagine. Con padding 'same', l'output ha la stessa dimensione dell'input, mentre con 'valid' (senza padding), la dimensione diminuisce. Il padding evita anche che i pixel dei bordi siano sotto-rappresentati nelle feature map.

4

Qual è la differenza tra Max Pooling e Average Pooling?

5

Cos'è una feature map in una CNN?

+21 domande da colloquio

Padroneggia Data Science & ML per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis