Data Science & ML

CNN と画像分類

Convolution、pooling、アーキテクチャ(VGG、ResNet)、transfer learning、data augmentation、fine-tuning

24 面接問題·
Senior
1

CNN における convolution 演算とは何ですか?

回答

Convolution は、フィルター(kernel)を入力上でスライドさせ、各位置でドット積を計算することで画像にフィルターを適用する数学的演算です。これにより、エッジ、テクスチャ、パターンなどの局所的な特徴を抽出できます。各ニューロンがすべての入力に接続される dense network とは異なり、convolution は画像全体でフィルターの重みを共有することで画像の空間構造を活用します。

2

Convolution 層における stride の役割は何ですか?

回答

Stride は画像上でフィルターを移動させるときのステップサイズを定義します。Stride が 1 の場合、フィルターは各ステップで 1 ピクセルずつ移動し、stride が 2 の場合は 2 ピクセルずつ移動するため、出力サイズが縮小されます。Stride を増やすと feature map の空間次元と計算コストを削減できますが、stride が大きすぎると情報損失を引き起こす可能性があります。

3

Convolution 層における padding の目的は何ですか?

回答

Padding は convolution を適用する前に入力画像の周りにピクセル(通常はゼロ)を追加することです。これにより、出力サイズを制御し、画像の端の情報を保持できます。'Same' padding では出力は入力と同じサイズになりますが、'valid'(padding なし)ではサイズが小さくなります。Padding は feature map において端のピクセルが過小評価されることも防ぎます。

4

Max Pooling と Average Pooling の違いは何ですか?

5

CNN における feature map とは何ですか?

+21 面接問題

次の面接に向けてData Science & MLをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める