론리나잇 2025. 4. 19. 23:59

 

이 문제는 CNN(Convolutional Neural Network)에서 합성곱 연산(convolution operation) 후 출력 feature map의 크기를 계산하는 전형적인 문제입니다.


📌 주어진 조건

  • 입력 이미지 크기: 5 × 5
  • 필터(커널) 크기: 3 × 3
  • 스트라이드(stride): 1
  • 패딩(padding): 없음 (valid padding)

✅ 출력 크기 계산 공식

출력 크기 = [(입력 크기 - 필터 크기) / 스트라이드] + 1

이걸 각 축(가로, 세로)에 대해 적용합니다.

가로(height 또는 width) 방향 계산:

[(5 - 3) / 1] + 1 = 3

따라서 출력 크기는:

3 × 3

✅ 정답

② 3×3

필터를 이미지 위에서 이동시키면서 계산할 수 있는 위치가 총 3×3개라는 의미입니다.

 

 

추가정보 : 스트라이드(stride)는 합성곱(Convolution) 또는 풀링(Pooling) 연산에서 필터(커널)를 한 번에 얼만큼 이동시킬지를 정하는 값입니다.

 

📌 쉽게 말해서…

  • 스트라이드가 1이면 필터가 한 칸씩 옆으로 또는 아래로 이동합니다.
  • 스트라이드가 2이면 필터가 두 칸씩 점프하면서 이동합니다.

📷 예시 (입력 이미지 5×5, 필터 3×3)

  • Stride = 1
    • 필터가 좌→우, 상→하 방향으로 한 칸씩 이동하면서 총 3×3의 출력이 나옵니다.
  • Stride = 2
    • 필터가 두 칸씩 이동하므로 출력 크기는 작아져서 2×2가 됩니다.

📌 정리하면:

스트라이드 값의미결과 출력 크기 영향
1 필터가 한 칸씩 이동 출력 크기 큼
2 이상 필터가 두 칸 이상씩 점프 이동 출력 크기 작아짐

필터가 얼마나 세밀하게 이미지를 훑을지 결정하는 "보폭" 또는 "간격" 이라고 생각하면 됩니다.