Chapter 14. 합성곱 신경망(CNN) 구조

합성곱 신경망(Convolutional Neural Network, CNN)은 영상과 같이 격자 구조를 가진 데이터에 특화된 인공 신경망의 한 부류이다. 합성곱 신경망은 합성곱 연산, 가중치 공유, 지역 연결, 풀링 등의 학술적 원리를 결합하여 영상의 공간적 구조를 효과적으로 활용한다. 이 장에서는 합성곱 신경망의 학술적 정의, 기본 구성 요소, 대표적 아키텍처, 수용 영역, 매개 변수와 연산량 분석을 학습 순서에 따라 다룬다.

1. 학습 목표

합성곱 신경망의 학술적 동기와 발전 배경을 이해한다.
합성곱층, 풀링층, 완전 연결층의 학술적 정의와 그 역할을 학습한다.
LeNet, AlexNet, VGGNet, GoogLeNet, ResNet 등 대표적 합성곱 신경망 아키텍처의 학술적 의의를 이해한다.
수용 영역, 매개 변수의 수, 연산량 등 합성곱 신경망의 분석적 측면을 학습한다.

2. 학습 순서

이 장은 합성곱 신경망의 개요와 발전 배경에서 출발하여, 기본 구성 요소인 합성곱층, 풀링층, 완전 연결층의 정의로 진행한다. 이후 LeNet에서 ResNet에 이르는 대표적 아키텍처의 학술적 의의를 다루고, 마지막으로 수용 영역과 매개 변수·연산량 분석을 학습한다.

3. 출처 및 버전 정보

LeCun, Y., Bottou, L., Bengio, Y., Haffner, P., Gradient-based learning applied to document recognition, Proceedings of the IEEE, 1998
Krizhevsky, A., Sutskever, I., Hinton, G. E., ImageNet Classification with Deep Convolutional Neural Networks, Advances in Neural Information Processing Systems, 2012
Simonyan, K., Zisserman, A., Very Deep Convolutional Networks for Large-Scale Image Recognition, International Conference on Learning Representations, 2015
Szegedy, C., 외, Going Deeper with Convolutions, IEEE Conference on Computer Vision and Pattern Recognition, 2015
He, K., Zhang, X., Ren, S., Sun, J., Deep Residual Learning for Image Recognition, IEEE Conference on Computer Vision and Pattern Recognition, 2016
Goodfellow, I., Bengio, Y., Courville, A., Deep Learning, MIT Press, 2016