딥러닝/컴퓨터비전

[컴퓨터비전6]GoogLeNet(ILSVRC 2014 top1)

데이터요리사 2021. 12. 13. 12:44

1. 개요

  • 구글에서 개발한 CNN구조로 2014년 ILSVRC에서 에러율 00%로 1위를 차지한 신경망
  • 총 22개의 레이어로 구성 

 2. 특징

  • 인셉션(Inception) 모듈(Parallel filters concatenation)
    • 다른 사이즈의 필터(1x1, 3x3, 5x5)를 사용하는 컨볼루션을 병렬로 연결하여, 다른 특징을 추출하도록 함
    • split - transform - merge 전략
    • 총 9개의 인셉션 모듈 사용
  • Bottleneck 구조(1x1 filter)
    • 연산 시 발생하는 bottleneck을 제거하기 위해 채널 차원의 차원 축소를 진행
    • 피처 추출 능력은 없으나, 컨볼루션 연산 시 비선형성을 더함
  • 보조 분류기
    • 분류의 변별력을 높이기 위해, 역전파 시 gradient signal을 증가하도록 2개의 보조 분류기를 사용
    • 학습할 때만 사용하고, 추론과정에서는 사용하지 않음

3. 구조

728x90