Learning Strides in Convolutional Neural Networks(ICLR 2022)

카테고리

분류 전체보기

Learning Strides in Convolutional Neural Networks(ICLR 2022)

카테고리 없음 2022. 12. 2. 13:40 Posted by taejoopark

안녕하세요. KDST팀 학부연구생 박태주입니다. 9월 23일 진행했던 논문세미나 내용에 대해 간단하게 요약해보도록 하겠습니다.

CNN에서 downsampling을 하는 것이 이미지의 해상도를 줄이며 중요한 정보만 뽑게됩니다. 기존의 striding은 미분 불가능해서 학습이 불가능해 hyper-parameter로 설정을 해줘야했습니다. 본 논문에서는 미분이 가능한 stride인 "DiffStride" 방식을 제안합니다.

spatial domain의 이미지를 푸리에 변환을 통해 frequency domain으로 표현하고, cropping window(masking function)를 사용하여 downsampling을 진행합니다. 마지막으로 다시 역변환으로 spatial domain으로 이미지를 표현합니다. 이때 backpropagation으로 masking function의 크기를 학습할 수 있어 결과적으로 stride를 학습할 수 있게 됩니다. Audio classification과 Image classification에서 기존의 fixed stride에 비해 "DiffStride"의 성능이 더 잘 나오는 것도 확인할 수 있습니다.

감사합니다.

KDST는 딥러닝을 포함한 데이터와 지능에 관련된 여러 주제에 대해서 연구하는 팀입니다.
KDST

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

KDST

카테고리

Learning Strides in Convolutional Neural Networks(ICLR 2022)

tag cloud

공지사항

최근댓글

최근기사

글보관함

링크

티스토리툴바