Maxima's Lab

[Paper Review (논문 리뷰)] U-Net: Convolutional Networks for Biomedical Image Segmentation 본문

Paper Review

[Paper Review (논문 리뷰)] U-Net: Convolutional Networks for Biomedical Image Segmentation

Minima 2022. 8. 23. 22:23
728x90
SMALL

안녕하세요, 오늘은

"U-Net: Convolutional Networks for Biomedical Image Segmentation"

 

위 논문에 대해서 리뷰를 해보도록 하겠습니다.

 

먼저 U-Net의 전체 구조에 대해서 살펴보겠습니다.

 

U-Net 구조

 

위의 U-Net의 구조를 보시면 전체적으로 왼쪽, 오른쪽 부분을 나눠서 생각할 수 있습니다.

 

  • Left side : Convolution(3x3, ReLU), Max Pooling(Downsampling), Crop
  • Right side : Convolution(3x3, ReLU), Convolution(1x1, ReLU), Upsampling, Copy

왼쪽과 오른쪽 부분 모두 Convolution(ReLU)가 동일하게 사용된다는 공통점이 있지만, 왼쪽은 Max Pooling(Downsampling)을 하고, 오른쪽은 Upsampling을 한다는 점이 다릅니다. 추가적으로, 왼쪽에서 특정 Layer의 결과를 Crop해서 오른쪽에서 Copy 하는 작업을 진행합니다.

 

최종적으로, 마지막 Layer에서 (None, 388, 388, 64)의 Shape에서 Convolution(1x1)을 통해 64개의 channels의 Feauture vectors를 Classes 수에 매핑시키는 작업을 진행하게 됩니다.

 

그럼, U-Net 구조에서 Crop과 Copy를 적용하는 이유는 무엇일까요?

그것은 많은 Convolution Layer를 지나서 마지막 Layer까지 가장자리 픽셀 정보들에 대한 손실을 줄이기 위함입니다.

 


지금까지,

 

"U-Net: Convolutional Networks for Biomedical Image Segmentation"

 

위 논문에 대해서 알아보았습니다.

 


Reference

728x90
LIST
Comments