본문 바로가기
  • 머킹이의 머신로그
AI

[용어정리]SRGAN 모델

by 머킹 2024. 1. 25.
728x90

[딥러닝 용어정리]SRGAN 모델 정리

 

SRGAN(Super Resolution GAN)

CNN이 비슷한 특징을 추출하도로 생성자가 학습됩니다.

생성자, 감별자와 별도로 특징 추출기가 필요합니다.

 

화질을 높이기 위해 제안된 모델입니다.

특정 공간 상의 점을 입력으로 받는 GAN과 달리 SRGAN은 이미지를 입력으로 받습니다.

1. 생성자는 이미지로부터 특징을 추출하고, 추출된 특징을 바탕으로 해상도를 높인 이미지를 출력으로 내보냅니다.

2. 감별자는 기존과 마찬가지로 실제의 이미지와 생성자가 만들어낸 이미지를 구별하도록 학습합니다.

3. 사전에 학습된 CNN을 준비해서 생성자가 만든 이미지와 실제 이미지가 CNN의 입력으로 들어갔을 때, 특징이 비슷하게 추출되도록 학습이 이루어집니다.

 

 

L1 손실, L2 손실

정답과 예측값의 차이의 절댓값입니다.

L2 손실은 정답과 예측값의 차를 제곱합니다.

SRGAN의 특징 맵을 비교할 때는 L1 손실을 이용합니다.

특징 맵의 픽셀은 대부분 0과 1사이의 값으로 이루어져 있어서 L2 손실을 이용하면 오차가 오히려 작아지기 때문입니다.

 

L1 규제 

- 손실 함수에 가중치 크기를 더해 주는 기법입니다.

불필요한 가중치를 제거하는 데 사용합니다.

 

L2 규제

- 손실 함수에 가중치 크기의 제곱을 더해주는 기법입니다.

오버피팅을 피하기 위해 사용합니다.

 

 

GAN 손실과 콘텐츠 손실

GAN 손실은 감별자를 속이도록 하고

콘텐츠 손실은 특징 추출기가 비슷한 특징을 추출하도록 합니다.

 

 

GAN 손실에 붙는 계수

이미지의 선명도를 결정합니다.

계수가 커질수록 또렷한 이미지를 만들지만 왜곡이 심해지고, 

값이 작을수록 왜곡이 덜 하지만 이미지가 또렷하지 못합니다.

 

 

픽셀 셔플(PixelShuffle)

이미지 크기를 특징 맵의 배치를 바꿔서 키우는 알고리즘 입니다.

픽셀 셔플은 가중치를 가지지 않습니다.

바로 픽셀 셔플을 이용하면 특징 맵으로부터 정보를 복원할 수가 없습니다.

따라서 픽셀 셔플을 하기 전에 합성곱을 이용해 특징을 한 번 추출한 다음 픽셀 셔플을 해야합니다.