본문 바로가기
  • 머킹이의 머신로그
AI

[용어 정리] 이미지 처리 딥러닝

by 머킹 2024. 1. 15.
728x90

[딥러닝 용어] 이미지 처리 딥러닝

 

합성곱

작은 필터를 이용해 이미지로부터 특징을 뽑아내는 알고리즘

 

 

CNN

합성곱층을 반복적으로 쌓아서 만든 인공 신경망

 

 

특징 맵

합성곱층의 결과

합성곱층이 특징을 추출한 뒤의 이미지

 

 

데이터 증강과 전처리

더 원활한 학습을 위해 데이터를 수정하는 기법.

데이터 증강은 이미지를 회전시키거나 잘라내는 등,

데이터 하나로 여러가지 형태의 다른 데이터를 만들어 개수를 늘리는 기법

 

데이터 전처리는 학습에 이용되기 이전에 처리하는 모든 기법을 의미함

데이터 증강도 데이터 전처리의 일종

 

 

이미지 정규화

이미지의 픽셀 간 편향을 제거하는 데 사용

각 채널의 분포가 동일해지므로 학습이 원활하게 이루어짐

 

 

패딩

이미지 외곽을 0으로 채우는 기법으로, 합성곱 전 후 이미지 크기를 같게 만들어 줌

 

 

크롭핑

이미지의 일부분을 잘라내는 것

 

 

최대 풀링

이미지 크기를 줄이는 데 사용하는 기법으로 커널에서 가장 큰 값을 이용

 

 

전이 학습

사전 학습된 모델의 파라미터를 수정해 자신의 데이터셋에 최적화시키는 방법

학습에 걸리는 시간을 단축함

 

 

스트라이드(Stride)

커널의 이동 거리

 

 

커널, 필터

커널은 이미지로부터 특징을 추출하기 위한 가중치를 행렬로 나타낸 것

또한 커널의 집합을 필터라고 부릅니다.

 

> 합성곱은 커널을 이미지 안에서 이리저리 움직이며 특징을 추출합니다.

따라서 볼 수 잇는 시야는 좁아지는 대신 위치와 무관하게 특징을 잡을 수 있습니다.

CNN 커널 크기는 변화가 없어서 이미지 크기와 무관하게 학습해야 하는 가중치 개수가 같습니다.

(학습할 가중치가 줄고, 특징의 위치에 대해 자유로워짐)

 

 

데이터 증강(data augmentation)

이미지에 여러 변형을 주어 이미지 개수를 늘리는 기법.

회전(Rotation), 크기 변경, 밀림(Shearing), 반사(Reflection), 이동(Translation) 등을 사용

 

 

 

정규화(Normalization)

데이터의 분포를 정규분포의 형태로 바꿔주는 것.

평균과 표준편차로 설명하는 분포로, 평균이 0, 표준편차가 1인 정규분포를 표준 정규분포라 부른다.

 

 

평탄화(Flatten)

MLP층의 입력으로 사용하도록 이미지를 1차원 벡터로 변환하는 층


CNN(Convolutional Neural Network) : 합성곱을 사용하는 신경망

이미지에 특징이 하나만 있는 게 아니기 때문에 CNN의 한 층에 필터를 여러 개 준비

 

합성곱의 계산법

1. 원본 이미지 준비

2. 합성곱 커널이 CNN에서 특징 추출

3. 특징 맵 추출

 


자주 사용되는 CNN 모델

 

VGG

특징 : 가장 기본이 되는 CNN.

VGG 이전의 CNN은 커널 크기가 커서 학습해야 하는 가중치 수가 많았지만

VGG는 3x3 크기의 커널을 이용해서 가중치 개수를 줄일 수 있습니다.

 

장점

- VGG는 단순한 구조를 가진 만큼 데이터가 무난한 성능을 발휘합니다.

- 구조가 간단하기 때문에 활용하기 간편합니다.

- 데이터가 깨끗하지 않을 때도 나쁘지 않은 성능을 보입니다.

 

단점

- 층이 깊어지면 기울기 소실 문제가 발생합니다.

- 학습이 불안정할 때가 있습니다.

 

 

ResNet

특징 : 입력 이미지와 특징 맵을 더하는 CNN.

층이 깊어질수록 역전파되는 오차가 작아지는 문제를 어느정도 해결함

VGG와는 비교도 안되는 깊이를 가졌음

 

 

Inception

특징 : 3x3 커널을 여러 번 중첩해 크기가 큰 커널을 근사했음

VGG보다 넓은 시야를 가지고 있으며 큰 크기의 커널보다 적은 수의 가중치로 비슷한 효과를 얻음