본문 바로가기
  • 머킹이의 머신로그

AI51

[용어 정리] GAN 생성 모델 [딥러닝 용어 정리] GAN 생성 모델 GAN 진짜와 가짜를 구별할 수 없을 정도로 정교한 가짜를 만드는 생성자를 학습하는 알고리즘입니다. 감별자 : 진짜와 가짜를 구별하도록 학습됩니다. 생성자 : 감별자를 속이도록 학습됩니다. 특징 공간 상에서 두 특징의 평균값은 두 특징의 중간 정도로 표현됩니다. 생성자는 특징 공간에 있는 임의의 점을 입력으로 받아 이미지를 출력합니다. 특징 공간은 이미지의 특징들로 표현되는 공간입니다. 감별자는 이미지를 받으면 해당 이미지가 컴퓨터가 만들어내는 이미지인지, 실제로 존재하는 이미지인지를 분류하는 이진분류기입니다. 가중치 초기화 신경망의 가중치를 초기화하는 방법을 말하며, 일반적으로 특정한 확률 분포를 따르도록 합니다. 특징공간 인공지능이 학습한 특징을 표현해놓은 공간.. 2024. 1. 24.
[용어정리] 캡처 텍스트 인식 CRNN+GRU [딥러닝 용어 정리] 이미지 텍스트 인식 CRNN, GRU CRNN CNN과 RNN을 혼합해 만든 모델입니다. 1. 입력 이미지가 2. CNN의 입력으로 들어갑니다. 3. 이미지로부터 추출된 특징은 가로 W개의 픽셀, 세로H개의 픽셀이 있습니다. 4. RNN에 입력으로 사용할 수 있게 시계열 형태로 바꿔줍니다. 5. 이미지로부터 추출된 특징의 세로 방향 픽셀의 값을 RNN층의 은닉 상태로 이용합니다. 장점 - 이미지를 시계열처럼 다룰 수 있습니다. - 이미지의 가로축으로부터 정보를 추출할 수 있습니다. 단점 - 세로 픽셀 개수가 1개이므로 정보의 손실이 발생할 수 있습니다. - 이미지 크기 커지면 앞의 정보가 흐려져 특징을 추출하기 어렵습니다. CNN 이미지로부터 특징을 추출하고 추출된 특징을 RNN에 .. 2024. 1. 23.
[용어정리]텍스트 딥러닝 용어 Attention, LSTM [딥러닝 용어 정리] 텍스트 처리 용어 LSTM(Long short term memory) - RNN의 발전 형태로 장기 기억을 담당하는 셀 상태와 은닉 상태를 갖는 신경망입니다. 시계열 길이가 길어질수록 RNN을 적용하기 어렵기 때문에 RNN의 단점을 극복한 모델이 LSTM입니다. 망각 게이트, 입력게이트, 출력 게이트를 이용해 이전 시점의 은닉 상태를 현시점에 반영하는 알고리즘 망각 게이트 : 셀 상태에 저장된 과거의 정보를 사용할 것인가에 대한 여부를 결정합니다. 입력 게이트 : 셀 상태에 현재 정보를 덮어쓸 것인가를 결정합니다. 출력 게이트 : 셀 상태와 현재 정보를 합쳐 현재의 은닉 상태를 결정합니다. BOW - 모든 단어를 겹치지 않도록 고유 번호로 나타낸 집합입니다. 희소 표현 / 밀집 표현.. 2024. 1. 22.
[용어 정리] Let the be color 모델 [딥러닝 용어 정리] Let the be color 모델 Let the be color 모델 구조 로 레벨(low-level) : 이미지의 국소적인 특징을 추출 글로벌 레벨(global-level) : 이미지의 전체적인 특징을 추출 미들 레벨(mid-level) : 중간 크기의 특징을 추출 컬러라이제이션 신경망(colorization network) : 칠해야 되는 색을 학습 스케일링 : 흑백 이미지 크기가 모델의 입력 크기에 맞게 조절됩니다. 로 레벨 특징 추출기는 이미지를 3x3 커널 합성곱층을 쌓아서 만듭니다. 또한 미들 레벨 특징 추출기와 글로벌 레벨 특징 추출기는 같은 입력을 가집니다. Let there be color 모델 구조 장단점 장점 - 이미지에 들어 있는 특징을 크기별로 추출할 수 있.. 2024. 1. 19.
728x90