본문 바로가기
  • 머킹이의 머신로그

전체 글114

[용어정리] 캡처 텍스트 인식 CRNN+GRU [딥러닝 용어 정리] 이미지 텍스트 인식 CRNN, GRU CRNN CNN과 RNN을 혼합해 만든 모델입니다. 1. 입력 이미지가 2. CNN의 입력으로 들어갑니다. 3. 이미지로부터 추출된 특징은 가로 W개의 픽셀, 세로H개의 픽셀이 있습니다. 4. RNN에 입력으로 사용할 수 있게 시계열 형태로 바꿔줍니다. 5. 이미지로부터 추출된 특징의 세로 방향 픽셀의 값을 RNN층의 은닉 상태로 이용합니다. 장점 - 이미지를 시계열처럼 다룰 수 있습니다. - 이미지의 가로축으로부터 정보를 추출할 수 있습니다. 단점 - 세로 픽셀 개수가 1개이므로 정보의 손실이 발생할 수 있습니다. - 이미지 크기 커지면 앞의 정보가 흐려져 특징을 추출하기 어렵습니다. CNN 이미지로부터 특징을 추출하고 추출된 특징을 RNN에 .. 2024. 1. 23.
[용어정리]텍스트 딥러닝 용어 Attention, LSTM [딥러닝 용어 정리] 텍스트 처리 용어 LSTM(Long short term memory) - RNN의 발전 형태로 장기 기억을 담당하는 셀 상태와 은닉 상태를 갖는 신경망입니다. 시계열 길이가 길어질수록 RNN을 적용하기 어렵기 때문에 RNN의 단점을 극복한 모델이 LSTM입니다. 망각 게이트, 입력게이트, 출력 게이트를 이용해 이전 시점의 은닉 상태를 현시점에 반영하는 알고리즘 망각 게이트 : 셀 상태에 저장된 과거의 정보를 사용할 것인가에 대한 여부를 결정합니다. 입력 게이트 : 셀 상태에 현재 정보를 덮어쓸 것인가를 결정합니다. 출력 게이트 : 셀 상태와 현재 정보를 합쳐 현재의 은닉 상태를 결정합니다. BOW - 모든 단어를 겹치지 않도록 고유 번호로 나타낸 집합입니다. 희소 표현 / 밀집 표현.. 2024. 1. 22.
[오늘부터 코딩테스트]파이썬으로 프로그래머스 코딩 입문 프로그램 풀기 [파이썬] 프로그래머스 Lv0. 대문자와 소문자, 피자 나눠 먹기 (3) 안녕하세요 머킹입니다~ 요즘 텐초의 파이토치를 열심히 복습 중인데 역시 복습하니까 이해가 너무 잘돼요 배운 책들을 싹 다시 해보는게 되게 도움되더라구요!! 대문자와 소문자 def solution(my_string): answer = "" for char in my_string: if char.islower(): answer += char.upper() else: answer += char.lower() return answer 저는 이렇게 풀었습니다~! def solution(my_string): return my_string.swapcase() 계속 저걸 반대로 하는 함수가 있었던 것 같은데...라고 생각해보니 이런 함수였더라구요.. 2024. 1. 19.
[용어 정리] Let the be color 모델 [딥러닝 용어 정리] Let the be color 모델 Let the be color 모델 구조 로 레벨(low-level) : 이미지의 국소적인 특징을 추출 글로벌 레벨(global-level) : 이미지의 전체적인 특징을 추출 미들 레벨(mid-level) : 중간 크기의 특징을 추출 컬러라이제이션 신경망(colorization network) : 칠해야 되는 색을 학습 스케일링 : 흑백 이미지 크기가 모델의 입력 크기에 맞게 조절됩니다. 로 레벨 특징 추출기는 이미지를 3x3 커널 합성곱층을 쌓아서 만듭니다. 또한 미들 레벨 특징 추출기와 글로벌 레벨 특징 추출기는 같은 입력을 가집니다. Let there be color 모델 구조 장단점 장점 - 이미지에 들어 있는 특징을 크기별로 추출할 수 있.. 2024. 1. 19.
728x90