본문 바로가기
  • 머킹이의 머신로그

분류 전체보기114

[자연어 개인 프로젝트] 제주도 사투리를 번역하자 (2) 안녕하세요 머킹입니다. 지난번 포스팅에 이어 개인 프로젝트를 적어보고자 합니다. 사실 저는 그동안 개발을 하면서 아직까지 환경설정을 제대로 해본 적이 없습니다. 그래서 그랬을까요... 정말 너무 힘들었습니다... 일단 환경설정을 하게 된 계기부터 말씀드리겠습니다. 자연어 처리를 위해서 저는 한국어 형태소 분석기를 사용하고자 했습니다. 형태소 분석 이란 형태소를 비롯하여, 어근, 접두사/접미사, 품사(POS, part-of-speech) 등 다양한 언어적 속성의 구조를 파악하는 것입니다. 한국어는 토큰화(Tokenization)가 매우 어렵습니다. 한국어는 '조사', '어미' 등이 있고 띄어쓰기도 매우 복잡합니다. '콜라'에 조사가 붙으면 '콜라가', '콜라를', '콜라는' 등처럼 붙게 되지만 모두 '콜라.. 2023. 9. 19.
[자연어 개인 프로젝트] 제주도 사투리를 번역하자 (1) 자연어 NLP 양방향 번역 모델 생성하기 안녕하세요 머킹입니다. 프로젝트를 진행하면서 얻는 것 또한 많았지만 개인 프로젝트를 (어떻게든) 완성해서 의미 있는 결과를 얻고 싶다는 생각이 들었습니다. 저는 정말 초보고 무언가를 처음부터 끝까지 해보려면 뭐든지 부딪혀야 하는 상황이었기 때문에 일단 원하는 걸 해보자 그리고 배우자!라는 생각으로 개인 프로젝트를 기획했습니다. 저는 사투리를 쓰는 지역이 고향인 사람입니다. 여러분들은 사투리를 얼마나 쓰시나요? 아무래도 요즘은 사투리의 경계도 많이 허물어서 예전만큼 자주 사용하지는 않는 것 같습니다. 하지만 저는 사투리가 좋습니다. 독특하고 재미있어서 개인적으로 유지됐으면 하는 바람이 있습니다. 그래서 사투리 중에서 가장 독특하고 문화적으로 남았으면 하는 제주도 사.. 2023. 9. 18.
[오늘부터 코딩테스트]프로그래머스 코딩 기초 프로그램 풀기 파이썬으로 풀어보는 코딩테스트 Lv.0 안녕하세요 머킹입니다. 오늘부터 코딩테스트를 하나하나 준비하고자 합니다. 제가 지금부터 이루고 싶은 목표들을 하나씩 세분화해서 진행하려고 하는데요. 팀 프로젝트 개인 프로젝트 유튜브 강의 알고리즘 공부 이 다섯 개로 분류시켜서 진행하고자 합니다. 너무 많은 것들을 하면 오히려 하나도 제대로 못하는 상황이 발생해서.. 하나씩 되는대로 꼼꼼하게 마무리하려고 합니다. 그래서 오늘부터는 코딩테스트를 준비하고자 하는데요. 저는 정말 정말 초보이기 때문에 Lv.0단계부터 서서히 풀어나가는 모습을 기록하고자 합니다. 코딩테스트 복잡도 복잡도란, 알고리즘의 성능을 나타내는 척도입니다. 동일한 기능을 수행하는 알고리즘 중 일반적으로 복잡도가 낮을수록 더 좋은 알고리즘이라고 할 수 .. 2023. 9. 18.
[프로젝트]파이썬으로 회전 이미지 바운딩 박스(AABB) 처리 파이썬으로 회전 이미지 바운딩 박스(AABB) 처리 안녕하세요. 머킹입니다. 꽤 오랜 시간이 지나고 나서 글을 쓰는 것 같습니다. 이 블로그를 시작할 때 저의 공부를 정리하며 제 공부가 누군가에게 도움이 되길 바라며 시작했는데요. 생각보다 학원의 일정이 너무 힘들고 지속되는 건강 악화로 처음에 잡은 목표를 이루지 못했습니다ㅠㅠ 갑자기 뜬금스럽게 회전이미지니 바운딩 박스니 프로젝트니 당황스럽죠? 이제부터 제대로 정리를 하고자 합니다. 우선, 제가 가장 오랜 시간 붙잡았던 프로젝트를 정리하고자 합니다. 제 프로젝트는 끝나면 알려드리겠지만 간단하게 쓰레기를 분류하는 머신러닝을 만들고자 합니다. 프로젝트를 위해서 아래의 과정을 진행했습니다. 주제선정 => 프로젝트 배경, 목표 수립 => 데이터 수집 => 데이터.. 2023. 9. 6.
728x90