한국어에 적합한 단어 임베딩 모델 및 파라미터 튜닝에 관한 연구

Information

Title 한국어에 적합한 단어 임베딩 모델 및 파라미터 튜닝에 관한 연구
Authors 최상혁, 설진석, 이상구
Year 2016 / 10
Keywords 단어 임베딩, 한국어 Word2Vec, 한국어 말뭉치
Acknowledgement NRF
Publication Type Domestic Conference
Publication 제28회 한글 및 한국어 정보처리 학술대회 논문집 (2016년)
Link url

Abstract (Korean)

본 논문에서는 한국어에 최적화된 단어 임베딩을 학습하기 위한 방법을 소개한다. 단어 임베딩이란 각 단어가 분산된 의미를 지니도록 고정된 차원의 벡터공간에 대응 시키는 방법으로, 기계번역, 개체명 인식 등 많은 자연어처리 분야에서 활용되고 있다. 본 논문에서는 한국어에 대해 최적의 성능을 낼 수 있는 학습용 말뭉치와 임베딩 모델 및 적합한 하이퍼 파라미터를 실험적으로 찾고 그 결과를 분석한다.