유사 질문 검색을 위한 검색모델 연구 조사 및 전망

Information

Title 유사 질문 검색을 위한 검색모델 연구 조사 및 전망
Authors 김태연, 안연찬, 전희식, 이상구
Year 2015 / 5
Keywords query likelihood language model, translation model, translation-based language model, intent-based language model, topic-based language model, community question answering(CQA), word mismatch problem
Acknowledgement 전략산학
Publication Type Domestic Conference
Publication 한국데이터베이스학술대회
Link url doi

Abstract (Korean)

질문 답변 데이터에 대한 유사 질문 검색에서는 단어 불일치(Word Mismatch) 문제가 이슈가 된다. 이는 공통으로 쓰이는 단어가 적기 때문에 발생하며, 기존의 벡터 스페이스 모델(Vector Space Model)과 같은 단어 매칭(Term Matching) 기반의 검색 모델은 이 문제로 인하여 성능이 낮다. 이를 해결하기 위하여 변환모델(Translation Model)과 주제모델(Topic Model)을 활용한 두 가지 방향의 연구가 있다. 본 논문에서는 유사 질문 검색에 사용되는 여러 검색 모델을 기술하고 앞으로 연구되어야 할 방향에 대해서 논의한다.