신문 기사의 사건 탐지를 위한 문서 클러스터링

Information

Title 신문 기사의 사건 탐지를 위한 문서 클러스터링
Authors
신유현, 안연찬, 이상구
Year 2013 / 11
Keywords
Acknowledgement NIA,NRF
Publication Type Domestic Conference
Publication 2013 추계학술발표회 논문집, pp. 575-577

Abstract (Korean)

실세계에서는 하나의 사건이 다수의 신문 매체에서 다수의 기사로 쓰여 지는 일이 많다. 이때 사용자가 어떤 하나의 사건에 대한 다수의 기사들을 직접 찾는다면 효율적이지 못하고 많은 시간이 소요된다. 이에 동일한 사건을 다루는 다수의 신문 기사들에 대한 사용자의 접근성을 높이기 위해 사건 별로 신문 기사들을 모아 제공할 수 있다. 본 논문에서는 하루치 신문 기사를 대상으로 모든 신문 기사 쌍의 단어 벡터의 유사도를 이용하여 신문 기사들을 사건 별로 클러스터링할 수 있는 알고리즘을 제안하여, 최적 값으로 98% 이상의 높은 정확도를 보이는 클러스터링 결과를 얻었다.