Canopy Clustering을 이용한 k-Nearest Neighbor 그래프 생성 알고리즘

Information

Title Canopy Clustering을 이용한 k-Nearest Neighbor 그래프 생성 알고리즘
Authors
박영기, 이상구
Year 2014 / 6
Keywords 벡터
Acknowledgement SRC, BLS
Publication Type Domestic Conference
Publication 한국 정보과학회 제41회 동계학술발표회
Link url

Abstract (Korean)

벡터 유사 조인(Vector Similarity Join)은 주어진 데이터셋 안에서 벡터의 쌍에 대해 지정한 유사도 함수로 유사도 한계치를 초과하는 모든 벡터들을 찾는 문제이다. 중복제거, 추천시스템 등으로 널리 사용되고 있으나, O(n^2)의 복잡도 때문에 계산 속도를 분산 시스템을 활용하여 빠르게 하는 많은 연구가 이루어지고 있다. 본 논문에서는 최근 벡터 기반 유사 조인 연구에 대해서 설명하고, 그를 토대로 앞으로 연구되어야할 방향에 대해서 논의한다.