This site is deprecated and no longer maintained. Please visit the new site for up-to-date information.

This site is deprecated and no longer maintained. Please visit the new site for up-to-date information.

Large-Scale Graph Data Processing for Smart Reality

From IDSlab

Jump to: navigation, search

Contents

Overview

인터넷과 모바일 컴퓨팅 기술의 발전은 스마트 리얼리티의 실현을 가속하고 있는데, 스마트 리얼리티란 사람, 기기, 센서, 환경 등 실세계를 구성하는 대부분의 객체들이 정보를 생성, 소비하고 상호 작용하며 참여하는 컴퓨팅 환경으로서, 이 환경에서는 보다 지능적이고 유용한 서비스들이 가능할 것이다. 스마트 리얼리티의 실현을 위해서는 다양한 분야에 걸친 기술적 성숙도가 요구되는데, 그 중 데이터 처리 관련 기술은 아직 미성숙한 상태에 머물고 있다. 스마트 리얼리티를 실현하기 위해서는 다양하고 동적인 대량의 데이터를 지능적으로 활용할 수 있어야 하며, 이에 대응하여, 다양성, 지능성, 확장성, 역동성을 담보하는 대용량 그래프 데이터 처리 기법을 연구하고자 한다.


Research Contents

스마트 리얼리티의 실현을 위한 대용량 그래프 처리 기술 개발이라는 최종목표를 달성하기 위하여 본 연구는 세 가지 세부 과제를 수행하고자 한다. 첫째, 그래프 데이터를 다양한 지능적 응용에 활용하기 위한 모델 및 알고리즘을 연구하고, 둘째, 대용량의 그래프 데이터를 동적으로 처리하기 위한 최적화 방안을 디스크 기반 기술과 클라우드 컴퓨팅 기반 기술로 나누어 연구한다. 마지막으로, 위의 성과들을 실용적 수준의 시스템에서 검증하고자 한다.


제1세부: 그래프 데이터 질의 모델 및 알고리즘 연구

그래프 모델의 유용성을 최대화하기 위해서는 이종적인 그래프들을 통합할 필요가 있으며, 통합된 그래프는 다양한 방향으로 응용될 수 있어야 한다. 그러나 다양한 유형의 그래프 데이터에 대한 다양한 응용 형태를 뒷받침하는 연구가 부재한 상태이므로, 이에 대응하여 1세부 과제에서는 그래프 데이터 처리 질의 모델 및 알고리즘을 연구한다.

  • 그래프 데이터 질의 모델 연구
  • 일반화된 근접성 척도 알고리즘 연구


제2세부: 그래프 데이터 처리 최적화 연구

동적으로 변화하는 대용량 그래프 데이터에 대응하는 기술은 스마트 리얼리티의 실현의 핵심이다. 본 세부과제에서는 대용량 그래프 데이터 처리 실현을 위한 기본 전략으로써 디스크 기반 환경과 클라우드 기반 환경을 가정한 두 갈래의 연구를 수행한다. 스마트 리얼리티 환경 하의 데이터는 메모리 기반 처리 방식으로는 감당할 수 없을 정도로 크다. 이러한 환경에 대응하기 위하여, 본 소주제에서는 압축 및 클러스터링을 이용한 디스크 입출력 최적화, 통계적 정보를 활용한 최적화를 시도하고, 클라우드에 기반한 그래프 처리 기법을 연구한다.

  • 디스크 기반 대용량 그래프 데이터 처리 연구
  • 클라우드 컴퓨팅 기반 대용량 그래프 데이터 처리 연구


제3세부: 그래프 데이터 차세대 응용 분야 연구

본 세부 과제에서는 응용 시스템을 구현함에 있어서 발생하는 문제를 해결하고 실제 상용 서비스 규모를 고려한 연구 결과의 검증을 수행한다. 라이프로깅 시스템은 다양한 도메인으로부터 라이프로그를 수집하여 그래프 데이터 모델로 저장하고 탐색 가능하도록 하는 것을 최종 목표로 한다. 데이터 인텔리전스 기반의 상황 인지 시스템은 라이프로깅 시스템이 통합한 그래프 데이터형태의 대용량 라이프로그에 내재된 의미정보 및 외부 지식과 간단한 규칙을 활용하여 다양한 상황인지 서비스를 가능케 하는 것을 최종 목표로 한다.

  • 그래프 데이터 기반 라이프로그 시스템
  • 데이터 인텔리전스 기반 상황인지 시스템


Related Publications

International Publications

  1. Youngki Park, Sungchan Park, Sang-goo Lee, Woosung Jung, Greedy Filtering: A Scalable Algorithm for K-Nearest Neighbor Graph Construction, 2014, Proceedings of the 19th International Conference on Database Systems for Advanced Applications (DASFAA 2014), Part I, LNCS 8421, Page 327-341
  2. Youngki Park, Sungchan Park, Sang-goo Lee, Woosung Jung, Fast Collaborative Filtering with a k-Nearest Neighbor Graph, 2014, Proceedings of the International Conference on Big Data and Smart Computing (BigComp 2014), Page 92-95
  3. Chungrim Kim, Sangkeun Lee, Sungchan Park, Sang-goo Lee, Influence Maximization Algorithm Using Markov Clustering, 2013, The 4th International Workshop on Social Networks and Social Web Mining in Conjunction with DASFAA 2013
  4. Yeonchan Ahn, Sungchan Park, Sangkeun Lee, Sang-goo Lee, A Heterogeneous Graph-Based Recommendation Simulator, 2013, Proceedings of the 7th ACM conference on Recommender systems (RecSys 2013), Page 471-472
  5. Jaeseok Myung, Sang-goo Lee, Exploiting inter-operation parallelism for matrix chain multiplication using MapReduce, 2013, Journal of Supercomputing, Volume 66(1), Page 594-609, SCI
  6. ByoungJu Yang, Jaeseok Myung, Sang-goo Lee, Dongjoo Lee, A MapReduce-based Filtering Algorithm for Vector Similarity Join, 2013, Proceedings of the 7th International Conference on Ubiquitous Information and Communication 2013 (ICUIMC 2013)
  7. Sangkeun Lee, Sungchan Park, Minsuk Kahng, Sang-goo Lee, PathRank: Ranking nodes on a heterogeneous graph for flexible hybrid recommender systems, 2013, Expert Systems with Applications (ESWA), Volume 40(2), Page 684-697, SCIE
  8. Yongjin Kwon, Sang-goo Lee, Fast Algorithm for Top-k Personalized PageRank Queries with Layered Graphs, 2012, Proceeding of the Fourth International Conference on Emerging Databases-Technologies,Applications, and Theory (EDB 2012)
  9. Sungchan Park, Sang-goo Lee, Fast Computation of All-pairs Random Walk on Large Graphs, 2012, Proceedings of the International Conference on Computer, Networks, Systems, and Industrial Applications 2012(CNSI 2012)
  10. Sangkeun Lee, Sang-goo Lee, A Generic Graph-based Multidimensional Recommendation Framework and Its Implementations, 2012, Proceedings of the 21th International Conference on World Wide Web 2012 (WWW 2012)
  11. Sang-il Song, Sangkeun Lee, Sungchan Park, Sang-goo Lee, Determining User Expertise for Improving Recommendation Performance, 2012, Proceedings of the 6th International Conference on Ubiquitous Information and Communication 2012 (ICUIMC 2012)
  12. Jongheum Yeon, Dongjoo Lee, Jaehui Park, Sang-goo Lee, A Framework For Sentiment Analysis On Smartphone Application Stores, 2012, Proceedings of the 1st International Conference on Advanced Information Technology and Sensor Application
  13. Jaeseok Myung, Sang-goo Lee, Matrix Chain Multiplication via Multi-way Join Algorithms in MapReduce, 2012, Proceedings of the 6th International Conference on Ubiquitous Information and Communication 2012 (ICUIMC 2012)
  14. Sangkeun Lee, Sungchan Park, Minsuk Kahng, Sang-goo Lee, PathRank: A Novel Node Ranking Measure on a Heterogeneous Graph for Recommender Systems, 2012, Proceedings of the 21st ACM Conference on Information and Knowledge Management (CIKM 2012), Page 1637-1641
  15. Minsuk Kahng, Sangkeun Lee, Sang-goo Lee, Ranking Objects by Following Paths in Entity-Relationship Graphs, 2011, Proceedings of the 4th Workshop for Ph.D. Students in Information and Knowledge Management (PIKM 2011 in conjunction with CIKM 2011), Page 11-18
  16. Jae-won Lee, Han-joon Kim, Sang-goo Lee, Exploiting Taxonomic Knowledge for Personalized Search:A Bayesian Belief Network-based Approach, 2011, Journal of Information Science and Engineering (JISE), Volume 27, Page 1413-1433, SCIE


Domestic Publications

  1. 이동진, 이상구, 하둡 성능 관련 연구 현황 및 전망, 2013, 2013 추계학술발표회 논문집, Page -
  2. 이한빛, 명재석, 이상구, 이종 그래프에서 사용자 정의 경로를 사용하는 개인화된 랭킹 알고리즘, 2013, 한국컴퓨터종합학술대회 논문집 (KCC 2013), Page 268-270
  3. 연종흠, 심준호, 이상구, 데이터 큐브에서의 각도 기반 이상치 탐지, 2013, 한국컴퓨터종합학술대회 논문집 (KCC 2013), Page 297-299
  4. 연종흠, 심준호, 이상구, 편향된 의견 문서 검출을 위한 열쇠: 다차원 접근, 2013, 한국전자거래학회 2013 춘계학술대회
  5. 안연찬, 박영기, 이상구, 기업 문서 검색을 위한 인기도 기반 문서 순위 알고리즘, 2012, 한국정보과학회 학술발표논문집, Volume 39(C), Page 73-75
  6. 박성찬, 이상구, 큰 그래프에서의 모든 쌍에 대한 빠른 2 단계 랜덤 워크 계산 방법, 2012, 2012 한국컴퓨터종합학술대회 논문집
  7. 공기현, 이재원, 김한준, 이상구, 시간의 흐름에 따른 사용자의 취향 변화를 고려한 Semantic Collaborative Filtering, 2011, 2011 한국정보과학회 추계학술대회 논문집, Volume 38(2C), Page 92-95
  8. 송상일, 이상근, 이상구, 추천 시스템을 위한 사용자의 전문성 평가하기, 2011, 2011 한국정보과학회 추계학술대회 논문집, Volume 38(2C), Page 100-103
  9. 박성찬, 이상구, 그래프 데이터베이스의 양적 분석을 위한 질의 언어, 2011, 2011 한국컴퓨터종합학술대회 논문집 (KCC 2011), Volume 38(1A), Page 77-80
  10. 명재석, 이상구, 맵리듀스를 이용한 멀티웨이 조인 알고리즘의 비교, 2011, 2011 한국컴퓨터종합학술대회 논문집, Volume 38(1C), Page 127-130
  11. 권용진, 연종흠, 이상구, 실제 의료 데이터 분석을 통한 데이터 익명화 방법 제시, 2011, 2011 한국컴퓨터종합학술대회 논문집, Volume 38(1C), Page 80-83