This site is deprecated and no longer maintained. Please visit the new site for up-to-date information.

This site is deprecated and no longer maintained. Please visit the new site for up-to-date information.

Agile Data Warehouse Supporting Efficient Future Data Analysis

From IDSlab

Jump to: navigation, search

Contents

Overview

Data Science for Knowledge Creation의 세부과제로서, 본 세부과제에서는 유연한 특성을 갖는 Triple 모델을 기반으로 이질적 데이터를 활용하는 데이터 웨어하우스를 연구한다. 이질적인 데이터를 트리플 모델로 통합(Tripify), 저장(Triple Store), 처리(Query Processing), 그리고 활용(Knowledge Discovery)하는 전체 과정을 포함하는 연구를 수행한다.



Research Contents

본 과제는 다음과 같은 최종 연구목표를 가진다.

  • 다양한 유형의 데이터 간 유연한(Flexible) 연계를 위한 트리플 데이터 모델을 연구한다.
  • 다양한(Versatile) 분석 방법론 및 모델을 지원하기 위한 질의 모델을 연구한다.
  • 데이터의 진화에 민첩(Agile)하게 대응할 수 있도록 효과적인 질의 처리 방법을 연구한다.
  • 대용량 데이터에 대해 빠른 속도를 제공하는 효율적인(Efficient) 질의 처리 최적화를 연구한다.


연구성과: RDB-to-Triple mapping 연구

기존 RDB에 저장된 데이터를 integrity constraint를 반영하여 Triple 모델로 매핑하는 기법과 Triple 데이터를 효율적으로 탐색하는 색인 구조 및 SPARQL 처리 알고리즘을 연구. 본 연구를 통하여 다양한 스키마 하에 존재하는 RDB 데이터를 하나의 유연한 모델로 통합하여 활용하기 위한 토대 마련.



Related Publications

  1. Hanbit Lee, Sang-goo Lee, Style Recommendation for Fashion Items using Heterogeneous Information Network, 2015, Recommender Systems 2015 (RecSys2015)
  2. Sangkeun Lee, Minsuk Kahng, Sang-goo Lee, Constructing Compact and Effective Graphs for Recommender Systems via Node and Edge Aggregations, 2015, Expert Systems with Applications (ESWA), Volume 42(7), Page 3396–3409, SCIE
  3. 유강민, 박성찬, 이수진, 유경상, 이상구, 그래프 모델과 중심성 분석을 이용한 당뇨환자의 처방 및 검사결과의 상관관계 분석, 2015, 정보과학회 컴퓨팅의 실제 논문지, Volume 21(7), Page 482-487
  4. 김민준, 현일성, 신유현, 유강민, 박영기, 이상구, 동북아시아 언어들에 대한 말뭉치 조사, 2015, 한국컴퓨터종합학술대회 (KCC 2015)
  5. 한만휘, 박성찬, 이한빛, 연종흠, 이상구, 한국어 언어자원에서의 자연어 처리 기술 현황 조사, 2015, 한국컴퓨터종합학술대회 (KCC 2015)
  6. Youngki Park, Sungchan Park, Woosung Jung, Sang-goo Lee, Reversed CF: A fast collaborative filtering algorithm using a k-nearest neighbor graph, 2015, Expert Systems with Applications (ESWA 2015), Volume 42(8), Page 4022-4028, SCIE
  7. 박영기, 황혜수, 이상구, Balanced Canopy Clustering에 기반한 일반적 k-인접 이웃 그래프 생성 알고리즘, 2015, 정보과학회 컴퓨팅의 실제 논문지, Volume 21 (4), Page 327-332
  8. Hyun Joon Kim, Sang-goo Lee, StdSort: Efficient Pre-Processing for Faster Vector Similarity Join Using Standard Deviation, 2015, International Conference on Ubiquitous Information Management and Communication​(ICUIMC 2015)
  9. 유강민, 박성찬, 이수진, 유경상, 이상구, 그래프 모델을 이용한 당뇨환자의 처방 및 검사결과의 상관관계 분석, 2014, 한국 정보과학회 제41회 동계학술발표회
  10. 김현준, 이상구, 맵리듀스 프레임워크 상 벡터 유사 조인 연구 현황, 2014, 한국 정보과학회 제41회 동계학술발표회
  11. Kang Min Yoo, Sungchan Park, Sang-goo Lee, RDB2Graph: A Generic Framework for Modeling Relational Databases as Graphs, 2014, 4th Joint International Semantic Technology (JIST2014) conference
  12. Jaeseok Myung, Sang-goo Lee, A Proximity-Based Fallback Model for Hybrid Web Recommender Systems, 2013, Proceedings of the 22th International Conference on World Wide Web 2013 (WWW 2013)
  13. Minsuk Kahng, Sang-goo Lee, Exploiting Paths for Entity Search in RDF Graphs, 2012, Proceeding of the 35th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2012), Page 1027-1028
  14. ByoungJu Yang, Sangkeun Lee, Sungchan Park, Sang-goo Lee, Exploiting Various Implicit Feedback for Collaborative Filtering, 2012, Proceedings of the 21th International Conference on World Wide Web 2012 (WWW 2012), Page 639-640