[KR] 도서관 사용 증진을 위한 추천시스템 모델

- 1 min

Abstract

본 연구는 성균관대학교 학우들의 학술정보관 사용 증진을 위하여 개인별 맞춤 도서 추천 서비스를 구축하는 것을 목적으로 한다. 특히 사용자의 아이템에 대한 선호도가 존재하는 다수의 추천 서비스와는 달리, 선호도가 존재하지 않는 경우에 서비스 제공이 가능하도록 하는 방안을 제시하고자 한다. 이에 (1) 대출자의 도서 대출 목록과 성향을 활용하여 평가지표를 생성하는 방법과 (2) 대출자와 도서의 정보를 활용, 학습시켜 딥러닝 모델을 구축하는 방법으로 나누어 진행했다. 이때, 학술정보관으로부터 최근 5년 간 대출 기록을 제공받고 학술정보관 홈페이지에 등록된 도서 정보를 웹 스크레이핑(Web Scraping)하여 데이터를 수집했다. 먼저, 본 연구는 대출자의 대출 기간, 대출 도서의 장르를 활용한 도서에 대한 새로운 선호도 지표를 제안한다. 이를 바탕으로 대출자에게 아직 읽지 않은 도서에 대한 예상 선호도를 산출해 주는 방식으로, 행렬 분해 방법 중 SVD와 SGD 알고리즘을 활용한 모델을 구축했다. 더불어 유사도가 높은 대출자 그룹 내의 도서 대출 목록을 참조하여 추천하는 사용자기반 협업 필터링 알고리즘을 활용해 모델을 구현했다. 다음으로, 딥러닝 모델을 위하여 데이터의 유형에 따라 적합한 개별 임베딩 방식을 선정했다. 자연어 처리를 위해 RoBERTa, 이미지 처리를 위해 EfficientNet을 사용했다. 이후 각 방식을 통해 추출한 임베딩 벡터를 결합하여 하나의 모델로 완성시켰다. 임베딩 벡터를 결합하여 최종 모델로 학습시키는 과정에서 과적합 방지를 위해 신경망의 구조와 옵티마이저에 변화를 주며 다양하게 모델링하고, 세 가지 단일 모델을 스태킹하는 기법을 사용했다.최종적으로 선호도 지표를 활용한 세 가지 모델과 딥러닝 모델 한 가지에 대하여 사용자 평가를 진행했다. 각각의 모델이 제시한 개인별 맞춤 도서 다섯 권의 목록을 해당 대출자에게 제공하고, 추천 도서에 대한 만족 여부를 이진화하여 점수를 부여하게 했다. 추천 도서 다섯 권에 대한 평가 결과를 합산한 후 평균 내어 해당 모델을 평가했다. 그 결과, 딥러닝 기법을 이용한 모델이 상대적으로 높은 사용자 만족도를 보였다. 본 연구는 선호도의 부재로 개인 추천 시스템 개발에 어려움을 겪었던 도서관 계에서 앞으로 더 효율적이고 효과적인 도서 추천 시스템을 발전시킬 수 있는 토대가 될 것으로 전망한다.더 읽어보기

rss facebook twitter github gitlab youtube mail spotify lastfm instagram linkedin google google-plus pinterest medium vimeo stackoverflow reddit quora quora