교육 소개
home
DEEP DIVE 소개
home
💖

도서추천시스템 시각화 프로젝트

한줄소개
네트워크 시각화를 활용한 설명 가능한 추천 시스템
역할
UI/UX 디자인
기획
팀구성
4명의 구성원
성과
시각화 서비스 프로토타입 제작
날짜
2022년 하반기
상태
완료
프로젝트 목표
도서관 등 여러 기관에서 책을 대출할 때, 사용자의 대출 이력을 기반으로 대출한 책과 유사한 도서나 유사한 사용자가 대출한 책을 추천 받는다. 많은 추천시스템은 도서나 사용자의 유사도를 기준으로 추천 도서를 제공하지만, 책과 사용자가 여러 속성을 가지고 있는 경우 책을 추천하는 구체적인 기준과 유사도의 측정 방법은 사용자가 파악하기 어렵다. 혹은 비슷한 책만 계속해서 추천을 받아 추천의 다양성이 떨어지는 현상이 발생하기도 한다.
본 프로젝트에서는 책을 추천하는 기준을 네트워크 시각화를 이용하여 사용자에게 투명하게 공개하고 사용자가 직접 추천 기준을 수정하여 다양한 추천 결과를 얻을 수 있는 설명 가능한 추천 시스템 개발을 목적으로 한다. 설명 가능한 추천은 사용자에게 추천 결과를 제공할 뿐만 아니라 그러한 항목을 추천하는 이유를 명확히 설명하는 개인화된 추천방법을 말한다. 주된 시각화 방법은 네트워크 그래프 형태로, 추천 책과 학생을 시각화하여 연결성과 추천 정도를 책 간 거리로 파악할 수 있게 한다. 뿐만 아니라 학과별, 단과대별로 노드의 색상을 구분지어 군집 확인이 가능하다.

 맡은 역할

사용자 유입을 위한 스토리텔링 기획 및 제작
유사 서비스 분석
관련 기능 리서치
UI/UX 기획 및 디자인

상세 설명

프로젝트 내용 및 방법
문헌고찰
기존 추천 시각화 리서치
기존 추천 알고리즘 리서치
기존 추천 시스템의 한계점 (투명성, 제한성, 다양성, 콜드스타트) 파악
한계점 극복을 위한 적합한 알고리즘 및 사용자 경험 설계
데이터 전처리
1) 기존 데이터 그대로 네트워크를 그릴 경우, 그래프의 가독성이 떨어지고, 연결성이 드러나지 않아 다음과 같은 데이터 전처리 과정을 거쳤다.
① IQR 을 이용한 이상치 분석
이상치 데이터(Outlier)는 전체 데이터의 패턴에서 벗어난 이상 값을 가진 데이터이다. 본 연구에서는 이를 제거하기 위해 IQR(Interquartile Range) 방식을 이용하였다. IQR은 사분위 값의 편차를 이용하는 기법으로, 박스 플롯을 이용해 시각화할 수 있다. 이 방법은 데이터를 4구간, Q1, Q2, Q3, Q4로 나눈다. 여기서 25% 구간이 Q1 ~ 75 % 구간인 Q3의 범위를 IQR이라 한다. 우리는 학생이 책을 빌린 숫자를 카운트 하였다. 그리고 카운트 값이 Q1 ~ Q3에 포함되지 않는 학생을 삭제하였다.
② 연관분석을 이용한 책 정제 과정
책의 데이터를 정제하기 위해서는 ‘장바구니 분석' 이라고 알려져 있는 연관분석을 이용하였다. 연관분석의 목적은 A라는 책을 읽었을 때 B라는 책을 같이 읽은 규칙의 패턴을 구하는 것이다. 이를 위해 각 학생이 빌린 모든 책을 그룹화하였다. 이후, 지지도가 높은 순서로 책 그룹 패턴을 책 리스트로 만들었고, 이중, 학과별로 읽은 책의 차이를 불분명하게 하는 문학 카테고리에 속하는 책을 제외한 788개의 책 데이터를 추출하였다.
③ 매개중심성(betweenness centrality)을 활용, 중심성이 높은 학생만을 추출
학생과 학생 사이의 네트워크를 제작하여 매개중심성 이론을 근거로 계산하였다. 매개 중심성 이론은 노드간 경로에 있는 사람이 더 중심도가 높다는 것으로, 노드와 노드 사이를 이어주는 연결목 위치에 여러 번 등장하는 노드가 중요하다는 뜻이다. 이를 통해 상위 3000명의 학생을 추출하였고, 최종 데이터 셋을 얻을 수 있었다
프로젝트 결과
관련 프로젝트의 추천 시스템 연구 조사
본 연구 초반에는 관련 연구의 추천 시스템에서 어떤 알고리즘을 사용하였는지, 추천 시스템의 한계점을 극복하기 위해 어떤 방법을 사용하였는지에 대한 조사를 진행하였다. 조사 내용은 [표1]과 같다.
네트워크 추천 시스템 구현
본 프로젝트에서는 네트워크 시각화를 이용하여 기존 시스템이 가지고 있는 투명성, 다양성, 제어성 등과 관련된 제한적인 한계를 해결하는 기법을 제안하고자 하였다. 네트워크 뷰를 통해서 사용자는 추천 책이 어떤 경로로 추천 결과로 나타났는지에 대한 시스템의 내부 논리를 확인함으로써, 기존 추천 시스템의 투명성 문제에 대한 해결이 가능하다.
사용자가 흥미있는 하나의 학생 노드를 클릭하면 오른쪽 사이드뷰를 통해 책에 대한 정보와 그 책과 연관성이 있는 책들을 추천해주는 등 자세한 정보와 추천 항목을 제공하고자 하였다. 또한, 이 시스템을 사용하면, 사용자가 추천받는 책이 어떠한 경로로 추천받게 됐는지에 대한 시스템의 내부 논리를 설명함으로써 기존 추천 시스템의 투명성 문제에 대한 해결이 가능하다.
단과별대로 필터링, 네트워크 확대와 축소 기능 등 제어성을 통해 시스템 안의 통제 권한을 부여함으로써 추천 과정 속의 입력과 피드백을 통한 사용자의 참여를 권장한다. 이는 자신이 관심있는 분야의 책 및 다른 분야의 책까지 다양한 범위로 책을 추천받을 수 있을 뿐 아니라, 추천 사항 수정, 또는 탐색과 같은 여러 경험을 제공함으로써 사용자의 만족도 향상이 가능하다.
본 연구에서는 기존 시스템의 한계점인 투명성, 제어성, 다양성 요소를 보완을 목표로 데이터 전처리, 연관 분석 기법을 사용하였고, 매개중심성 이론을 이용하여 앞서 정제한 데이터를 적용시켜 Network 형태로 시각화하였다. 최종적으로 이 연구내용을 취합하여 추천 알고리즘인 하이브리드(Hybrid) 기법을 기반으로 기존 추천 시스템 연구에서 파악된 한계점을 보완하기 위해 추천 항목 개수를 조절할 수 있는 제어 기능, 사용자가 원하는 데이터만 확인할 수 있는 필터링 기능을 추가하여 정당성과 제어성을 확보하였고, 이를 통해 사용자가 새로운 항목을 추천 받아 다양성을 보장 받을 뿐만 아니라 추천 사유에 대해 명확히 파악할 수 있는 ‘설명 가능한 추천’을 통해 투명성을 보장하였다. 본 연구는 추후 다른 네트워크를 기반한 추천 시스템을 위한 가이드라인을 제시하는데 기여할 것으로 예상되며, 뿐만 아니라 사용자가 추천 시스템을 사용하여 추천을 받을 때, 더 나은 경험을 할 수 있도록 도울 수 있을 것이다.