교육 소개
home
DEEP DIVE 소개
home
📺

국내 OTT 서비스 활성화 방안

태그
날짜
한줄소개
평소에 관심있던 ‘OTT 산업’ 분야에 국내 현황을 조사하다가 국내 OTT 서비스가 해외 OTT에 비해 사용률이 저조하다는 기사를 보게 되면서 문제를 설정하고 프로젝트를 진행하게 되었습니다
프로젝트는 다음의 과정을 거쳐 진행되었습니다
1.
OTT 산업 조사
2.
프로젝트 목적 설정
3.
실험 디자인
4.
데이터 시각화
5.
기술적 디자인
OTT 산업조사
OTT 서비스란
OTT 서비스란 인터넷을 통해 사용자가 원하는 시간에 다양한 플랫폼에서 VOD(Video On Demand) 방송을 제공하는 서비스를 의미한다. 국외에서는 넷플릭스, 디즈니플러스. 애플 TV 등이 대표적이며 국내에서는 왓챠, 티빙, 웨이브 ,쿠팡플레이 등이 있으며, 이러한 서비스들 대부분은 월 구독 형태로 제공된다는 점이 있다.
OTT 플랫폼 현황
국내 OTT 시장 성장 추이 (출처. 메조미디어 트렌드리포트)
최근 OTT 시장은 스마트폰, 태블릿 PC 등 디지털 기기의 발달로 인해, 소비자들은 시간과 장소에 구애받지 않고 원하는 콘텐츠를 즉시 시청할 수 있는 등 영상 콘텐츠에 대한 접근성이 높아졌다. 특히, 최근 코로나19 팬데믹으로 인해 많은 사람들이 집에 머무르는 시간이 늘어나면서, OTT 시장은 더욱 빠른 성장세를 보이고 있다. 이러한 OTT 시장의 발전은 유료 유선방송(IPTV 등) 시장에도 영향을 미치고 있다. TV 등 가전 제품을 소유하지 않아도 OTT 서비스를 통해 원하는 콘텐츠를 시청할 수 있고 유선방송과 달리 월 구독 형태로 제공되어 보다 저렴하게 이용할 수 있기 때문에, 많은 소비자들이 OTT 서비스를 이용하는 경향이 증가하고 있다. 이러한 사회적 변화에 따라, OTT 시장은 앞으로 성장할 것으로 예상된다.
프로젝트 목적
주요 OTT 앱 월 사용자 수 현황 및 넷플릭스 관련 추이 (출처. 모바일인덱스)
모바일 빅데이터 플랫폼 기업인 아이지에이윅스가 국내 OTT 사용자 수를 조사한 결과, 단독 OTT 서비스 사용자 비율에서 넷플릭스가 43%를 차지하고 있으며, 국내 OTT 서비스와 큰 차이가 있다는 결과가 나왔다. 이러한 결과를 토대로 우리나라의 OTT 산업에는 해외 OTT가 큰 영향을 미치고 있다는 것을 알 수 있다. 또한, 해외 OTT의 영향력은 앞으로 더욱 커질 것으로 예상된다.
해외 OTT 플랫폼들의 영향력이 커지면 다음과 같은 문제점들이 야기될 수 있다.
1.
국내 콘텐츠 저작권 수익을 해외 OTT가 독점화해 국내 콘텐츠 시장이 해외 OTT 플랫폼에 종속될 우려가 있다.
2.
플랫폼 사업자의 경우, 해외 OTT 플랫폼의 영향력이 강해지면 가입자 확보와 마케팅 비용에 대한 문제를 겪을 수밖에 없다.
3.
압도적인 자금력을 바탕으로 콘텐츠를 제작하는 해외 OTT 플랫폼의 제작 방식 때문에 국내 콘텐츠 제작 비용과 라이센스 비용 상승으로 인한 문제가 생길 수 있다.
4.
콘텐츠 제작사들 역시 해외 OTT의 영향력이 커질수록 콘텐츠 업계의 넷플릭스에 대한 자금 의존도가 커지게 되고, 이는 협상력 약화로 이어지게 된다.
즉, 해외 OTT의 영향력이 커질수록 국내 콘텐츠 사업의 독점력이 커진다는 것이다. 따라서, 국내 OTT 활성화가 필요하기 때문에, 국내 OTT 기업들의 서비스 활성화에 도움이 되는 방법을 제시하는 적을 목적으로 하여 기계학습 프로젝트를 진행하였다.
실험 디자인
사용데이터
미디어 통계포털에서 제공하는 ‘미디어 이용행태’ 데이터를 사용하였으며, 이 데이터에는 다음과 같은 정보들을 포함하고 있다.
나이
가족구성
성별
직업 유무
최근 3개월간 OTT 서비스 이용 여부
가장 많이 이용하는 OTT 서비스 1순위
가장 많이 이용하는 OTT 서비스 2순위
가장 많이 이용하는 OTT 서비스 주 이용 콘텐츠 1순위
OTT 서비스 이용빈도
이 외에도 개인정보, 전자상거래 및 온라인 거래 등 미디어 이용행태와 관련된 정보들을 포함한 데이터를 이용하여 프로젝트를 진행하였다.
데이터 전처리 과정
데이터 전처리 과정 1
원본 데이터의 크기를 확인해본 결과 9941개의 열과 533개의 행으로 이루어진 방대한 양의 데이터임을 알 수 있었다. 주제한 무관한 데이터를 사용하지 않을 예정이기 때문에 전처리를 진행하였다.
데이터 전처리 과정 2
데이터 프레임의 colums에 각 항목에 맞는 이름들로 변경하였고, 데이터들을 다시 한번 살펴본다음, 문제를 해결하는데 있어서 도움이 될거같은 데이터들만 선택하여 df2 변수명을 가진 데이터 프레임을 다시 생성하여 저장하였다.
데이터 전처리 과정 3
미디어 이용 현황 ‘가장 많이 이용하는 OTT 서비스’ 항목을 기반으로 데이터를 살펴보았을때 1순위 항목이 유튜브가 절반되는 데이터를 차지하고 있었다. 하지만, 본 프로젝트에서는 VOD를 기반으로한 OTT 플랫폼을 중점으로 진행을 목표로하고 있었기 때문에 ‘가장 많이 이용하는 OTT 서비스 2순위’를 선택하고, 유튜브에 해당하는 데이터는 제거해주었다. 또한, ‘기타, 아프리카 TV’도 제거하였다.
본 프로젝트는 해외, 국내 OTT 서비스로 구분하여 프로젝트를 진행해야하기 때문에 해외 OTT에 속하는 넷플릭스, 아마존 프라임 비디오, 디즈니 플러스 등은 정수 ‘0’으로 지정해주었으며 국내 OTT에 속하는 왓챠, 티빙, 쿠팡플레이 등은 정수 ‘1’로 지정해주었다. 또한, 프로젝트 진행에 사용되는 주이용 콘텐츠, 이용빈도 등의 변수들이 데이터형식이 문자열로 되어있었기 때문에 정수형으로 바꿔주었다.
데이터 전처리 과정 4
위와 같은 데이터 전처리 수행 후 결측값 확인 결과 결측값이 없는 것을 확인할 수 있었으며 결과 확인 후 모델학습을 진행하였다.
모델 학습
데이터 학습을 위한 모델은 DecisionTree와 RandomForest를 선택하였다. DecisionTree는 주어진 데이터의 특징과 속성을 기반으로 최적의 분할을 찾아 나무 형태로 구성하기 때문에 각 분할은 데이터를 더 잘 분류할 수 있는 특징을 선택하는 방식으로 이루어진다. 따라서 DecisionTree는 해석이 쉽고 직관적이기 때문에 어떤 특징을 가진 사람들이 해외 OTT, 국내 OTT 중 어떤 OTT를 사용할지 예측하는데 도움이 될거라고 생각하여 선택하였다. 하지만, DecisionTree의 경우 과적합이 쉽게 되는 경향이 있어 일반화 능력이 제한될 수 있기 때문에 여러개의 DecisionTree를 구성하여 예측하는 앙상블 기법인 RandomForset로 다시 한번 모델학습을 진행하였다. 또한, 변수의 중요도를 추정할 수 있어 특성 선택이나 변수 중요도 평가 등에 유용하게 활용할 수 있다고 판단하였다.
타겟값 설정
두가지 모델학습 모두 국내 해외 중 어떤 OTT 서비스를 사용하는지를 나타내는 데이터인 ‘OTT 서비스’를 타겟값으로 설정하여 모델학습을 진행하였다.
DecisionTree 모델학습
Df2에 저장된 데이터들로 DecisionTreeClassifer을 사용하여 모델학습을 진행하였다.
DecisionTree 모델학습 진행과정
훈련데이터셋에 대한 정확도는 약 0.89로 높은 편이었지만, 테스트데이터셋에 대한 정확도는 약 0.54로 과적합이 일어난 것을 확인할 수 있었다. 과적합을 해결하기 위해 feature importance를 시각화하여 다시 모델학습을 진행하였다.
DecisionTree Importance Feature 시각화
Feature Importance를 시각화하였을때 나이, 주이용 콘텐츠. 이용빈도, 가족 구성원가 높은 것을 확인하여 4가지 특징만 선택하여 데이터에 다시 저장하여 모델학습을 재진행하였다.
중요도가 높은 특징들로 결정트리 재학습 과정
재진행한 결과 훈련데이터셋의 정확도는 0.84로 높은 편이었지만, 테스트데이터셋의 정확도는 0.56으로 과적합이 재발생한것을 확인할 수 있었다. 이러한 문제를 해결하기 위하여 최적의 max_depth 값을 찾는 그리드 서치를 진행하였다.
결정트리 그리드 서치 진행 과정
그리드 서치를 진행한 결과 최적의 depth의 값은 3이 나왔고, max_depth의 값을 최적의 depth값으로 설정하여 다시 학습을 진행시켰다. 결과는 훈련데이터셋 정확도는 약 0.61, 테스트데이터셋의 정확도는 약 0.58이 나왔다. 따라서, 정확도는 낮지만 과적합되지 않은 것을 확인할 수 있었다.
RandomForest 모델학습
위와 같은 과정을 통해 Decisiontree의 과적합 문제를 해결하였지만, 좀 더 분명한 정확도와 특정 정확도를 파악하기 위해 RandomForest 모델 학습을 진행하였다.
RandomForest 모델학습 진행과정
성별, 나이, 연령대, 결혼여부, 직업유무, 가족 구성원, 주이용 콘텐츠,이용빈도 데이터를 저장하여 다시 모델학습을 진행하였다. 그 결과 훈련데이터셋의 정확도는 약 0.89, 테스트데이터셋의 정확도는 약 0.55 정도로 과적합이 발생한 것을 확인할 수 있었다. 과적합을 해결하기 위해 교차 검증 및 그리드 서치를 사용하였다.
RandomForest 교차 검증 그리드 서치 진행 과정
그결과 최적의 매개변수 조합은 ‘max_depth’는 10, min_sample_split은 10, n_estimators는 200의 값이 나온 것을 확인할 수 있었다. 최적의 매개변수 기반으로 모델을 학습했을때 , 훈련데이터셋의 정확도는 약 0.6이었고, 테스트데이터셋의 정확도는 약0.58인것을 통해 정확도는 낮지만 과적합되지 않은 것을 확인할 수 있었다.
데이터 시각화
국내외 OTT 사용자를 콘텐츠 장르, 이용 연령층, 성별 데이터와 관련하여 데이터 시각화를 진행하였다.
국내외 OTT 사용자와 콘텐츠 장르의 데이터 시각화
국내 TV 프로그램, 실시간을 제외한 모든 콘텐츠 장르에서 해외 OTT 사용률이 더 높은것을 확인할 수 있었다. 특히, 해외 OTT 서비스를 이용하는 사람들 중에 해외 TV 프로그램을 많이 사용하는 것을 알 수 있었고, 이 장르에서 가장 큰 차이가 나는 것을 확인할 수 있었다.
국내외 OTT 사용자와 연령대의 데이터 시각화
연령층을 시각화하였을때는 만 70세를 제외하고 모든 연령층에서 해외 OTT 사용률이 더 높은 것을 확인할 수 있으며, 특히 만 20세- 29세와 만 40-49세의 차이가 가장 큰 것을 확인할 수 있었다.
국내외 OTT 사용자와 성별의 데이터 시각화
성별과 관련하여 데이터를 시각화하였을때는 남자, 여자 모두 해외 OTT 사용률이 더 높은것을 알 수 있었다.
기술적, 디자인, 비용적 측면
기술적 측면
해외와 국내 OTT의 기술적인 측면에서도 분석을 진행하였다. 해외 OTT 같은 경우는 점유율이 가장 큰 Netflix의 기술적 요인을 분석하였고, 국내는 국내 OTT 중 점유율이 가장 큰 Wavve의 기술적 요인을 분석하였다. Netflix에서는 시청 취향으로만 영상을 추천하는 방식을 사용하고 있다고 한다. 즉, 지역, 나이, 인구 등 통계학적 정보가 아닌 순수 콘텐츠 시청 취향을 바탕으로 그룹화하여 영상을 추천한다. 또한, 기술 안정성 역시 뛰어나다. 한번에 접속자가 몰리는 경우에 해상도를 저하시켜 끊기지 않고 영상을 볼 수 있게 기능을 구현하였다. 반면에 국내 OTT Wavve의 경우 기본데이터를 사용하여 영상을 추천한다. 즉, 지역, 나이, 인구 등 통계학적 정보를 포함한 내부 데이터를 접목한 추천 시스템을 갖추고 있지만 이를 콘텐츠 기반 데이터와 결합하여 영상을 추천한다면 정확도가 떨어진다고 한다. 또한, 아직까지 끊김이 잦는 등 시청 이용에 불편함이 있다.
디자인적 측면
해외와 국내 OTT의 디자인적인 측면에서도 분석을 진행하였다. 기술적 측면과 마찬가지로 해외 OTT는 OTT 서비스 가장 큰 점유율을 차지하는 Netflix를 국내 OTT 서비스에서 가장 큰 점유율을 차지하는 Wavve의 디자인적 기술을 분석하였다.
Netflix PC와 모바일 UI
Netflix 같은 경우 PC UI는 상단 위에 영상 재생을 통해 콘텐츠를 광고하고 있으며, 버튼 클릭시 해당 콘텐츠가 재생되게 구현해놨으며 이와 같은 기능은 콘텐츠 시청까지로 이어진다. 또한, 모바일의 경우 상단에 작품 포스터 사진과 함께 재생 버튼을 배치해놓은 것을 확인할 수 있다. 모바일과 PC 모두 각 장르의 인기있는 작품들의 순위를 보여준다.
Wavve PC와 모바일 UI
Wavve의 경우 PC UI는 상단 위에 작품 사진을 통해 콘텐츠를 광고하고 있으며, 사진 클릭시 해당 작품 영상 목록으로 넘어가는 것을 확인할 수 있었다. 또한, 모바일의 경우 상단에 작품의 포스터 사진만 배치해두었으며 모바일과 PC 모두 각 장르의 인기있는 작품들을 보여주는 것을 확인할 수 있었다.
국내외 OTT 가격 비교
비용적인 측면에서도 분석을 진행하였다. 해외 OTT는 넷플릭스와 디즈니 플러스의 가격을 조사하였고 국내 OTT는 웨이브와 티빙을 기반으로 가격 비교분석을 진행하였다. 먼저 넷플릭스는 해상도, 저장여부, 동시접속자 등에 따라 가격에 차등을 두었다. 프리미어가 가장 좋은 버전이며 가격은 17,000원, 스탠다드의 가격은 13500원, 베이식은 9500원, 광고형 베이식은 5,500원이었다. 디즈니 플러스는 월간 9,900원으로 가격이 구성되었다. 국내 OTT의 경우 웨이브와 티빙 모두 해상도와 저장여부, 동시접속 사용자 수 등에 따라 가격에 차등을 두었으며 가장 좋은 서비스인 프리미어는 13,900원이었다.
실험 결과 보고
DecisionTree 모델 시각화
중요도가 높은 특징들만을 선택하고, 그리드 서치를 통해 과적합을 해결한 모델을 바탕으로 결정트리 시각화를 진행하였으며, 알 수 있는 점들은 다음과 같다.
DecisionTree시각화
1.
주시청 콘텐츠가 드라마이면서 나이가 50대인 이용자들은 국내 OTT를 사용한다.
2.
OTT를 일주일에 한번이라도 쓰는 이용자들은 해외 OTT를 사용한다.
3.
주시청 콘텐츠가 드라마가 아니고, 나이가 50대 미만인 사용자들은 해외 OTT를 사용한다.
RandomForest 중요도 시각화
RandomForest 중요도 시각화 과정
DecisionTree의 feature importance를 시각화했을때와 비슷하게 나이, 주이용 콘텐츠, 이용빈도, 연령대가 국내외 OTT 사용에 영향을 미치는 것을 알 수 있었다.
데이터시각화
데이터시각화에서는 전반적으로 해외 OTT 사용자가 더 많다는 것을 시각적으로 확인할 수 있었다.
기술적 측면
기술적인 측면에서는 국내와 해외 OTT는 영상을 추천해주는 방식에서 사용하는 데이터가 다르다는 것을 확인할 수 있었으며 아직까지 해외 OTT의 기술적 안정성이 높다는 것을 알 수 있었다.
디자인적 측면
해외 OTT와 국내 OTT UI에 대한 평가를 찾아본 결과 국내 OTT보다 해외 OTT인 Netflix의 UI가 더 편리하고 깔끔하다는 평이 더 많은 것을 확인할 수 있었다.
가격적 측면
여러 OTT들의 가격들을 살펴보았을때, 국내 OTT가 비용적으로 더 저렴하다는 사실을 알 수 있었다.
위와 같은 실험 디자인과 결과를 통해 가격적 측면에서 전반적으로 해외 OTT 가격이 높음에도 불구하고 이용률이 큰 것을 확인할 수 있었다. 이를 통해 OTT 사용에 있어서 콘텐츠 측면, UI, 기계적 측면이 OTT 사용에 있어서 중요한 요소로 작용됨을 추측할 수 있다. DecisionTree와 RandomForest 특징 중요도 시각화를 통해 나이, 주이용콘텐츠, 이용빈도, 연령대 요소가 국내외 OTT 사용에 영향을 미친다는 것을 알 수 있다. 데이터 시각화를 통해 해외 TV 프로그램에서 해외 OTT가 가장 큰 차지를 하고 있음과 동시에 가장 큰 차이를 나는 것을 보아 국내 OTT 서비스 콘텐츠에 해외 프로그램 콘텐츠를 유입하고 활성화시킨다면 국내 OTT 서비스 활성화에 도움이 될 수 있을거라 추측한다. 또한, 사용률에서 가장 큰 차이가 나며 가장 많이 OTT 를 사용하는 20대와 40대를 국내 OTT 서비스 활성화 타겟층을 설정하는 것을 추천한다. 또한, 결정 트리 시각화를 통해 얻은 결과를 기반으로 자주 OTT 서비스를 사용하는 사람들을 타겟층을 설정하는 것 또한 서비스 활성화에 도움이 될거라 생각한다. 기술적인 측면에서는 사용자의 데이터 사용 활용도 증대 및 국내 OTT 기업간의 상호작용이 활성화되어야하며, 기술 안정성 확보 및 통계학적 정보 사용을 기반으로한 시청 데이터를 사용하는 것이 중요하다. | 마지막으로, 디자인적 측면에서는 시작 화면상에 영상 재생 버튼 추가 등 UI적으로 개선이 필요하며 추천 영상이 아닌 순위로 영상 추천을 한다면 사용자 만족감 증대에 영향을 줄 것이라고 판단하였다.
이와 같은 방법으로 타겟층을 설정하고, 콘텐츠 확보, 디자인, 기술적 문제를 해결한다면 국내 OTT 서비스 활성화에 도움이 될 것이다.