kwan's note

recommendation system - 추천 시스템 (content based) 본문

ML and AI/Machine learning - Andrew Ng

recommendation system - 추천 시스템 (content based)

kwan's note 2021. 2. 7. 13:07
반응형

출처: machine learning by andrew ng, stanford cousera lecture

수강일시: 2021.02.06

 

이번에는 넷플릭스 왓챠같은 ott부터 아마존 쿠팡과 같은 사이트에서 핵심기술로 사용되고 있는 추천 시스템에 대해 알아보고자 합니다.

 

영화에 평점을 매기는 시스템이 있다고 할 때 다음과 같이 평가하는 시스템이 있다고 해보자.

nu= 사용자수

nm= 영화수

r(i,j)= j가 영화i를 평가했는지

y(i,j)= j가 영화i에 준 평점

일때 위 예시에서는 nu=4 nm=5가 된다.

 

content based recommender system에서를 보자.

 

이때 x는 영화의 특성을 나타내는 벡터이다 예를들어 x1은 로맨스 index, x2는 액션영화index 등 이다.

그리고 theta는 사용자의 특성선호 벡터이다.

이에 따라 어떤 유저의 특정 영화에 대한 평점은 theta와 x의 곱으로 나타내어 진다고 본다.

 

 

따라서 x와 y를 알고있는 데이터에 한해서 (r i j 가 1일경우) 최소제곱을이용해 경사하강법을 진행하고자 한다.

reminder-by-kwan.tistory.com/89?category=962582

 

gradient descent(경사하강법)

출처: machine learning by andrew ng, stanford cousera lecture 수강일시: 2021.01.24 reminder-by-kwan.tistory.com/88 Cost function -비용함수/ 손실함수 출처: machine learning by andrew ng, stanford cou..

reminder-by-kwan.tistory.com

 

이를통해 x를 알고 있을 때 theta를 구하는 방법에 대해서 생각해 보았습니다.

하지만 여기에는 명확한 단점이 있는데 이는 모든 영화에 대해 평점프로그램 개발자가 feature index의 점수를 다 정해놓고 매겨야 합니다.

이는 매우 불편하고 어려운 작업이다. 다음시간에는 x를 사람이 모두 정해주지 않고도 평점시스템을 개발할 수 있도록 하는 collaborative filtering 방식에대해 배워보도록 하겠습니다.

reminder-by-kwan.tistory.com/108

 

Collaborative filtering - 협업 필터링

출처: machine learning by andrew ng, stanford cousera lecture 수강일시: 2021.02.06 reminder-by-kwan.tistory.com/107 recommendation system - 추천 시스템 (content based) 출처: machine learning by andr..

reminder-by-kwan.tistory.com

 

반응형