일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- CPP
- 파이썬
- 머신러닝
- neural network
- pre-trained
- 로지스틱 회귀
- 그래픽스
- Computer Vision
- Support Vector Machine
- Kaggle
- 인공지능
- 딥러닝
- recommender system
- 백준
- 신경망
- Vision
- OpenGL
- 컴퓨터 비전
- C++
- SGD
- SVM
- 추천 시스템
- 컴퓨터 그래픽스
- 비용함수
- CNN
- Unsupervised learning
- logistic regression
- Regularization
- petal to metal
- cs231n
- Today
- Total
kwan's note
Collaborative filtering - 협업 필터링 본문
Collaborative filtering - 협업 필터링
kwan's note 2021. 2. 7. 15:28출처: machine learning by andrew ng, stanford cousera lecture
수강일시: 2021.02.06
reminder-by-kwan.tistory.com/107
이번 시간에는 저번 시간에 이어 recommendation system에 대해 알아보고자 합니다.
저번 시간에는 content based system을 알아보았는데 모든 영화에 대해 x값을 지정해줘야하는 단점이 있었습니다.
이번에는 이를 해결하기 위해 새로운 방식인 collaborative filtering을 이용한 recommendation system에 대해 알아보고자 합니다.
위와 같이 x1 x2의 값을 모를 때 사람들이 매긴 평점만을 이용해서 x값과 theta값을 알아내는가에 대한 방법입니다.
이전에 보았던 x를 이용해 theta를 구하는 방법에 더해
theta를 알고 있을 때 x를 구하는 방법에 대해 알아보겠습니다.
동일하게 gradient descent를 하여 cost function을 minimize하는 x 값을 구하게 됩니다.
따라서 우리는 x를 알때 theta를 구하는 방법
theta를 알 때 x를 구하는 방법에 대해 알아보았습니다.
이를 합해 임의의 값에 대해서도 서로의 값을 구하는 식을 만들고자 합니다.
즉 x 와 theta를 random하게 초기화한 후 서로에 대한 costfunction 최소화를 반복하는 식을합하여 계산하면 user의 theta를 이용해 어떤 영화를 좋아하게 될지 알 수 있게 된다.
이를 이용해 초기에 작성했던 표를 채울 수 있게된다.
이제 이를이용해 관련 영화를 찾을 수 있는데 영화들간 x값이 유사하다면(xi-hj의 norm이 입실론 이하)이를 유사하다고 판단한다.
만약 사용자가 아예 평가를 안했을 경우에 대해서도 생각해 볼 수 있는데
그냥 식을 돌려버리면 모두 0값이 나오게 된다. 그렇다면 모든 영화에 0점을 준것과 동일한데 이는 맞는 방법이 아니므로 식을 normalize 한다.
식을 normalize하여 평균을 빼주면 평가가 전혀 되지 않았을 때 모두0으로 초기화해도 평균값을 기준으로 평가할 수 있게된다.
'ML and AI > Machine learning - Andrew Ng' 카테고리의 다른 글
Mini batch gradient descent (0) | 2021.02.07 |
---|---|
Stochastic gradient descent(SGD) -확률적 경사 하강법 (0) | 2021.02.07 |
recommendation system - 추천 시스템 (content based) (0) | 2021.02.07 |
Anomaly Detection - 이상값 탐지 (0) | 2021.02.07 |
Dimesionality reduction - 차원축소 , PCA( principal component analysis) (0) | 2021.02.06 |