일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 비용함수
- 추천 시스템
- CPP
- 인공지능
- OpenGL
- SVM
- 로지스틱 회귀
- 백준
- cs231n
- Vision
- 컴퓨터 비전
- pre-trained
- logistic regression
- 컴퓨터 그래픽스
- 머신러닝
- Computer Vision
- Kaggle
- Support Vector Machine
- 그래픽스
- CNN
- 딥러닝
- 파이썬
- Unsupervised learning
- neural network
- recommender system
- SGD
- C++
- Regularization
- 신경망
- petal to metal
- Today
- Total
kwan's note
recommendation system - 추천 시스템 (content based) 본문
recommendation system - 추천 시스템 (content based)
kwan's note 2021. 2. 7. 13:07출처: machine learning by andrew ng, stanford cousera lecture
수강일시: 2021.02.06
이번에는 넷플릭스 왓챠같은 ott부터 아마존 쿠팡과 같은 사이트에서 핵심기술로 사용되고 있는 추천 시스템에 대해 알아보고자 합니다.
영화에 평점을 매기는 시스템이 있다고 할 때 다음과 같이 평가하는 시스템이 있다고 해보자.
nu= 사용자수
nm= 영화수
r(i,j)= j가 영화i를 평가했는지
y(i,j)= j가 영화i에 준 평점
일때 위 예시에서는 nu=4 nm=5가 된다.
content based recommender system에서를 보자.
이때 x는 영화의 특성을 나타내는 벡터이다 예를들어 x1은 로맨스 index, x2는 액션영화index 등 이다.
그리고 theta는 사용자의 특성선호 벡터이다.
이에 따라 어떤 유저의 특정 영화에 대한 평점은 theta와 x의 곱으로 나타내어 진다고 본다.
따라서 x와 y를 알고있는 데이터에 한해서 (r i j 가 1일경우) 최소제곱을이용해 경사하강법을 진행하고자 한다.
reminder-by-kwan.tistory.com/89?category=962582
이를통해 x를 알고 있을 때 theta를 구하는 방법에 대해서 생각해 보았습니다.
하지만 여기에는 명확한 단점이 있는데 이는 모든 영화에 대해 평점프로그램 개발자가 feature index의 점수를 다 정해놓고 매겨야 합니다.
이는 매우 불편하고 어려운 작업이다. 다음시간에는 x를 사람이 모두 정해주지 않고도 평점시스템을 개발할 수 있도록 하는 collaborative filtering 방식에대해 배워보도록 하겠습니다.
reminder-by-kwan.tistory.com/108
'ML and AI > Machine learning - Andrew Ng' 카테고리의 다른 글
Stochastic gradient descent(SGD) -확률적 경사 하강법 (0) | 2021.02.07 |
---|---|
Collaborative filtering - 협업 필터링 (0) | 2021.02.07 |
Anomaly Detection - 이상값 탐지 (0) | 2021.02.07 |
Dimesionality reduction - 차원축소 , PCA( principal component analysis) (0) | 2021.02.06 |
K means cluster (K 평균 군집) - 군집분석 (0) | 2021.02.05 |