일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Computer Vision
- 컴퓨터 비전
- 신경망
- 파이썬
- OpenGL
- Kaggle
- neural network
- Regularization
- 인공지능
- 비용함수
- Vision
- 딥러닝
- C++
- CPP
- SGD
- 컴퓨터 그래픽스
- 로지스틱 회귀
- cs231n
- petal to metal
- 머신러닝
- SVM
- Support Vector Machine
- Unsupervised learning
- 그래픽스
- logistic regression
- pre-trained
- 추천 시스템
- 백준
- recommender system
- CNN
- Today
- Total
kwan's note
정규방정식 본문
출처: 부스트코스-인공지능을 위한 선형대수
수강일시:2021.01.06
이전내용인 최소제곱직선에 이어서 작성하였습니다.
reminder-by-kwan.tistory.com/30
이전 수업에 이어서 최소제곱직선을 만족하기 위해 xhat은 다음의 normal equation을 만족해야 한다.
AT(b-Axhat)=0
ATb=ATAxhat=0
argmin ll b- Ax ll 는 이를 제곱한것과 같은값이다.
(길이의 최솟값을 만드는 x와 길이제곱의 최솟값을 만드는 x는 동일한값)
따라서 argmin (b-Ax)T(b-Ax)로 계산하면
bTb-xTATb-bTAx+xTATAx가 되는데
이때 값을 x에 대해 미분하여 최소가 되는 x를 구하도록 하자.
벡터의 미분에 대해 생각해보자. 이는 각각 x의 성분의 편미분으로 본다.
다시 원래 식으로 돌아가 xTATb의 x에대한 미분은 ATb가 된다.
bTAx의 x에 대한 미분은 xT(bTA)T의 x에 대한 미분이 되므로 ATb가 된다.
xTATAx 는 곱의미분을(f'g+ fg') 이용하여 계산하면 2ATAx가 된다.
따라서 bTb-xTATb-bTAx+xTATAx의 미분은 결과는 ATb-ATAx=0가된다.
ATA의 역행렬이 없다면 해가 무수히 많거나 없게된다.(여기선 무수히 많은경우이다)
A의 column vector가 linearly dependent하면 ATA의 역행렬이 존재하지 않는다.
하지만 데이터가 많은경우, real life problem에서 linearly dependent인 경우가 자주 발생하지는 않는다.
x=(ATA)^-1 ATb가 된다.
'Math > Linear algebra' 카테고리의 다른 글
그람-슈미트 직교화(Gram-Schmidt Orthogonalization) (0) | 2021.01.07 |
---|---|
정사영 (Orthogonal Projection) (0) | 2021.01.07 |
최소제곱 문제(Least Squares Problem) (0) | 2021.01.06 |
전사함수(Onto, Surjective)와 일대일함수(One-to-one, Injective) (0) | 2021.01.06 |
선형변환(Linear Transformation) (0) | 2021.01.06 |