일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 인공지능
- 컴퓨터 비전
- cs231n
- 컴퓨터 그래픽스
- petal to metal
- Kaggle
- C++
- 그래픽스
- 로지스틱 회귀
- SGD
- 딥러닝
- CNN
- CPP
- 머신러닝
- 추천 시스템
- recommender system
- OpenGL
- Regularization
- 비용함수
- Computer Vision
- Support Vector Machine
- pre-trained
- Vision
- SVM
- 신경망
- neural network
- Unsupervised learning
- 파이썬
- logistic regression
- 백준
- Today
- Total
kwan's note
컴퓨터 비전 - RANSAC image alignment 본문
컴퓨터 비전 - RANSAC image alignment
kwan's note 2022. 4. 26. 21:34이 노트는 고려대학교 김현우교수님의 대학원 강의인 컴퓨터 비전을 수강하고 작성하였습니다.
이전노트
https://reminder-by-kwan.tistory.com/157
연속된 두장의 이미지를 어떻게하면 붙일 수 있는지에 관한 문제가 image allignment입니다.
즉 아래와 같은 두 이미지를 하나로 합치려는것입니다.
가장 간단하게 생각해 볼 수 있는 방법은 두 이미지가 단순히 translation되었다고 생각하는 것 입니다.
이미지에서 feature point 하나를 선택하고 두개 이미지 사이의 거리를 측정해 이를 이용해 단순히 해당 거리만큼 이동해 붙이는 것 입니다. 물론 여러개의 feature point를 잡고 min loss를 만드는 거리를 찾을 수 도 있습니다.
하지만 이미지가 단순히 translate 되어있는경우는 잘없고 또 첫번째 이미지처럼 projection이 되어있는 경우 여러개의 점을 이용해 homography를 찾는 방법으로 두 이미지간의 변환을 구해 이을 수 있습니다.
이제 모든 이미지의 feature point를 하나씩 찾으면 두 이미지간의 공간 변환을 할 수 있습니다.
하지만 실제로 사람이 다 찾는경우는 없고 여러 알고리즘을 통해 찾게될텐데 이런경우 튀는점 즉 outlier가 발생합니다.
이러한 점들을 파악하기 위해서는 어떤 점이 outlier인지 알아내는것이 필요합니다.
이때 RANSAC의 아이디어는 가설 변환을 만들고 해당 가설에 만족하는 점이 가장 많은 경우를 뽑게 됩니다.
즉, 무작위 점들을 뽑아 변환 함수를 만들고 해당 함수에 모든 점들을 적용해 우리가 정한 옳은 위치에 이동한 점이 가장 많은 변환을 정답으로 뽑습니다.
따라서 기본 RANSAC은 위와 같습니다.
다만 이런 RANSAC에는 몇가지 단점이 있는데 여러 파라미터들을 이미지나 변환마다 다르게 적용해줘야 한다는것, iteration이 많아 연산에 시간이 걸린다는점, inlier의 갯수가 적다는것등이 있습니다.
특히 모든점들을 다 골라서 봐야한다는 단점이 있는데 이러한 단점을 줄이기 위해 여러 알고리즘들이 추후에 발표되었습니다. 개선된 알고리즘들은 주로 어떤점을 모델을 만드는데 사용할지에 관한 것 입니다.
그중 하나인 PROSAC을 첨부하였습니다. 2005CVPR에 발표된 논문이네요
'computer vision > Computer vsion -Korea Univ Graduate' 카테고리의 다른 글
컴퓨터 비전 - edge detection (0) | 2022.04.22 |
---|---|
컴퓨터 비전 - denoising image with linear filter (평균값 필터, 가우시안 필터) (0) | 2022.04.21 |