kwan's note

컴퓨터 비전(computer vision) 본문

ML and AI/Intro to AI - SNU

컴퓨터 비전(computer vision)

kwan's note 2021. 1. 21. 18:54
반응형

수강일시: 2021.01.21

출처: kmooc SNU048

 

www.kmooc.kr/courses/course-v1:SNUk+SNU048_011k+2020_T2/course/

 

강좌 | SNU048_011k | K-MOOC

 

www.kmooc.kr

컴퓨터 비전이란

사람으로서 눈을 가지고 할 수 있는 많은 일들을 기계 혹은 컴퓨터에게 가르쳐주는 학문.

즉, 시각지능을 갖추어서 여러 가지 일을 하는데, 그 시각지능의 수많은 작업들을 기계도 역시 할 수 있도록 가르치는 것이 Computer Vision의 목적 그리고 그 정의라고 이해할 수 있다.

 

 

 

사람의 시각이 할 수 있는일과 한계에 대해서 정리해보았다.

 

먼저 사람은 물체인식, 위치를 탐색하고 위험물을 감지할 수 있다. 장면의 분위기를 읽을 수 있고 사진에서 스토리를 추출할 수 있다(문맥을 파악할 수 있다).

 

하지만 착시현상을 겪기도 하고 세부적인 사항을 놓치기도 한다(미드 셜록에서 처럼 모든걸 분석하기 어려움)

그리고 모호함을 분석하기 어려울 때도 있고 개인의 편견에 치우치기도 한다. 또한 완벽한 정확성에 대해 고민하지 않는다. 그리고 메모리에 한계가 있다.

 

 

 

 

 

 

흑백은 N*M (0~255)

컬러는 N*M*3으로 나타낸다.

vision project를 단계로 구분해보면 다음처럼 3단계로 나눌 수 있다.

  1. Low-level Computer Vision이라는 건 주어진 input도 이미지고 output도 이미지인 경우.
  2. Mid-level 컴퓨터 Vision task는 이미지가 주어졌을 때 output으로 이미지를 얻어내는 게 아니라, 어떤 특정 정보를 나타내는 feature, 특징점을 알아내는 걸 Mid-level 비전이라고 함.
  3. High-level은 이미지로부터 어떤 의미를 알아내는 걸 High-level 비전이라고 함.

각 level에 따른 작업들을 알아내보도록 하자.

edge detection과 boundary detection의 차이점은 edge는 단순히 밝기가 바뀌는 부분을 찾아내는것인데 반해 boundary는 실제 물체의 경계를 구분해야 한다.

즉, 도마뱀의 눈이나 줄무늬는 나타내지 않고 도마뱀의 겉 경계만 파악해야 한다.

 

shape from shading은 오목 볼록등의 특징을 이미지로부터 파악하는것이다.

예를들어 왼쪽은 오목하다고 느끼고 오른쪽은 볼록하다고 느끼는데 이러한 것들을 찾아내는 작업이다.

 

마지막으로 high level 의 예는 다음과 같다.

가끔 보는 유튜버가 있는데 그 교수님께서 vision과 graphics의 차이점에 대해 설명해주신게 있어서 링크를 걸어놓았다.

www.youtube.com/watch?v=d4uvmSrd21Q

 

다음은 비전과 그래픽스등 이미지와 관련된 분야들을 도식화한 것이다.

반응형