Computer vision
컴퓨터 시각은 인간의 시각체계에 해당되는 능력을 컴퓨터에 심어 넣기 위해 연구하는 인공지능의 한 분야입니다.
이러한 Computer vision은 다양한 분야에 활용되고 있습니다.
영상 혹은 사진을 통해 글자, 물체 등의 객체를 인식하고, 얼굴, 지문, 홍채 등의 생체인식에도 사용되며
의료 진단을 위한 영상 분석, 제조 공정에서 제품 결함의 자동 시각 검사, 보안 시스템에서 객체의 검출 및 추적을 진행하기도 하며 로봇, 자율주행, 컴퓨터와 사람의 상호작용을 통한 입출력 장치에 활용되고 있습니다.
이 중 단연 활발히 연구가 진행되고 있는 분야는 로봇과 자율주행입니다. 자율주행에는 여러 센서와 카메라 영상을 통해서 거리, 객체를 인식하지만 테슬라에서는 적은 수의 센서를 가지고 객체를 표현해 자체적인 연구를 진행해 상당한 성과를 보이고 있으며 가치를 입증하고 있습니다.
이러한 컴퓨터시각에서는 고수준 처리와 저수준 처리로 나누어질 수 있습니다.
고수준 처리 | 저수준 처리 |
고수준 처리에서는 실세계의 정보를 취득하고, 혹은 가지고 있는정보를 활용해 의사결정을 진행합니다. | 저수준처리에서는 영상을 입력받고 해당 영상을 가공, 분석, 이해를 진행합니다. |
일반적인 컴퓨터 시각처리는 다음과 같은 진행단계를 거칠 수 있습니다.
영상취득 | 전처리 | 영상분할 | 정규화 | 영상표현 | 분석(식별) |
영상 취득
영상 취득 단계에서는 다양한 유형의 센서를 이용하여 디지털 영상을 취득합니다.
- 영상 센서, 적외선 센서 등 사람이 인식하는 시각과 사람이 볼 수 없는 영역의 시각 데이터를 가지고 활용될 수 있는 영상을 제작합니다.
- 레인저 센서 즉 거리에 대한 인식을 위한 센서를 이용해 물체들 간의 거리를 측정합니다.
- X-선 단층 촬영 영상을 통해 입체적인 영상을 생성할 수 있습니다.
전처리
전처리 단계에서는 취득한 영상을 보다 처리하기 좋은 형태로 가공하기 위해 하는 작업입니다.
- 영상 취득과정에서 발생된 훼손이나 잡음을 처리합니다.
- 영상의 개선을 진행합니다. 명암, 대비 등을 개선하여 필요한 정보를 검출하기 쉽게 합니다.
영상 분할
영상 해석의 단위가 될 수 있는 영역을 다른 부분과 구분하는 처리단계입니다.
- 컴퓨터는 다양한 방법으로 데이터를 인식 및 구분합니다. 그중 유사한 성격을 가지는 영상의 부분을 하나의 영역으로 취급해 하나의 영역으로 묶고 상이한 특성을 갖는 부분을 서로 다른 영역으로 구분합니다.
정규화
말 그대로 특정한 알고리즘에 따라서 영상에서 발생할 수 있는 변형을 회복하여 기준이 되는 형태로 변환합니다.
- 객체의 크기, 위치, 객체가 놓인 방향, 영상의 밝기, 대비 등을 정규화합니다.
영상 표현
분할된 영역들로 구성되는 객체를 해석하기 위해 각각의 영역을 적절한 방법으로 컴퓨터 내에 묘사하는 것입니다.
- 대상의 유용한 속성을 표현할 수 있도록 합니다.
- 객체의 변형에도 고유한 속성을 유지할 수 있는 표현방법을 가져야 합니다. 실세계의 객체들은 유사한 영상 형태를 가질 수 있습니다. 그럼에도 고유한 속성을 통해 각 객체를 구별해야 하기 때문에 알맞은 표현방법을 사용해야 합니다.
- 예를 들면 lines, edge, corner , blob 등등
'인공지능' 카테고리의 다른 글
Machine Learning (0) | 2021.11.14 |
---|---|
인공지능 개요 (0) | 2021.09.11 |
댓글