본문 바로가기
Machine Learning

Object Detection 기본적인 내용 정리

by Hyeon.___. 2023. 8. 7.
반응형
  • Object Detection이란
    • 이미지나 비디오 내에서 객체를 식별하고 위치를 찾는 Computer vision 기술
    • 이미지 분류가 전체 이미지에 레이블을 할당하는 것과 달리, 객체 탐지는 이미지 내의 여러 객체를 인식하고 그 객체들이 무엇인지와 어디에 있는지에 대한 정보를 제공
    • 객체 탐지가 포함하는 내용
      • 객체의 식별
      • 객체의 위치 지정
      • 여러 객체 처리
      • 실시간 처리
    • 자율 주행을 위해 차량이나 사람을 찾아내거나 얼굴 인식을 위해 사람 얼굴을 찾아내는 경우에 사용 됨, 그 외 다양하게 사용됨
    • Algorithm
      • two-stage Detector
        • R-CNN
      • one-stage Detector
        • YOLO
        • SSD
    • Pixel 연산
      • Pixel의 정의
        • "Picture Element"의 줄임말로, 디지털 이미지의 기본 단위이다. 픽셀은 이미지를 구성하는 가장 작은 점으로, 특정 색상 값을 가지며, 이러한 픽셀들이 모여 하나의 이미지를 형성한다.
        • 픽셀은 색상 값을 가지며, 이미지의 해상도에 따라 크기가 결정되고, 좌표로 위치가 표현된다. 
      • Pixel의 구성
        • RGB 이미지 :  각 픽셀은 R, G, B의 세 가지 색상 채널로 구성된다.
        • 흑백 이미지 : 각 픽셀은 단일 채널로 구성되며, 그레이스케일 값을 나타낸다.
      • Pixel의 연산
        • Point Operations : 각 픽셀에 독립적으로 적용되는 연산으로, 밝기 조정과 대비조정 등이 있다.
        • Neightborhood Operations : 주변 픽셀의 값에 따라 픽셀 값을 조정하는 연산으로, 컨볼루션 등이 있다.
        • Logical Operations : 두 이미지 간의 픽셀 값을 비교하여 새 이미지를 생성하는 연산으로 AND, OR, XOR등이 있다.
반응형

'Machine Learning' 카테고리의 다른 글

Adversarial learning의 갈래  (0) 2023.07.20
Deep Learning 분야  (0) 2023.07.19
Back Propagation  (0) 2023.02.16
인공신경망이란  (0) 2023.02.15
지도 학습  (0) 2023.02.15

댓글