HiTHerE !

2.1.4. 컴퓨터 비전(Computer vision) 본문

MS Hackers Ground/AI-900: Microsoft Azure AI

2.1.4. 컴퓨터 비전(Computer vision)

minju26 2023. 8. 14. 16:15

컴퓨터 비전(Computer vision)

  • 시각적인 처리를 다루는 AI 분야
  • 대표적인 예시 Seeing AI
    • 시각장애인을 위해 디자인된 Seeing AI 앱
    • AI의 능력을 이용하여 시각적인 세계를 열고 가까이에 있는 사람, 텍스트 및 사물을 설명함

 

컴퓨터 비전 모델 및 기능

  1. 이미지 분류 (Image classification)
    콘텐츠에 따라 이미지를 분류하는 기계 학습 모델 교육이 포함됨
    예를들어, 트래픽 모니터링 솔루션에서는 이미지 분류 모델을 사용하여 택시, 버스, 자전거 타는 사람 등 차량 유형에 따라 이미지를 분류할 수 있음
  2. 개체 감지 (Object detection)
    이미지 내의 개별 개체를 분류하고 경계 상자를 사용하여 해당 위치를 식별하도록 학습됨
    예를들어, 트래픽 모니터링 솔루션은 개체 감지를 사용하여 다양한 차랑 클래스의 위치를 식별할 수 있음
  3. 의미 체계 구분 (Semantic segmentation)
    이미지의 개별 픽셀이 속한 개체에 따라 분류되는 고급 기계 학습 기술
    예를들어, 트래픽 모니터링 솔루션은 "마스크" 레이어로 트래픽 이미지를 오버레이하여 특정 색상으로 다른 차량을 강조 표시 할 수 있음
  4. 이미지 분석 (Image analysis)
    이미지에 표시된 장면을 요약하는 데 도움이 되는 설명 캡션이나 이미지를 분류하는 데 도움이 되는 '태그'를 포함하여 이미지에서 정보를 추출하는 고급 이미지 분석 기술과 기계 학습 모델을 결합한 솔루션을 만들 수 있음
  5. 얼굴 감지, 분석 및 인식 (Face detection, analysis, and recognition)
    이미지에서 사람의 얼굴을 찾는 특수한 형태의 개체 감지
    분류 및 얼굴 기하 도형 분석 기술과 결합하여 얼굴 기능에 따라 개인을 인식할 수 있음
  6. OCR(광학 문자 인식 / Optical character recognition)
    이미지의 텍스트를 검색하고 읽는데 사용되는 기술
    사진에서 텍스트를 읽거나 문자, 송장 또는 양식과 같은 스캔된 문서에서 정보를 추출할 수 있음
1. 이미지 분류 2. 개체 감지
1. 이미지 분류
3. 의미 체계 구분 4. 이미지 분석
5. 얼굴 감지, 분석 및 인식 6. OCR(광학 문자 인식)