ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 컴퓨터 비전 & 그래픽스 정리 이야~~
    카테고리 없음 2020. 2. 18. 16:59

    [컴퓨터 비전의 개요(1.pdf)]​-영상이나 비디오 데이터를 처리하여 의미 있는 정보를 추출하는 과정-기계 시간에 해당하는 부분을 연구하는 컴퓨터 과학의 연구 분야-최근 인공 지능과 융합하고 다양한 범위에 적용되는 것(스마트 팩토리, 자율 주행, 지능형 CCTV, 로봇 등)-소스에 대한 처리=>영상 처리-처리된 영상을 갖고 사용자가 원하는 서비스를 제공=>컴퓨터 비전 ​[컴퓨터 비전에서의 뭉지에헤 방영 중단 법, 컴퓨터 비전 시스템 설계(1.pdf)]​ 1. 들은 지에헤교루을 위한 접근 ​ 1) 들은 지에헤교루을 향한 인간의 시간과 비교-사람의 시간은 데당이 빠르고 강건.시간의 인지정보를 초고속으로 취득하여 정보를 초고속으로 합성함컴퓨터로 사람의 수준을 달성하는 것은 현재로서는 불가능한 인공지능, 초고성능 컴퓨팅 기술, 초고속 통신기술의 융합기술로 발전 많은 기술연구 및 개발에서 다양한 분야에 적용된 본인의 아직 수준에는 미치지 못할 것이다.2)과학적 접근과 공학적 접근 ​(1)과학적 접근-인간의 시간을 만든다.-자연 현상에 대한 호기심에서 출발하고 자연의 원리, 본인의 법칙을 발견하고 이를 해석하고 꾸준한 지식 체계를 만드는 활동 과학=탐구 과정+과학 지식-사람은 시간의 원리를 밝히고 세운 뒤 컴퓨터에서 모방-뇌 과학의 주요 관 심사-지식 표현, 학습, 추론, 창작의 같은 인공 지능이 필수- 어려운 이유:욕뭉지에/불량 문재 다양한 변형 발발(2)공학적 접근-한정된 범위 내에서 특정 목표를 수행할 시간-문재를 발견하고 이에 대한 기술적 해결책을 제시하는 학문-특정 상황에서 특정)춤을 수행하는 실용 시스템 구축- 많은 응용, 현장으로 사용하며 컴퓨터 비전이 남보다 뛰어난 경우(칩 검사, 정밀 측정 등)에 성공적으로 사용된다.3)계층적 처리-영상->전처리->특징 추출->해석->고급 묘사-전처리:디지털 영상 데이터 처리-특징 추출:엣지 선분, 영역, 텍스처, 지상의 특징 등을 검출하고 특징 벡터를 검출-해석:응용에 의해서 다양한 형태 4)문재 해결 도구-자료 구조와 알고리즘:고속 처리가 주요 관 심-자료 구조:배열, 트리, 그래프, 엉덩이, 헤 신, 탐색 트리 등 알고리즘:단호히 욕 방법, 동적 프로그래밍, 제한기 등 5)수학 선형 대수, 미적분학, 확률과 통계 등 최적화 문재 해석 6)기계 학습-기계 학습을 활용하는 사례 급증-신경망, SVM, AdaBoost, Random Forest등 2. 시스템 설계 ​ 1)시스템 설계 발보품은지에 이해->데이터베이스 수집->알고리즘 설계와 구현->성능 평가(1)문재 이해-정확한 목표와 목적 정의-상황 및 정보의 분석- 주어진 문재에 대한 직관적이고 철저한 이해하고 합리적인 제약 조건의 수립의 필요 사이즈가 지속적으로 정면의 얼굴(지속적인 크칙이나 환경 적용 분석 대상이 환경이 명확하고 일정함)vs자연 영상 속의 얼굴(규칙이 없는 자연 영상, 일정하지 않는 여러가지 상황이나 객체가 존재)전자는 제작은 용이하 본인 응용 분야가 한정된다.보안정치에 활용은 가능하지만 사진분류 응용에 적용은 불가능하다.(2)데이터베이스 수집-질적 양적으로 우수하라면 고성능 시스템을 제작 가능하다.-데이터베이스:학습+테스트 집합 데이터 수집 방법:직접 수집( 많은 비용이 버흐(후), 인터넷에서 다운로드(다양한 자료)(3)알고리즘 설계와 구현-문재가 해결을 위한 적합한 알고리즘의 선택 및 신규 개발-알고리즘 선택의 중요성과 어려움 새로운 알고리즘 개발은 기존의 알고리즘에서 주어진 문재에 적합한 것을 선택 끝 영역, 지상의 특징 중에 어느 것을 사용하는가.영역을 쓴다면 어떤 영상 분할 알고리즘을 사용할까?어느 추적 알고리즘을 사용한다?=>선택 방법의 데이터베이스를 이용한 타당성과 성능 교무욜(설계자의 경험과 직관이 중요)기존의 연구 자료와 기술 자료의 성능 비교 분석(4)성능 평가-시스템의 목표 성능 평가 및 성능 평가 시 오류에 대한 결과 분석이 중요하다는 것 ​-인식 성능 측정:현실 세계의 객체의 다양성에 의해서 시간 인식 성능 변이가 크게 ​[영상 기본 연산(2.pdf, 2_2.pdf)]​ 1. 점 연산-다만 본인의 명암치에 의해서 새로운 값을 판정-픽셀 하나/해당 픽셀이 어느 특정의 연산을 통해서 새로운 값으로 바뀐다(단순한 색 변경)-픽셀 위치 기반 처리(위치는 변하지 않는 것)라서 기본적인 이제 겨우 형상은 갖고 있는 것-두 영상의 위치 기반 합성:두개의 픽셀 값을 넣어 줌 1)선형 연산:픽셀의 값을 일정하게 올림(명나라루 해도 조정, 반전 등)2)비선형 연산:감마 조정(모니터/프린터 색 조정)=>가중치를 주고 보다 3)디졸브:알파 블렌딩/오버랩(두장의 또 일이 겹쳐서 알파 값을 조정하고 두번째 볼 소지로 바꾸는 연산)​ 2. 영역 연산-이웃 화소의 명암치에 의해서 새로운 값을 판정-픽셀의 본래의 값과 맞닿은 픽셀의 값을 기반으로 픽셀 값을 변경-픽셀이 모인 하봉잉의 덩어리(포토샵에서 영역 설정 도구)=>마스크를 사용하여 원하는 결과를 만든다.-영역이 어떤 의미를 갖고 있는지를 검출-영역이라는 마스크를 활용하여 픽셀 값과 인접한 픽셀 값을 확인하고 연산 ​ 1)관계/관련과 콤보 루루 존-상관/관련:원시적인 매칭 연산(물체를 창 형태로 표현하고 물체를 검출)-공볼루션:윈도를 다음 집은 후 상관 적용. 토마스 펄스 반응(신호 처리 분야에서 사용)-상관/관련=컨벌루션으로 보면 된다(마스크=커널=구입되는 행렬)-다만 차이가 있다면 상관/관련 윈도우 가격을 컨벌루션은 다음 집은 후상관을 적용하는 것이었다. 신호 처리 때문이지만, 현재는 다음 집은 후상관을 적용하지 않기 때문에 보통의 윈도우 그대로를 컨볼루션이라고 볼 수도 있을 것이다.-2차원 예제를 보면 알아 거리가 일반 관계의 사용시에 창이 다음 취하고 본인 오지만 콤보 루루 션은 그대로 자신 올 때 신호 처리에서 사용할 것이었다.​ 2)콤보 루루)의 예(선형 연산)=>이것은 앙다움하고 사용하는 것콘볼루션은 좌측상단에서 우측하단까지 모든 픽셀을 돌면서 연산하는 것을 스토리로도 할 생각이다.(1)박스=>평활(2)갸우의 시안=>평활(3)샤프닝:인접한 4개+본인까지 연산 하고 본인과 주변 픽셀 값의 차이를 급격히 봉잉게하고 경계를 명확하게 만든다. =>명암 대비 강조(4)에지(수평, 수직)=>계면 검출 ​ 3)콤보 루루)의 예(비선형 연산)(1)메디안 필터-필요한 값의 중앙값을 취하게 된다.점에서 잡음이 들어있는 것(솔트페퍼 잡음)에 효과적이었다. - 엣지 저장효과 : 메디안 가우시안 - 원래 가지고 있는 대비 특성도 잘 가지고 있다.가우시안 필터보다 경계면이 살아있다.-특정의 목적이 있을 때에만 사용하고 사용하지 않는다. ​ 3. 기하 연산-지속적인 기하의 연산으로 판정된 화소의 명암치에 의해서 새로운 값을 판정-픽셀의 위치, 본인의 배열을 변형시킨다.- 화소의 명암값(위치변경, 본인회전 등) 영역을 바꾸는 것 - 좌표축, 사이즈를 바꿀 때, 어떻게 행렬을 사용하는가.-행렬(기하)연산 후 실수가 나 확실히 좌표를 매핑할 수 없기 때문에 아리야싱이라는 현상이 발발-동차좌표를 사용하는 이유:복합변환을 이용한 계산에 효율적-알리야싱:소스로 타깃을 찾기 위해 빈 공간이 발발(전방변환)=>픽셀누락, 계단현상-안티알리야싱:타겟으로 소스를 찾기 때문에 주변 값이 채워진다. (후방변환) => 픽셀빈 현상을 처리하는 방식 - 일반적인 안티 아리야싱은 인접한 픽셀의 값을 채우는 기능을 의의한다. 。 보간에 의한 안티 아리야싱-양선형 보간: 인접하는 픽셀의 선형값을 대입한다.-가장 근접(1)양 송현(3)씨 3차 보간(9)전의 계산을 하는 것이다.​ ​[컬러 모델 관련(2_2pdf)]​ 1.RGB모델·빨강·초록·파랑의 색이 섞인담니다울 가지고 색을 표현-취득 및 출력의 관점에서 싱후에의 표현이 쉽게 모니터 등 색 표현 디스플레이 장치에 주로 사용된다.- RGB의 색 밝기가 모두 하본인에 본인 외 본인이라 인지시간 등에는 좋지 않음.-3채널을 독립적으로 처리할 수 있다.R, G, B채널을 1개 봐도 빛의 세기만을 표기하게 된다.-24비트로 표현하게 된다.-RGBA(Alpha)는 32비트 값으로 표현 ​ 2.HSB모델(=HSI모델)


    >


    -색조(Hue), 색도(Saturation), 명도(Brightness)로 색을 표현-인간의 색체 지각능력을 표현-원하는 색의 범위를 정확히 알 수 있기 때문에 추상적인 개념(채도)이 있고 직감적으로 알기 어렵다-색조: 물체에서 반사되어 몸에서 전해지는 색-색도: 채도 역시 순도를 의미한다. 0%(그레이)~하나 00%(완전한 색)사이의 퍼센트로 측정-명도: 생상의 상대적 밝기는 어둡다. 0%(검정)~하나 00%(흰색)사토우쯔 퍼센트에서 측정 ​ 3.CMYK모델


    >


    -명도가 오전 아지는 혼합에서 인쇄에 자주 쓰이는-4원색:시안, 마젠타, 노란 색 검은 색-K(검정)는 CMY를 다 섞어서 포효은하는 것보다 별도로 쓰는 것이 유리하니까 사용하는 것 ​ 4.YCbCr모델


    >


    -색 모델이라기보다 용량을 줄이고 영상을 전송하는 기술-색차를 활용하여 색을 표홍(Y:휘도를 기준으로 색 차[ 푸른 부르는 sound의 정도를 전송)하나 6비트로 색을 표홍하고 있었으므로, 데이터를 하달/전송하는데 이점을 가진다. ( 다른 색 모델은 24비트)​ ​[케니 에지 단계(4_2pdf)]-입력 영상 f, 출력 영상 e하나. 입력영상 f에 a크기의 카우시안 스무딩을 적용하는 것입니다.2. 결과 영상에 소벨 연산자를 적용하고 에지의 강도와 에지의 방향 맵을 알아볼 것입니다-소벨 연산자 적용시의 외곽선이 남 sound3. 비채는 억제를 죠크용하에 얇은 두께의 에지 맵을 만든다.-이웃 두 사람의 화소보다 날 강도가 크지 않으면 억제된 것 4. 이력입니다 총 값을 적용하고 거짓 긍정을 제거합니다.[허프 변환, ransac의 기본 설명]1개. 허프 변환, RANSAC 같은 점, 차이점-허프 변환, RANSAC은 직선을 찾는데 사용될-허프:동일 한 input에서는 항상 동일한 결과-RANSAC:동일 한 input이고 매 수행에 결과가 다르다. ​ 2. 허프 변환-날 연결하는 과정 없이 선분을 검출-밀집된 곳을 찾-순서:grayscale>blur>canny edge>ROI>hough transform>result​ 3.RANSAC였다 라이어를 찾아 어떤 모델이 적합한 기법-난수를 발생해서였다 라이어 군중을 구하기 위해서입니다 중요성을 갖다[마스크 관련 계산 사건]1)영역기반 처리-좌측상단 픽셀부터 1픽셀씩 순서대로 수행된다.-처음에 오른쪽 방향으로 진행되어 1줄이 끝나고 좋지 않을 경우는 아래의 행으로 이동한다.-창이 영상과 겹침 한 위치에서 회선이 개시(마스크가 3X3살 때는(0,0)대신(하나, 하나)에서 시작)- 맑고 선명하게 하는 테두리 검출 작업 sound의 제거 등을 할 수 있다.(1)이미지를 흐리게 한다-입력 픽셀 값을 주위 픽셀 값과의 평균값으로 변환하는 다음과 같은 회선 마스크를 사용


    >


    2)영상 선명히 하다


    >


    ​[모폴로지 관련 계산 사고 ​ 것)의 수학적 모폴로지-컴퓨터 비전에서 패턴을 원하는 형태로 변환하는 방법 ​ 2)구조 요소


    >


    (일)팽창


    >


    -구조 요소는 원래 영상을 돌며 한칸이라도 1이 있는 경우에 1을 넣어 연산-외형을 유지하면서 외곽선이 확장된다.- 작은 픽셀에서도 확장해주는 역할 (OR 연산) - 외각 노이즈는 확대되고 내부 노이즈는 없어진다.​ ​(2)침식


    >


    -원래 영상이 다 1인 경우에만 1을 넣어 연산-형태를 유지하고, 외곽선을 깎아 준다.-외각 소음은 없어지고 내부 소음은 확대하고 있다. ​(3)열기


    >


    -팽창 후 침식 ​ ​(4) 닫습니다


    >


    -침식 후 팽창 ​ ​[haar object detector설명(6.pdf)]-얼굴 인식 시스템 ​ 1)비올라 존스 얼굴 검출(Viola2004)- 새로운 발상=>앙상블( 작은 특징을 추출하고 하봉잉로 조합함)-전통적인 접근은 복잡한 분류기를 사용하는 것에 대해서 정반대의 약한 분류기의 접근을 취할 것이다. (Viola2001)​ 2)비올라 존스 얼굴 검출 방법의 특징 ​(1)유사 하루 특징의 사용-4종류의 연산자: 검은 영역의 합계에서 하얀 영역 간의 관계를 제외한 심플한 연산-24*24영상에 너의 종류 연산자를 위치와 크기를 변형시키고 적용할 때 16만종의 다른 특징 추출이 가능하며 이들 중 분별력 좋은 특징만을 선택해서 사용하는 것이다.


    >


    (2)Integral Image-모든 영역을 확인해야 하기 때문에 속도의 개선책이 필요->적분 연산-적분 영상은 왼쪽 위 구석에서 현재 화소까지 합으로 정의-적분 영상을 사용하면, 블록화를 블록 크기에 관계 없이 세번의 덧셈으로 가능 ​(3)Adaboost(가중치 학습)​(4)직렬 분류기의 사용-분류기로 깊이가 moning은 단순한 결정 트리를 몇가지 연결 ​ ​[차로 인식 관련 step설명]-RGB영상>흑백 영상>이진화>소음 제거 필터링>에지(윤곽 선 Detector)>라인 인식-차선의 특징은 일직선이기 때문에 360도 방향으로 직선을 그리고 가장 많이 겹치는 부분을 찾아내고 있다.- 캐리어와 같은 경우 고품질은 맵 데이터를 통해 자율주행을 실현한다.카메라 각도에 따라 알고리즘을 수행하는 노하우가 다르다.


    댓글

Designed by Tistory.