본문 바로가기

분류 전체보기

(43)
Face Recognition 본문은 Andrew Ng 교수님의 Coursera Deep Learning Specialization 과정의 일부임을 밝힌다. What is Face Recognition ? Face verification 과 Face recognition 을 비교해보자 1) Verification : Input ( Image, Name/ID ) --> Output ( Claimed Person [ 이미 등록된 인물인지 여부 ]) 2) Recognition : Assume that --> Has a database of k persons Input ( Image ) --> Output ( Input Image 의 인물이 등록된 k persons 과 일치하는지 대조 ) : recognized or not recognize..
U-Net (semantic segmentation) Image Segmentation with a U-Net-Like architecture keras 홈페이지에 제공하는 내용으로 소스코드 및 구현에 대하여 정리하였습니다. https://keras.io/examples/vision/oxford_pets_image_segmentation/ Segmentation 은 기본적으로 저번 포스팅과 동일하게 픽셀 단위로 클래스를 분류하는 기법을 배경으로 한다. 정확하게는 (Instance Segmentation) 아래와 같이 대략적으로 볼 수 있다. (글로 표현이 아직힘든...) Andrew Ng 교수님의 강의에서도 예로 설명이 있는데, 자율주행에서 사용되는 경향을 제시한다. 자율 주행에서 쓰이는 이유는 도로를 배경으로 인식해주는 것 (주행가능한 장애물이 없는 도로..
Semantic Segmentation 가장 먼저, 실용적인 측면부터 보며 살펴보기로 한다. Practical Semantic Segmentation Google Portrait mode ( 사진을 찍으면 배경을 블러처리하고 인물을 대상으로는 선명하게 그대로 출력해주는 효과 ) Segmentation : Predict the label of every pixel ex) SegNet, DeepLab 등 사진의 모든 픽셀을 미리 지정된 개수의 class 로 분류하는 것. Classification / Object Detection 과는 전혀 다른 과정이다. Classification 의 경우 만약 도로를 대상으로 선택된 이미지라면 동일한 class 인 차량을 차량으로 분류하겠지만, Segmentation 의 경우 도로의 차량이 하나의 class ..
Object Detection (YOLO v3) 현재 듣고 있는 Coursera 의 Deep Learning specialization 과정에서 Convolutional Neural Networks 과정 중 Week3 Object Detection 부분을 다뤄볼 예정이다. 어설픈 이해지만, 차후 다시 볼 일을 대비하며... 배워야 할 것 들 Object Localization, Object Detection, Landmark Detection Implementation Non-max-Suppression Intersection over union Components used for object detection (landmark, anchor, bounding box, grid ~ ) 1. Localization 객체 탐지를 위해서 가장 먼저 필요한 ..
DenseNet https://openaccess.thecvf.com/content_cvpr_2017/papers/Huang_Densely_Connected_Convolutional_CVPR_2017_paper.pdf 리뷰할 논문의 제목은 Densely Connected Convolutional Networks 이며 위의 논문입니다. 해당 리뷰를 작성하기 위해 나의 이해와 더불어 감사하게도 큰 도움을 준 곳. https://towardsdatascience.com/paper-review-densenet-densely-connected-convolutional-networks-acf9065dfefb Key Points: 1. Alleviates vanishing gradient 2. Stronger feature prop..
ResNet 논문제목 : Deep Residual Learning for Image Recognition 컴퓨터 비전, 패턴 인식의 주요 컨퍼런스 CVPR2016 에서 크게 주목을 받았던 방법으로 2015년 ILSVRC 에서 우승을 차지하고 현재도 CNN 3대장이라고 불리는... 방법이다. https://openaccess.thecvf.com/content_cvpr_2016/papers/He_Deep_Residual_Learning_CVPR_2016_paper.pdf 크게 주목할 점이 두 가지 정도로 요약해보면 1. 이전의 방법보다 성능적으로 훨씬 좋아졌음 2. 제시한 Idea 가 매우 쉬웠다는 점 ** Key point ** Network 를 깊게 하는 것이 꼭 성능을 좋게해줄 수 있을까? 이 관점에서 시작되었다고..
Inception Network (GoogleNet) 14년도의 ILSVRC 에서 지난번 포스팅에서 다루었던 VGG19 이상의 성능으로 우승을 차지한 모델이다. 계속해서 발전하여 Inception v4 까지 나왔지만, 이 포스팅에선 2014년으로 돌아가도록 하겠다. (Inception v1) 원 논문은 아래의 링크에 있다. https://arxiv.org/abs/1409.4842 기초적인 부분) 1 x 1 convolution layer 사용하는 이유 : width 와 height 를 그대로 유지하되 depth(#channel) 는 줄이기 위함이다. Inception Network 를 보기 전 이 Network 에서 사용되는 두 블럭을 한번 확인해야한다. (a) Inception Module (Inception Block) naive version : In..
VGGNet VGGNet 은 2014년 ILSVRC 대회에서 2등에 올랐던 네트워크 이다. 원 논문은 Very Deep Convolutional Networks For Large-Scale Image Recognition https://arxiv.org/pdf/1409.1556.pdf 이전의 AlexNet 과의 차이점이라고 하면 filter 의 크기를 (3x3, 5x5, 7x7)에서 선택되어 사용되었던 것과 달리 3x3 filter 를 지속적으로 사용하는 것을 확인할 수 있는데. 가장 먼저 파악해야할 점이 이 3 x 3 filter 만으로 사용한 것에 대한 정의이다. 1. Receptive - field Receptive field 라는 말부터 이해해보자. 아래의 그림을 확인해보면 Layer(Conv) 가 거듭될수록..