[CV] Re-identification

IntroductionReID可以看作是Visual Search的一个specific task,也在工业界有着非常广泛的应用场景。本文主要记录一些ReID领域比较insightful的paper。按照惯例,介绍某个新领域之前,首先得需要了解该领域的benchmark datasets以及performance evaluation metric。在ReID领域,主要有CMC、mAP和rank1 Accuracy作为evaluation metric。 CMCThe CMC curv...

Read More

[CV] Classification

IntroductionVisual Classification是CV领域最最重要的fundamental task,没有之一,并且是其他task (例如RCNN-based detection)的基础。关于分类,现如今主流方法是设计更加精巧的网络结构(请参阅DL-Architecture),或直接NAS搜一个,或设计更有效的Loss Function辅助model learning(请参阅ML-Loss Function)。尽管已经发展很成熟,但在实际应用场景中,依然会碰到许多非常ch...

Read More

[CV] Image Quality Assessment

IntroductionImage Quality Assessment (IQA) 是计算机视觉领域一个非常重要的研究方向,并且在许多方向也有着非常好的落地场景(例如在滴滴出行,就需要设计算法来实现对网约车司机上传的证件照进行图像质量分析,若存在大规模的反光(reflection)、模糊(blur)等,就需要予以拒绝);此外,IQA也常常被用于Face Anti-Spoofing,因为有时候print/replay attack的图片/视频 和活体相比,其图像质量往往会比较差(例如颜色失...

Read More

[DL] Data Augmentation

Introduction众所周知,Deep Learning现如今的繁荣,和大数据、GPU和深度学习算法都是离不开关系的。Deep Learning模型参数众多,需要海量的数据进行拟合,否则很容易overfitting到training set上。而现实情况下,我们不一定能很容易地获取大量高质量标注样本,因此,Data Augmentation则起到了非常大的作用了。这便是本文所要讲述的主角。 Mixup Paper: mixup: Beyond Empirical Risk Minimi...

Read More

[DL] Architecture

IntroductionDeep Learning有三宝:Network Architecture,Loss Function and Optimization。对于大多数人而言,Optimization门槛还是很高的(需要非常深厚的数学功底),所以绝大多数的Paper偏向还是设计更好的Network Architecture或者堆更加精巧的Loss Function。Ian Goodfellow大佬也曾说过:现如今Deep Learning的繁荣,网络结构探究的贡献度远远高于优化算法的贡...

Read More

[CV] Segmentation

Introductionsegmentation也是Computer Vision领域一个非常重要的研究方向,和Classification,Detection一起是high-level vision里最重要的方向。我不是主要做Segmentation的,但由于Segmentation的广泛的应用方向(例如自动驾驶的场景感知)和研究热点,本文旨在梳理近些年CV顶会上一些非常有代表性的work。 @LucasX注:本文长期更新。 Fully Convolutional Networks ...

Read More

[CV] Detection

IntroductionDetection是Computer Vision领域一个非常火热的研究方向。并且在工业界也有着十分广泛的应用(例如人脸检测、无人驾驶的行人/车辆检测等等)。本文质旨在梳理RCNN–SPPNet–Fast RCNN–Faster RCNN–FCN–Grid RCNN,YOLO v1/2/3, SSD等Object Detection这些非常经典的工作。 @LucasX注:本文长期更新。 RCNN (Region-based CNN) Paper: Rich fe...

Read More

[CV] Facial Landmarks and Pose Estimation

IntroductionFacial Landmarks Localization,也称为Face Alignment,是人脸一个非常热门的方向,它的作用就是准确定位人脸关键点。Pose Estimation近年来也得到了越来越多的关注,常常被用于动作分析、以及抖音尬舞机等场景。因Facial Landmarks Localization和Pose Estimation有着比较大的相似性,所以本文将两者放在一起介绍。关于Pose Estimation,目前学术界开源的算法库有如下几种: ...

Read More

[CV] Retrieval

IntroductionRetrieval (图搜) 也是CV领域一个应用非常广泛的方向,在安防场景下,我们常常会根据摄像头抓怕的嫌疑人头像去人脸数据库里进行搜索;在电商平台,用户也会拍摄图片进行上传,我们的算法应返回对应的SKU,此为“拍照购”。Retrieval的难点主要在于如何训练表示能力良好的embedding模型,以及如何高效地进行feature similarity searching,尤其是库里SKU种类达到亿级别的时候,为了保证良好的用户体验,如何能快速而准确地给用户返回匹...

Read More

[CV] Counting

IntroductionCounting是近年来CV领域一个受到关注越来越多的方向,它主要的应用场景就是密集场景下的人流估计、车辆估计等。近年来非常火热的新零售、智慧安防都有Counting的应用场景。Counting大体上可以分为两种方案,一种是基于detection的方式:即数bbox;另一种是直接回归density map的方式:即将counting问题转化为一个regression问题。基于detection的方法在目标非常密集的场景下就不适合了,所以在这种场景下density m...

Read More


Powered by Hexo and Hexo-theme-hiker

Copyright © 2018 - 2023 LucasX All Rights Reserved.

UV : | PV :