Introduction最近刷知乎,有看到这样一个问题“如何看待2021年秋招算法岗灰飞烟灭?”,虽然标题夸张,但确实反映了当前算法岗位内卷严重的真实情况。前面写了很多篇paper的阅读笔记,这篇就站在产业界的角度,来谈一谈AI在实际产业界的落地、商业模式以及对人才的要求吧。 What’s the Gap Between Academia and Industry?Emphasis在学术界,追求的普遍都是模型的创新与方法在某个数据集上的精度,因此常见的衡量标准就是Paper产出量以及Kag...
[CV] Re-identification
IntroductionReID可以看作是Visual Search的一个specific task,也在工业界有着非常广泛的应用场景。本文主要记录一些ReID领域比较insightful的paper。按照惯例,介绍某个新领域之前,首先得需要了解该领域的benchmark datasets以及performance evaluation metric。在ReID领域,主要有CMC、mAP和rank1 Accuracy作为evaluation metric。 CMCThe CMC curv...
[CV] Classification
IntroductionVisual Classification是CV领域最最重要的fundamental task,没有之一,并且是其他task (例如RCNN-based detection)的基础。关于分类,现如今主流方法是设计更加精巧的网络结构(请参阅DL-Architecture),或直接NAS搜一个,或设计更有效的Loss Function辅助model learning(请参阅ML-Loss Function)。尽管已经发展很成熟,但在实际应用场景中,依然会碰到许多非常ch...
[CV] Image Quality Assessment
IntroductionImage Quality Assessment (IQA) 是计算机视觉领域一个非常重要的研究方向,并且在许多方向也有着非常好的落地场景(例如在滴滴出行,就需要设计算法来实现对网约车司机上传的证件照进行图像质量分析,若存在大规模的反光(reflection)、模糊(blur)等,就需要予以拒绝);此外,IQA也常常被用于Face Anti-Spoofing,因为有时候print/replay attack的图片/视频 和活体相比,其图像质量往往会比较差(例如颜色失...
[DL] Data Augmentation
Introduction众所周知,Deep Learning现如今的繁荣,和大数据、GPU和深度学习算法都是离不开关系的。Deep Learning模型参数众多,需要海量的数据进行拟合,否则很容易overfitting到training set上。而现实情况下,我们不一定能很容易地获取大量高质量标注样本,因此,Data Augmentation则起到了非常大的作用了。这便是本文所要讲述的主角。 Mixup Paper: mixup: Beyond Empirical Risk Minimi...
[DL] Architecture
IntroductionDeep Learning有三宝:Network Architecture,Loss Function and Optimization。对于大多数人而言,Optimization门槛还是很高的(需要非常深厚的数学功底),所以绝大多数的Paper偏向还是设计更好的Network Architecture或者堆更加精巧的Loss Function。Ian Goodfellow大佬也曾说过:现如今Deep Learning的繁荣,网络结构探究的贡献度远远高于优化算法的贡...
[CV] Segmentation
Introductionsegmentation也是Computer Vision领域一个非常重要的研究方向,和Classification,Detection一起是high-level vision里最重要的方向。我不是主要做Segmentation的,但由于Segmentation的广泛的应用方向(例如自动驾驶的场景感知)和研究热点,本文旨在梳理近些年CV顶会上一些非常有代表性的work。 @LucasXU注:本文长期更新。 Fully Convolutional Networks...
[CV] Detection
IntroductionDetection是Computer Vision领域一个非常火热的研究方向。并且在工业界也有着十分广泛的应用(例如人脸检测、无人驾驶的行人/车辆检测等等)。本文质旨在梳理RCNN–SPPNet–Fast RCNN–Faster RCNN–FCN–Grid RCNN,YOLO v1/2/3, SSD等Object Detection这些非常经典的工作。 @LucasXU注:本文长期更新。 RCNN (Region-based CNN) Paper: Rich f...
[CV] Facial Landmarks and Pose Estimation
IntroductionFacial Landmarks Localization,也称为Face Alignment,是人脸一个非常热门的方向,它的作用就是准确定位人脸关键点。Pose Estimation近年来也得到了越来越多的关注,常常被用于动作分析、以及抖音尬舞机等场景。因Facial Landmarks Localization和Pose Estimation有着比较大的相似性,所以本文将两者放在一起介绍。关于Pose Estimation,目前学术界开源的算法库有如下几种: ...