IntroductionRetrieval (图搜) 也是CV领域一个应用非常广泛的方向,在安防场景下,我们常常会根据摄像头抓怕的嫌疑人头像去人脸数据库里进行搜索;在电商平台,用户也会拍摄图片进行上传,我们的算法应返回对应的SKU,此为“拍照购”。Retrieval的难点主要在于如何训练表示能力良好的embedding模型,以及如何高效地进行feature similarity searching,尤其是库里SKU种类达到亿级别的时候,为了保证良好的用户体验,如何能快速而准确地给用户返回匹...
[CV] Counting
IntroductionCounting是近年来CV领域一个受到关注越来越多的方向,它主要的应用场景就是密集场景下的人流估计、车辆估计等。近年来非常火热的新零售、智慧安防都有Counting的应用场景。Counting大体上可以分为两种方案,一种是基于detection的方式:即数bbox;另一种是直接回归density map的方式:即将counting问题转化为一个regression问题。基于detection的方法在目标非常密集的场景下就不适合了,所以在这种场景下density m...
[ML] Semi-supervised & Unsupervised Learning
IntroductionSemi-supervised Learning和Unsupervised Learning是ML research领域一个非常活跃、也非常值得探索的方向,为什么这么说呢?现如今应用最广泛的ML算法叫作Deep Learning,而熟悉Deep Learning的同学都知道,这类算法实际上是非常“蠢”的,即要用大量标记样本去train一个DNN,来学习某种mapping function $\mathcal{f}(x)=y$,而人类在认识某样物品时,可是不需要用这么...
[DL] Regularization
IntroductionRegularization是Machine Learning中一个非常重要的概念,是对抗Overfitting最有用的利器。DNN由于参数众多,很容易overfitting,若直接选用small model,则会导致model特征学习、分类能力不足。因此现实中往往是 使用较大的模型 + 正则化 来解决相应问题。因此本文简要介绍一下Deep Learning中常用的正则化方法。 $$\tilde{J}(\theta;X,y)=J(\theta;X,y)+\alpha...
[CV] Video Classification
Introduction随着抖音、快手等短视频平台的火热,视频分析也成了计算机视觉领域的研究热点。视频分类是视频内容分析的基础,以抖音为例,算法后台需要对用户实时拍摄上传的视频进行分类打上tag,然后再借助推荐算法分发到用户端。本文旨在记录一下video classification领域一些具有代表性的paper。 Deep CNN for Video Classification Paper: Large-scale video classification with convoluti...
[CV] Medical Image Analysis
Introduction医疗AI是现如今工业界和学术界都非常火热的方向,也是AI落地非常有价值的方向。因毕业论文需要涉及Medical Image Analysis相关的方向,所以本文旨在收集并梳理Deep Learning在Medical Image Analysis领域一些具有代表性的Paper以及Report。 @LucasXU注:本文长期更新。 CNN for Medical Image Analysis. Full Training or Fine Tuning? Paper...
[DL] Siamese Neural Network
IntroductionSiamese Network也是一个比较有意思的网络结构,并且在许多领域都有了非常成功的应用,本文主要记录这些具体的application中一些代表性的paper。 @LucasXU注:对网络结构感兴趣的可以阅读我的另外一篇文章Architecture。 Siamese Network Paper: Signature verification using a “siamese” time delay neural network 这算是Siamese Ne...
[CV] Face Recognition
Introduction人脸识别(Face Recognition)是工业界和学术界都非常火热的一个方向,并且已经催生出许多成功的应用落地场景,比如刷脸支付、安检等。而Face Recognition最大的突破也是由Deep Learning Architecture + 一系列精巧的Loss Function带来的。本文旨在对Face Recognition领域里的一些经典Paper进行梳理,详情请参阅Reference部分的Paper原文。 @LucasXU注:本文长期更新。 Fa...
[ML] Model Selection and Performance Metric
Introduction Overfitting的本质:过拟合(overfitting)是指在模型参数拟合过程中的问题,由于训练数据包含“抽样误差”,训练时,复杂的模型将抽样误差也考虑在内,将抽样误差也进行了很好的拟合。 当$p>n$时,无法使用Backward Selection,但Forward Selection可以。 $Precision=\frac{TP}{TP+FP}$$Recall=\frac{TP}{TP+FN}$$F_1=\frac{2PR}{P+R}$ ...