本文内容均翻译自这篇博文:(该博主的相关文章都比较好,感兴趣的可以自行学习) Voice Activity Detection(VAD) Tutorial 语音端点检测一般用于鉴别音频信号当中的语音出现(speech presence)和语音消失(speech absence).这里将提供一个简单的VAD方法,当检测到语音时输出为1,否则,输出为0. 语音是否出现或者在背景噪声上是否平坦决定了VAD方法的检测是否稳定(The job of a VAD is to reliably determi…
这是学习时的笔记,包含相关资料链接,有的当时没有细看,记录下来在需要的时候回顾. 有些较混乱的部分,后续会再更新. 欢迎感兴趣的小伙伴一起讨论,跪求大神指点~ VAD(ffnn神经网络)-Alex tags:voice Documentation(README)中说现在的NN VAD方法比GMM方法效果好的多. Material Paper [ ] [神经网络在语音信号检测中的研究](http://xueshu.baidu.com/s?wd=paperuri%3A%28b54de14b7f2f1…
版权声明:本文为博主原创文章,转载或者引用请务必注明作者和出处,尊重原创,谢谢合作 https://blog.csdn.net/u012328159/article/details/51462942 异常检测(anomaly detection)   关于异常检测(anomaly detection)本文主要介绍一下几个方面: 异常检测定义及应用领域 常见的异常检测算法 高斯分布(正态分布) 异常检测算法 评估异常检测算法 异常检测VS监督学习 如何设计选择features 多元高斯分布 多元高…
Tensorflow在更新1.2版本之后多了很多新功能,其中放出了很多用tf框架写的深度网络结构(看这里),大大降低了吾等调包侠的开发难度,无论是fine-tuning还是该网络结构都方便了不少.这里讲的的是物体检测(object detection)API,这个库的说明文档很详细,可以的话直接看原文即可. 这个物体检测API提供了5种网络结构的预训练的weights,全部是用COCO数据集进行训练,可以在这里下载:分别是SSD+mobilenet, SSD+inception_v2, R-FC…
多尺度目标检测 Multiscale Object Detection 我们在输入图像的每个像素上生成多个锚框.这些定位框用于对输入图像的不同区域进行采样.但是,如果锚定框是以图像的每个像素为中心生成的,很快就会有太多的锚框供我们计算.例如,我们假设输入图像的高度和宽度分别为561和728像素.如果以每个像素为中心生成五个不同形状的锚框,则超过两百万个锚框(561×728×5)需要在图像上进行预测和标记. 减少锚箱数量并不困难.一种简单的方法是对输入图像中的一小部分像素进行均匀采样,并生成以采样…
源地址:http://blog.sina.com.cn/s/blog_79b67dfe0102uzra.html 最近需要用到人脸检测,于是找了篇引用广泛的论文实现了一下:Robust Real-Time Face Detection.实现的过程主要有三个步骤:人脸数据准备,算法实现,算法调试.     人脸数据集的准备:网上有很多免费的和付费的.比如这里有个网页介绍了一些常用的人脸数据库.我这里只是人脸检测(不是人脸识别),只要有人脸就可以了,所以我下载了几个数据集,然后把它们混在一起用(后面…
原文:https://paul.kinlan.me/face-detection/ 在 Google 开发者峰会中,谷歌成员 Miguel Casas-Sanchez 跟我说:"嘿 Paul,我给你看一个 demo".看完之后我必须对它进行研究. Shape Detection API(图形检测API)目前在 WICG 中尚处于孵化和试验阶段,这对于平台来说是一个很好的渐进过程. Shape Detection API 有意思的地方在于,它是基于用户设备的一些基础硬件功能上创建标准接口…
Scalable Object Detection using Deep Neural Networks 作者: Dumitru Erhan, Christian Szegedy, Alexander Toshev, and Dragomir Anguelov 引用: Erhan, Dumitru, et al. "Scalable object detection using deep neural networks." Proceedings of the IEEE Confere…
一.论文 综述类的文章 [1]P.Dollar, C. Wojek,B. Schiele, et al. Pedestrian detection: an evaluation of the state of the art [J].IEEE Transactions on PatternAnalysis andMachine Intelligence, 2012, 34(4): 743-761. [2]M. Enzweiler, and D.Gavrila. Monocular pedestr…
模型和方法: 在深度学习求解目标检测问题之前的主流 detection 方法是,DPM(Deformable parts models), 度量与评价: mAP:mean Average Precision 数据集: voc2007 the PASCAL Visual Object Classes Challenge 2007…