Large Margin Softmax Loss for Speaker Verification

【INTERSPEECH 2019接收】

链接：https://arxiv.org/pdf/1904.03479.pdf

这篇文章在会议的speaker session中。本文主要讨论了说话人验证中的损失函数large margin softmax loss（结合了softmax和margins的losses）。

本文从x-vector中提取speaker embedding。

这篇文章在一个公式中统一了多种margin项：

其中N表示训练样本数目，C表示训练集中的说话人数目，s是尺度因子。m1, m2, m3是可以分开使用的margins，则角函数定义为：

并引入两种辅助损失：Ring Loss[1]来约束embedding模值；MHE[2]使weight尽可能在超球面中均匀分布，从而提升类间可分性。

在VoCeleb数据集上运行实验。训练集包括VoxCeleb1 dev part and VoxCeleb2，验证集为VoxCeleb1 test part。训练过程中，特征采用30维的MFCCs（经过谱均值归一化）。采用基于能量的VAD方法。

三种margins单独使用，分别得到losses为：angular softmax (ASoftmax), additive angular margin softmax (ArcSoftmax) and additive margin softmax loss (AMSoftmax)。见图1:

实验表明采用AMSoftmax的性能最佳。见表1，该研究在Kaldi recipe for VoxCeleb的基础上得到了EER 2%的显著性能提升：

深度学习为说话人技术带来了前所未有的机遇，而研究者们在不断拓展新算法的边界的同时，也在回顾传统方法仍然具备的价值。当然说话人技术目前也逐渐暴露出与人脸识别同样的易受攻击的问题。因此，ASVspoof这样的Challenge从2015年起就开始关注声纹反作弊问题。

[1] Ring loss，一种简单的深层网络特征归一化方法，用于增强诸如Softmax之类的标准损失函数。论文（Ring loss: Convex Feature Normalization for Face Recognition）被CVPR 2018接收。

[2] 最小化超球面能量准则（Minimum Hyperspherical Energy
criterion），具体见论文Learning towards Minimum Hyperspherical
Energy（NIPS 2018接收）。

Large Margin Softmax Loss for Speaker Verification的更多相关文章

基于Caffe的Large Margin Softmax Loss的实现（中）
小喵的唠叨话:前一篇博客,我们做完了L-Softmax的准备工作.而这一章,我们开始进行前馈的研究. 小喵博客: http://miaoerduo.com 博客原文: http://www.miao ...
基于Caffe的Large Margin Softmax Loss的实现（上）
小喵的唠叨话:在写完上一次的博客之后,已经过去了2个月的时间,小喵在此期间,做了大量的实验工作,最终在使用的DeepID2的方法之后,取得了很不错的结果.这次呢,主要讲述一个比较新的论文中的方法,L- ...
cosface: large margin cosine loss for deep face recognition
目录概主要内容 Wang H, Wang Y, Zhou Z, et al. CosFace: Large Margin Cosine Loss for Deep Face Recognition ...
Generalized end-to-end loss for speaker verification
论文题目:2018_说话人验证的广义端到端损失论文代码:https://google.github.io/speaker-id/publications/GE2E/ 地址:https://www.c ...
Large-Margin Softmax Loss for Convolutional Neural Networks
paper url: https://arxiv.org/pdf/1612.02295 year:2017 Introduction 交叉熵损失与softmax一起使用可以说是CNN中最常用的监督组件 ...
损失函数 hinge loss vs softmax loss
1. 损失函数损失函数(Loss function)是用来估量你模型的预测值 f(x) 与真实值 Y 的不一致程度,它是一个非负实值函数,通常用 L(Y,f(x)) 来表示. 损失函数越小,模型的鲁 ...
Derivative of Softmax Loss Function
Derivative of Softmax Loss Function A softmax classifier: \[ p_j = \frac{\exp{o_j}}{\sum_{k}\exp{o_k ...
卷积神经网络系列之softmax，softmax loss和cross entropy的讲解
我们知道卷积神经网络(CNN)在图像领域的应用已经非常广泛了,一般一个CNN网络主要包含卷积层,池化层(pooling),全连接层,损失层等.虽然现在已经开源了很多深度学习框架(比如MxNet,Caf ...
softmax，softmax loss和cross entropy的区别
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/u014380165/article/details/77284921 我们知道卷积神经网络(CNN ...

随机推荐

深挖计算机基础：Linux性能优化学习笔记
参考极客时间专栏<Linux性能优化实战>学习笔记一.CPU性能:13讲 Linux性能优化实战学习笔记:第二讲 Linux性能优化实战学习笔记:第三讲 Linux性能优化实战学习笔记: ...
MySQL实战45讲学习笔记：第三十八讲
一.本节内容我在上一篇文章末尾留给你的问题是:两个 group by 语句都用了 order by null,为什么使用内存临时表得到的语句结果里,0 这个值在最后一行:而使用磁盘临时表得到的结果里 ...
[[: not found，Ubuntu修改默认sh为bash
写好的shell sh执行脚本报错[[: not found,改shell多麻烦,索性直接把电脑默认的dash改成使用bash 1.查看目前使用 Ubuntu版本默认sh都是使用的dash 执行 ls ...
fiddler抓包-7-C端弱网测试
前言大家平时也会发现我们有时候在地铁.高铁.电梯等等某个时候网络信号比较差导致网络延迟较大,这时是否有友好提示呢?甚至有可能发生崩溃等等...所以我们是可以通过fiddler来对web.APP.PC客 ...
python中的三个读read(),readline()和readlines()
Python 将文本文件的内容读入可以操作的字符串变量非常容易. 文件对象提供了三个“读”方法: .read()..readline() 和 .readlines(). 每种方法可以接受一个变量以限制 ...
《深入理解Java虚拟机》并发(第12~13章)笔记
volatile关键字的作用所有变量的可见性--仅仅是修改后的值的可见性,不保证并发修改时新值和预期一致.即只保证读,不保证写. 禁止指令重排序--修饰的变量,读写不会指令重排.如变量isReady ...
Restful API接口规范
1. 域名应该尽量将API部署在专用域名之下. https://api.example.com 如果确定API很简单,不会有进一步扩展,可以考虑放在主域名下. https://example.org ...
中国爬虫违法违规案例汇总github项目介绍
中国爬虫违法违规案例汇总github项目介绍 GitHub - 本项目用来整理所有中国大陆爬虫开发者涉诉与违规相关的新闻.资料与法律法规.致力于帮助在中国大陆工作的爬虫行业从业者了解我国相关法律,避免 ...
微信小程序自定义头部导航栏和导航栏背景图片 navigationStyle
这两天因为要做一个带背景的小程序头,哭了,小程序导航栏有背景也就算了,还得让导航栏上的背景顺下来,心态小崩.现在可以单独设置一个页面的小程序头了,但是前提是要微信7.0以上的版本,考虑到兼容性问题 ...
Chrome Dev tools的几点小技巧
figure:last-child { margin-bottom: 0.5rem; } #write ol, #write ul { position: relative; } img { max- ...

Large Margin Softmax Loss for Speaker Verification

Large Margin Softmax Loss for Speaker Verification的更多相关文章

随机推荐

热门专题