【笔记】机器学习 - 李宏毅 - 13

当参数一样多的时候，神经网络变得更高比变宽更有效果。为什么会这样呢？

其实和软件行业的模块化思想是一致的。

比如，如果直接对这四种分类进行训练，长发的男孩数据较少，那么这一类训练得到的classifier不是很好。
但如果分成长发or短发，男孩or女孩，这两种基分类器，那么数据就是足够的，可以得到很好的结果。这样的话，其实用比较少的数据就可以得到很好地分类结果。

模组化这个事情机器是可以自动学到的。

图像应用

语音应用

第一步要做的事情就是把acoustic feature转成state，再把state转成phoneme，再转成文字。

传统的HMM-GMM方法，给你一个feature，你就可以说每一个acoustic feature从每一个state产生出来的几率。
但是每一个state都要用Gaussian Mixture Model来描述，参数太多了。

有一些state，他们会共用同一个model distribution，这件事叫做Tied-state。是否共用，需要借助知识。

HMM-GMM的方式，所有的state是independently的，没有一个effective的方法来model人声。
不同的phoneme之间其实是有关系的，如果说每个phoneme都搞一个model，这件事是没有效率的。

DNN的方法，input是一个acoustic feature，output是acoustic feature属于每个state的几率。
最关键的一点是所有的state都共用同一个DNN，并没有为每一个state产生一个DNN。

虽然DNN的参数很多，但并不是因为参数多所以比GMM好，因为GMM的每一个phoneme都有一个model，参数加起来可能比DNN还要多。

两种方法比较：
DNN做的事情在比较低层的时候，它并不是马上去侦测这个发音是属于哪个state。
它的做事是它先观察(detector)说，当你听到这个发音的时候，人是用什么方式在发这个声音的。(模组化)

普遍性原理：
过去的理论说，任何的continuous function，都可以用一层来完成。但这种模型效率并不高。

逻辑电路和逻辑闸的例子，后边做的是奇偶校验。

还有个形象的例子就是剪窗花，右图的features transformation和它是一个道理。

二维坐标的例子。

End to End Learning
深度学习的一个好处就是，我们可以做End-to-end learning。
就是说只要给model input和output，不用告诉它每层function要咋样分工，让它自己去学中间每一个function。

对于语音识别问题，DNN的方法得到的结果，和传统方法中最好的MFCC可以持平。

图像识别的问题也是一样。

还有，对于复杂问题，一层是远远不够的。

对于语音识别来说，看起来每个人说的很不一样，但当到第八层时，不同的人说的同样的句子，它自动的被line在一起了。

对于手写数字识别，到了第三层时，就可以很好地分开了。

【笔记】机器学习 - 李宏毅 - 13 - Why Deep的更多相关文章

Deep Learning论文笔记之（八）Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
深度学习课程笔记（十八）Deep Reinforcement Learning - Part 1 (17/11/27) Lectured by Yun-Nung Chen @ NTU CSIE
深度学习课程笔记(十八)Deep Reinforcement Learning - Part 1 (17/11/27) Lectured by Yun-Nung Chen @ NTU CSIE 201 ...
Andrew Ng机器学习课程13
Andrew Ng机器学习课程13 声明:引用请注明出处http://blog.csdn.net/lg1259156776/ 引言:主要从一般的角度介绍EM算法及其思想,并推导了EM算法的收敛性.最后 ...
《深入Java虚拟机学习笔记》- 第13章逻辑运算
<深入Java虚拟机学习笔记>- 第13章浮点运算
【论文笔记】Malware Detection with Deep Neural Network Using Process Behavior
[论文笔记]Malware Detection with Deep Neural Network Using Process Behavior 论文基本信息会议: IEEE(2016 IEEE 40 ...
《从零开始学Swift》学习笔记（Day 13）——数据类型之整型和浮点型
Swift 2.0学习笔记(Day 13)——数据类型之整型和浮点型原创文章,欢迎转载.转载请注明:关东升的博客 Swift提供8.16.32.64位形式的有符号及无符号整数.这些整数类型遵循 ...
【笔记】机器学习 - 李宏毅 - 7 - Deep Learning
深度学习发展历史: 感知机和逻辑回归很像,只是没有$sigmoid$激活函数. 深度学习训练的三个步骤: Step1:神经网络(Neural network) Step2:模型评估(Goodnes ...
机器学习笔记P1(李宏毅2019)
该博客将介绍机器学习课程by李宏毅的前两个章节:概述和回归. 视屏链接1-Introduction 视屏链接2-Regression 该课程将要介绍的内容如下所示: 从最左上角开始看: Regress ...
R语言学习笔记-机器学习1-3章
在折腾完爬虫还有一些感兴趣的内容后,我最近在看用R语言进行简单机器学习的知识,主要参考了<机器学习-实用案例解析>这本书. 这本书是目前市面少有的,纯粹以R语言为基础讲解的机器学习知识,书 ...

随机推荐

Java使用自定义类加载器实现热部署
热部署: 热部署就是在不重启应用的情况下,当类的定义即字节码文件修改后,能够替换该Class创建的对象.一般情况下,类的加载都是由系统自带的类加载器完成,且对于同一个全限定名的java类,只能被加载一 ...
webpack chunkFilename 非入口文件的命名规则 [转]
官网的文档只理解了filename是主入口的文件名,chunkFilename是非主入口的文件名 filename应该比较好理解,就是对应于entry里面生成出来的文件名.比如: { entry: { ...
linux下使用gdb对php源码调试
title: linux下使用gdb对php源码调试 date: 2018-02-11 17:59:08 tags: --- linux下使用gdb进行php调试调试了一些php的漏洞,记录一下大概 ...
qt creator源码全方面分析(2-10)
目录 Creating Plugins Creating Plugins Qt Creator的核心是一个插件加载程序,加载并运行一组插件,实际上是这些插件提供了您从Qt Creator IDE中了解 ...
windows运行shell脚本
1. 环境变量的理解:快速找到程序并执行,配置在path的目录下有系统环境和用户环境,配置在此的只要目录路径就好,在cmd输入名字就会去此路径找匹配程序执行 2. 将git安装目录下的....\Git ...
一键安装MySQL5.6.43脚本
[root@lamp ~]# cat /server/scripts/mysql-5.6.43_install.sh #!/bin/bash #卸载系统自带的Mysql /bin/rpm -e $(/ ...
C#调用Windows API(示例：显示任务管理器里的程序名称)
作为初学者来说,在C#中使用API确是一件令人头疼的问题. 在使用API之前你必须知道如何在C#中使用结构.类型转换.安全/不安全代码,可控/不可控代码等许多知识. 在.Net Framework S ...
1. c++实现最最最原始人的数字时钟
网课c++第一次作业,学到了iomanip库文件里的setw(),setfill()等函数,自己完成作业时搜着学到了Windows.h库文件里的sleep(),system("cls&quo ...
toj 3616 Add number (没想到啊~~)
Add number 时间限制(普通/Java):1000MS/3000MS 运行内存限制:65536KByte总提交: 60 测试通过: 21 描述 Employees of Baidu like ...
IntelliJ 如何找到项目中 Deprecated 的方法
在一个项目中,如果我们标记了某些元素为 Deprecated 的话,如何让我们能够快速找到? 简单来说,你可以对项目进行 Code Inspection. 选择 Analyze > Inspec ...

【笔记】机器学习 - 李宏毅 - 13 - Why Deep

【笔记】机器学习 - 李宏毅 - 13 - Why Deep的更多相关文章

随机推荐

热门专题