吴恩达讲了干货满满的一节全新AI课,全程手写板书充满诚意非常干货
吴恩达讲了干货满满的一节全新AI课,全程手写板书充满诚意非常干货
摘要:
目前,AI技术做出的经济贡献几乎都来自监督学习,也就是学习从A到B,从输入到输出的映射。
现在,监督学习、迁移学习、非监督学习、强化学习这四类算法所创造的经济效益是递减的。
机器学习依靠结构化数据,比非结构化数据创造了更多的经济效益。
AI的范围,比监督学习广泛得多。我认为人们平时所说的AI,其实包含了好几类工具:比如机器学习、图模型、规划算法、知识表示(知识图谱)。
人们的关注点集中在机器学习和深度学习,很大程度上是因为其他工具的发展速度很平稳。
如果我现在建立一个AI团队,做AI项目,很多时候应该用图模型,有时应该用知识图谱,但是最大的机遇还是在于机器学习,这才是几年来发展最快、出现突破的领域。
很多工程师想要进入AI领域,很多人会去上在线课程,但是有一个学习途径被严重忽视了:读论文,重现其中的研究。
当你读了足够多的论文,实现了足够多的算法,它们都会内化成你的知识和想法。
要培养机器学习工程师,我推荐的流程是:上(deeplearning.ai的)机器学习课程来打基础,然后读论文并复现其中的结果,另外,还要通过参加人工智能的会议来巩固自己的基础。
互联网公司是如何定义的呢?不是看你有没有网站,而是看做不做A/B测试、能不能快速迭代、是否由工程师和产品经理来做决策。
这才是互联网公司的精髓。
现在我们经常听人说“AI公司”。在AI时代,我们同样要知道:
传统科技公司 + 机器学习/神经网络 ≠ AI公司
公司里有几个人在用神经网络,并不能让你们成为一家AI公司,要有更深层的变化。
20年前,我并不知道A/B测试对互联网公司来说有多重要。现在,我在想AI公司的核心是什么。
我认为,AI公司倾向于策略性地获取数据。我曾经用过这样一种做法:在一个地区发布产品,为了在另一个地区发布产品而获取数据,这个产品又是为了在下一个地区发布产品来获取数据用的,如此循环。而所有产品加起来,都是为了获取数据驱动一个更大的目标。
像Google和百度这样的大型AI公司,都有着非常复杂的策略,为几年后做好了准备。
第二点是比较战术性的,你可能现在就可以开始施行:AI公司通常有统一的数据仓库。
很多公司有很多数据仓库,很分散,如果工程师想把这些数据放在一起来做点什么,可能需要和50个不同的人来沟通。
所以我认为建立一个统一的数据仓库,所有的数据都存储在一起是一种很好的策略。
另外,普遍的自动化和新的职位描述也是AI公司的重要特征。
比如说在移动互联网时代,产品经理在设计交互App的时候可能会画个线框图:
然后工程师去实现它,整个流程很容易理清楚。
但是假设在AI时代,我们要做一个聊天机器人,这时候如果产品经理画个线框图说:这是头像,这是聊天气泡,并不能解决问题。
聊天气泡长什么样不重要,我需要知道的是,这个聊天机器人要说什么话。线框图对聊天机器人项目来说没什么用。
如果一个产品经理画了个无人车的线框图,说“我们要做个这个”,更是没什么用。
在AI公司里,产品经理在和工程师沟通的时候,需要学会运用数据,要求精确的反馈。
-------------------------------
在O’reilly举办的AI Conference上,吴恩达做了个25分钟的演讲,主题是“AI is the new electricity”
吴恩达老师这节课,主要讲了这四部分内容:
AI能做什么?各种算法有多大商业价值?
做AI产品要注意什么?
怎样成为真正的AI公司?
给AI领导者的建议
吴恩达的老师的开场白:AI像当年的电力一样,正开始改变所有行业。
在线观看的视频(英文版):https://v.qq.com/x/page/t0552uynhdx.html
要理解AI,就要先进入我们的第一部分:
AI能做什么?
目前,AI技术做出的经济贡献几乎都来自监督学习,也就是学习从A到B,从输入到输出的映射。
比如说,输入一张照片,让机器学会判断这张照片是不是你,输出0或1。
现在最赚钱的机器学习应用,应该说是在线广告。在这个例子中,输入是广告和用户信息,输出是用户会不会点击这个广告(还是0或1)。
监督学习还可以应用在消费金融领域,输入贷款申请信息,输出用户是否会还款。
过去几年里,机器学习经历了迅速的发展,越来越擅长学习这类A到B的映射,创造了大规模的经济效益。
同时,AI的进步也体现在监督学习的输出不再限于0或1的数字。
比如说语音识别的任务,也是一种端到端的学习,输入音频,输出文本。只要有足够的数据,语音识别就能达到很好的效果。
这类算法为语音搜索、亚马逊Alexa、苹果Siri、百度DuerOS等等提供了基础。
还有输入英语输出法语的机器翻译,输入文本输出音频的TTS(Text to Speech)等等,都是监督学习的应用。
监督学习的缺点是它需要大量的标注数据,这影响了它的普及。
经常有人问我,为什么神经网络已经存在了这么多年,AI却近年来才开始快速发展?
很多人可能见过我画这张图:
横轴是数据量,纵轴是算法的性能。
随着数据量的增加,传统机器学习算法的性能并没有明显提升,而神经网络的性能,会有比较明显的提升,神经网络越大,性能的提升就越明显。
为了达到最佳的性能,你需要两样东西:一是大量的数据,二是大型的神经网络。
还有一个问题,有很多人问我:机器学习中最大的趋势是什么?算法如何创造价值?
现在来看,创造最多价值的还是监督学习。
如果你问我监督学习之后是什么,我认为迁移学习现在也开始创造不少经济效益。可能因为这个概念不够性感,所以人们谈论得不多。
比如说你的算法从一个像ImageNet那样的大数据集学到了图像识别,然后用迁移学习,用到医学影像诊断上。
而非监督学习,我认为是非常好的长期研究项目。它也创造了一些经济价值,特别是在自然语言处理上。
强化学习也很有意思,我研究了很多年,现在也还在这方面做一些微小的工作。但是我认为,强化学习的舆论热度和经济效益有点不成比例。
强化学习对数据的饥渴程度甚至比监督学习更严重,要为强化学习算法获取到足够的数据非常难。
在打游戏这个领域,强化学习表现很好,这是因为在电子游戏中,算法可以重复玩无限次,获取无限的数据。
在机器人领域,我们也可以建立一个模拟器,相当于能让强化学习agent在其中模拟无人车、人形机器人,重复无限次“游戏”。
除了游戏和机器人领域之外,要把强化学习应用到商业和实践中还有很长的路要走。
现在,监督学习、迁移学习、非监督学习、强化学习这四类算法所创造的经济效益是递减的。
当然,这只是目前的情况。计算机学科不断有新突破,每隔几年就变个天。这四个领域中的任何一个都可能发生突破,几年内这个顺序就可能要重排。
我注意到的另一件事情是,机器学习依靠结构化数据,比非结构化数据创造了更多的经济效益。
举个结构化数据的例子,比如说你的数据库记录了用户的交易情况,谁什么时候买了什么东西,谁什么时间给谁发了信息,这就是结构化数据。
而像图像、音频、自然语言等等,就是非结构化数据。
虽然非结构化数据听起来更吸引人,舆论热度更高,但结构化数据的价值在于它通常专属于你的公司,比如说只有你的打车公司才有用户什么时候叫车、等了多长时间这样一个数据集。
所以,不要低估结构化数据结合深度学习所能创造的经济价值。
在前面谈到的几类学习算法中,单是监督学习就已经为公司、创业者创造了大量的经济价值和机会。
做AI产品要注意什么?
有一个很有意思的趋势,是AI的崛起正改变着公司间竞争的基础。
公司的壁垒不再是算法,而是数据。
当我建立一家新公司,会特地设计一个循环:
先为算法收集足够的数据,这样就能推出产品,然后通过这个产品来获取用户,用户会提供更多的数据……
有了这个循环之后,对手就很难追赶你。
这方面有一个很明显的例子:搜索公司。搜索公司有着大量的数据,显示如果用户搜了这个词,就会倾向于点哪个链接。
我很清楚该如何构建搜索算法,但是如果没有大型搜索公司那样的数据集,简直难以想象一个小团队如何构建一个同样优秀的搜索引擎。这些数据资产就是最好的壁垒。
工程师们还需要清楚这一点:
AI的范围,比监督学习广泛得多。我认为人们平时所说的AI,其实包含了好几类工具:比如机器学习、图模型、规划算法、知识表示(知识图谱)。
人们的关注点集中在机器学习和深度学习,很大程度上是因为其他工具的发展速度很平稳。
如果我现在建立一个AI团队,做AI项目,很多时候应该用图模型,有时应该用知识图谱,但是最大的机遇还是在于机器学习,这才是几年来发展最快、出现突破的领域。
接下来我要和大家分享一下我看问题的框架。
计算机,或者说算法是怎样知道该做什么的呢?它有两个知识来源,一是数据,二是人工(human engineering)。
要解决不同的问题,该用的方法也不同。
比如说在线广告,我们有那么多的数据,不需要太多的人工,深度学习算法就能学得很好。
但是在医疗领域,数据量就很少,可能只有几百个样例,这时就需要大量的人工,比如说用图模型来引入人类知识。
也有一些领域,我们有一定数量的数据,但同时也需要人工来做特征工程。
当然,还要谈一谈工程师如何学习。
很多工程师想要进入AI领域,很多人会去上在线课程,但是有一个学习途径被严重忽视了:读论文,重现其中的研究。
当你读了足够多的论文,实现了足够多的算法,它们都会内化成你的知识和想法。
要培养机器学习工程师,我推荐的流程是:上(deeplearning.ai的)机器学习课程来打基础,然后读论文并复现其中的结果,另外,还要通过参加人工智能的会议来巩固自己的基础。
怎样成为真正的AI公司?
我接下来要分享的这个观点,可能是我今天所讲的最重要的一件事。
从大约20年、25年前开始,我们开始看见互联网时代崛起,互联网成为一个重要的东西。
我从那个时代学到了一件重要的事:
商场 + 网站 ≠ 互联网公司
我认识一家大型零售公司的CIO,有一次CEO对他说:我们在网上卖东西,亚马逊也在网上卖东西,我们是一样的。
不是的。
互联网公司是如何定义的呢?不是看你有没有网站,而是看做不做A/B测试、能不能快速迭代、是否由工程师和产品经理来做决策。
这才是互联网公司的精髓。
现在我们经常听人说“AI公司”。在AI时代,我们同样要知道:
传统科技公司 + 机器学习/神经网络 ≠ AI公司
公司里有几个人在用神经网络,并不能让你们成为一家AI公司,要有更深层的变化。
20年前,我并不知道A/B测试对互联网公司来说有多重要。现在,我在想AI公司的核心是什么。
我认为,AI公司倾向于策略性地获取数据。我曾经用过这样一种做法:在一个地区发布产品,为了在另一个地区发布产品而获取数据,这个产品又是为了在下一个地区发布产品来获取数据用的,如此循环。而所有产品加起来,都是为了获取数据驱动一个更大的目标。
像Google和百度这样的大型AI公司,都有着非常复杂的策略,为几年后做好了准备。
第二点是比较战术性的,你可能现在就可以开始施行:AI公司通常有统一的数据仓库。
很多公司有很多数据仓库,很分散,如果工程师想把这些数据放在一起来做点什么,可能需要和50个不同的人来沟通。
所以我认为建立一个统一的数据仓库,所有的数据都存储在一起是一种很好的策略。
另外,普遍的自动化和新的职位描述也是AI公司的重要特征。
比如说在移动互联网时代,产品经理在设计交互App的时候可能会画个线框图
然后工程师去实现它,整个流程很容易理清楚。
但是假设在AI时代,我们要做一个聊天机器人,这时候如果产品经理画个线框图说:这是头像,这是聊天气泡,并不能解决问题。
聊天气泡长什么样不重要,我需要知道的是,这个聊天机器人要说什么话。线框图对聊天机器人项目来说没什么用。
如果一个产品经理画了个无人车的线框图,说“我们要做个这个”,更是没什么用。
在AI公司里,产品经理在和工程师沟通的时候,需要学会运用数据,要求精确的反馈。
吴恩达讲了干货满满的一节全新AI课,全程手写板书充满诚意非常干货的更多相关文章
- 吴恩达《深度学习》-课后测验-第三门课 结构化机器学习项目(Structuring Machine Learning Projects)-Week1 Bird recognition in the city of Peacetopia (case study)( 和平之城中的鸟类识别(案例研究))
Week1 Bird recognition in the city of Peacetopia (case study)( 和平之城中的鸟类识别(案例研究)) 1.Problem Statement ...
- 吴恩达《深度学习》-课后测验-第一门课 (Neural Networks and Deep Learning)-Week 3 - Shallow Neural Networks(第三周测验 - 浅层神 经网络)
Week 3 Quiz - Shallow Neural Networks(第三周测验 - 浅层神经网络) \1. Which of the following are true? (Check al ...
- 吴恩达《深度学习》-课后测验-第一门课 (Neural Networks and Deep Learning)-Week 2 - Neural Network Basics(第二周测验 - 神经网络基础)
Week 2 Quiz - Neural Network Basics(第二周测验 - 神经网络基础) 1. What does a neuron compute?(神经元节点计算什么?) [ ] A ...
- 吴恩达《深度学习》-课后测验-第一门课 (Neural Networks and Deep Learning)-Week 4 - Key concepts on Deep Neural Networks(第四周 测验 – 深层神经网络)
Week 4 Quiz - Key concepts on Deep Neural Networks(第四周 测验 – 深层神经网络) \1. What is the "cache" ...
- 吴恩达《深度学习》-课后测验-第二门课 (Improving Deep Neural Networks:Hyperparameter tuning, Regularization and Optimization)-Week 1 - Practical aspects of deep learning(第一周测验 - 深度学习的实践)
Week 1 Quiz - Practical aspects of deep learning(第一周测验 - 深度学习的实践) \1. If you have 10,000,000 example ...
- [C0] 人工智能大师访谈 by 吴恩达
人工智能大师访谈 by 吴恩达 吴恩达采访 Geoffery Hinton Geoffery Hinton主要观点:要阅读文献,但不要读太多,绝对不要停止编程. Geoffrey Hinton:谢谢你 ...
- 吴恩达《机器学习》课程笔记——第六章:Matlab/Octave教程
上一篇 ※※※※※※※※ [回到目录] ※※※※※※※※ 下一篇 这一章的内容比较简单,主要是MATLAB的一些基础教程,如果之前没有学过matlab建议直接找一本相关书籍,边做边学,matl ...
- 【吴恩达课后编程作业】第二周作业 - Logistic回归-识别猫的图片
1.问题描述 有209张图片作为训练集,50张图片作为测试集,图片中有的是猫的图片,有的不是.每张图片的像素大小为64*64 吴恩达并没有把原始的图片提供给我们 而是把这两个图片集转换成两个.h5文件 ...
- nips 2016 吴恩达
一年一度的 NIPS 又来了.今年举办地是笔者最爱的欧洲城市巴塞罗那.阳光沙滩配学术,确实很爽.这次的会议的第一天开场的大部分时间安排给了 tutorial.其中人数爆满的依旧是吴恩达(AndrewN ...
随机推荐
- 使用SQL Server 的CDC功能实现数据变更捕获
USE t; GO --开启某个数据库的CDC功能 exec sys.sp_cdc_enable_db GO --is_cdc_enabled栏位为1代表开启CDC功能了 SELECT is_cdc_ ...
- open():打开文件
1.open():使用指定的模式和编码打开文件,返回文件读写对象 2.使用说明: (1)使用格式:open(filename [, mode [, bufsize]])(2)打开一个文件,返回一个fi ...
- 【SVD、特征值分解、PCA关系】
一.SVD 1.含义: 把矩阵分解为缩放矩阵+旋转矩阵+特征向量矩阵. A矩阵的作用是将一个向量从V这组正交基向量的空间旋转到U这组正交基向量的空间,并对每个方向进行了一定的缩放,缩放因子就是各 ...
- 敏捷开发— —Scrum 学习笔记
敏捷开发模式是一种从1990年代开始逐渐引起广泛关注的一些新型软件开发方法,是一种应对快速变化的需求的一种软件开发能力.它们的具体名称.理念.过程.术语都不尽相同,相对于"非敏捷" ...
- JAVA基础——集合——ArrayList
ArrayList集合 ArrayList的一些方法(JDK1.8): 将指定的元素附加到列表的末尾,true:添加成功,false:添加失败: public boolean add(E e) ...
- easyui——validType属性值
- Mongodb 基础 数据导入导出和用户管理
数据导出 导出命令使用方式 mongoexport---->csv/json使用 参数: -d 库名 -c 表名 -f field1,field2....列名 -q 查询条件 -o 导出文件名 ...
- Python 全栈开发五 迭代器 生成器 装饰器
一.迭代器 迭代协议:对象必须提供一个next方法,执行该方法后会返回迭代的下一项或者抛出Stopiteration异常,终止迭代.切只能往前,不能倒退. 可迭代对象:遵循迭代写一点对象就是可迭代对象 ...
- Ext create动态加载分析
主要涉及到Ext.js Inventory.js ClassManager.js Class.js Loader.js Boot.js 在ClasManager.js的Ext.create中 Ext. ...
- 超全PHP学习资源整理:入门到进阶系列
PHP是少数几门在语言层面饱受诟病,但在实际开发和应用上却又让人无法撒手的语言之一.就好比路边摊小吃,一遍骂人家不卫生,一遍却又说:真香.所谓接地气,不外如此,大道理不说,PHP光是轮子多.市场占有率 ...