CS224n学习笔记1——深度自然语言处理
一、什么是自然语言处理呢?
自然语言处理是计算机科学家提出的名字,本质上与计算机语言学是同义的,它跨越了计算机学、语言学以及人工智能学科。
自然语言处理是人工智能的一个分支,在计算机研究领域中,也有其他的分支,例如计算机视觉、机器人技术、知识表达和推理等。
目标:让计算机能够理解人类语言来完成有意义的任务,例买东西或者是更高级的目标等。
下图是人对语言层次的传统描述:
从输入开始,而输入部分通常是语音输入,接着大脑就会进行语音和音义分析。也有部分是文字输入,而文字输入基本上和语言学没多大关系,OCR对文本进行文字识别操作。
自然语言处理应用的领域:
1.拼写检查或者是手机上的自动填写功能属于初级的语义理解任务
2.在线搜索时,联想到的同义词,例如搜索某家公司名字就会出现一大堆的推荐,也是属于语言处理方面。
3.让计算机能够阅读文字,提取信息,从而充分理解文本,或者也可以处理更高难度的任务,例如判定文档的阅读难度或者是目标受众群体等。
4.机器翻译
5.构建口语对话系统
二、什么是深度学习?
深度学习是机器学习的一个分支,总的来说,就是让计算机自动学习,而不是人工教授,手工代码告诉它想要做什么,类似于传统的编程。
深度学习不同于以往年代的机器学习,例如80年代、90年代或者是00年代的机器学习。
核心区别:对于大多数的机器学习而言,都是围绕着决策树、逻辑回归、朴素贝叶斯、支持向量机等概念。
本质区别:由人类来审视一个特定的问题,找出解决该类问题的关键要素,然后涉及出与该问题相关的重要特征要素。通常使用python代码来识别这些特征。
例如下图,显示了一些实体识别系统的特征:、
机器学习和深度学习的区别?
上图中可以发现,机器学习在实际应用中,大约90%的工作是人类研究如何描述数据,总结出重要特征,只有约10%的工作是大脑运行这一个数值优化算法。
深度学习是表征学习的一个分支, 表征学习的理念就是只向电脑提供来自外界的原始信号,无论是视觉还是语言信号,然后电脑自动得出好的中间表征,来很好地去完成任务。从某种意义上来说,就是自己定义特征,和以往人类定义特征类似的方式。
深度学习的真正含义是:得到了多层的习得表征,可以打败其他的学习方法。
深度学习主要的两个突破:自然语言处理和计算机视觉。
三、Deep NLP=Deep Learning + NLP
一方面深度学习应用到各种不同层次的语言学上,例如词汇学、句法学、语义学。应用于各种不同类型的工具和算法的自然语言处理,例如为单词标注词性、识别人物姓名和结构名字、找出句子的句法结构。此外还被应用在其他的语言应用程序,结合各部分功能,例如机器翻译、情感分析的聊天助手等。
深度学习模式运用同样一套工具和技术,非常统一的方法来处理各个领域的问题。
参考资源:斯坦福大学 自然语言处理课程
CS224n学习笔记1——深度自然语言处理的更多相关文章
- 学习笔记之深度学习(Deep Learning)
深度学习 - 维基百科,自由的百科全书 https://zh.wikipedia.org/wiki/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0 深度学习(deep lea ...
- OpenCV 学习笔记 04 深度估计与分割——GrabCut算法与分水岭算法
1 使用普通摄像头进行深度估计 1.1 深度估计原理 这里会用到几何学中的极几何(Epipolar Geometry),它属于立体视觉(stereo vision)几何学,立体视觉是计算机视觉的一个分 ...
- OpenCV 学习笔记 04 深度估计与分割
本章节主要是使用深度摄像头的数据来识别前景区和背景区,这样就可以分别对前景和背景做不同的处理. 1 创建模块
- CS224n学习笔记(一)
How do we have usable meaning in a computer? Represents the words as discrete symbols, (离散型变量) Use t ...
- CS224n学习笔记(三)
语言模型 对于一个文本中出现的单词 \(w_i\) 的概率,他更多的依靠的是前 \(n\) 个单词,而不是这句话中前面所有的单词. \[ P\left(w_{1}, \ldots, w_{m}\rig ...
- Mysql学习笔记-InnoDB深度解析
前言 我们在上一篇博客聊了Mysql的整体架构分布,连接层.核心层.存储引擎层和文件系统层,其中存储引擎层作为Mysql Server中最重要的一部分,为我们sql交互提供了数据基础支持.存储引擎和文 ...
- 框架学习笔记:深度解析StrangeIoC内部运行机制
StrangeIoC的设计和RobotLegs一致,所以我的解析会对照RobotLegs来看. 整个框架使用的是MVCS的模式,关于MVCS模式大家可以点这里进行查看,这里就不谈了,既然Strange ...
- CS224n学习笔记(二)
Global Vectors for Word Representation (GloVe) GloVe 模型包含一个训练在单词-单词的共同出现次数上的加权的最小二乘模型. 什么是Co-occurre ...
- [ NLP ] CS224N 学习笔记
Lecture1 One-Hot 定义:用N位状态寄存器编码N个状态,每个状态都有独立的寄存器位,且这些寄存器位中只有一位有效,说白了就是只能有一个状态.即保证每个样本中的每个特征只有1位处于状态1, ...
随机推荐
- Python3的动态加载模块简单实例
import os import sys import time import myconfig b = ['123'] a = os.path.abspath(myconfig.__file__) ...
- R中执行if else报错:unexpected 'else' in "else"
注意if else的结构写法,有以下三种,除此之外,会不识别else. 结构 1 : if() xx else yy # 一行:结构 2: if() {xx} else {y ...
- 【题解】洛谷P1169 [ZJOI2007] 棋盘制作(坐标DP+悬线法)
次元传送门:洛谷P1169 思路 浙江省选果然不一般 用到一个从来没有听过的算法 悬线法: 所谓悬线法 就是用一条线(长度任意)在矩阵中判断这条线能到达的最左边和最右边及这条线的长度 即可得到这个矩阵 ...
- iOS 输入框限制输入字节数
iOS中限制输入框文字长度的方法有好多,百度一下,最常用的是这种: - (BOOL)textField:(UITextField *)textField shouldChangeCharactersI ...
- Eclipse开发工具常用快捷键的使用技巧
Eclipse作为软件开发的常用工具,被很多的人所欢迎,尤其是丰富的快捷键,可以极大的提高编码的效率,下面将常用的快捷键做了整理,便于大家学习和使用. Eclipse常用快捷键 1代码提示 Alt ...
- JavaEE笔记(二)
查询load()和get()的区别 # 以下查询都是根据id查询 // Load和Get都会在第一次查询的是创建一个一级缓存查询语句 // 下一次查询的时候从缓存中查询是否有缓存的语句 // 如果有只 ...
- 【HNOI2014】江南乐
题面 题解 知识引入 - \(SG\)函数 任何一个公平组合游戏都可以通过把每个局面看成一个顶点,对每个局面和它的子局面连一条有向边来抽象成这个"有向图游戏".下面我们就在有向无环 ...
- Keepalived高可用集群
一.服务介绍 keepalive起初是专为LVS设计的,专门用来监控LVS集群系统红各个服务节点的状态,后来又加入了VRRP的功能,因此不了配合LVS服务外,也可以作为其他服务(nginx,hapro ...
- 新买的orico蓝牙usb连接器使用方法与驱动
因为买的型号是 BTA-403 ,所以需要下载该型号驱动 安装好后,可能会出现找不到蓝牙设备问题,所以需要重启机器,并且手动将pc蓝牙连接到手机蓝牙,然后手机蓝牙再连接蓝牙耳机,此时蓝牙耳机会显示连接 ...
- nginx 配置 ssl 双向证书
CA 根证书制作 # 创建 CA 私钥 openssl genrsa -out ca.key 2048 #制作 CA 根证书(公钥) openssl req -new -x509 -days 3650 ...