5.2自然语言处理

觉得有用的话,欢迎一起讨论相互学习~Follow Me

2.9 Sentiment classification 情感分类

情感分类任务简单来说是看一段文本，然后分辨这个人是否喜欢或不喜欢他们正在谈论的这段文本。
情感分类 一个最大的挑战是可能标记的训练集没有那么多，但是有了词嵌入，即使只有中等大小标记的训练集也能构建一个不错的情感分类器。

问题引入

通过训练一个从x到y的映射得到一个情感分类器，只需要收集在社交媒体上顾客对你的评价，你就可以判断其对餐厅的情感是正面的还是负面的。

简单的情感分类模型

示例 The dessert is excellent

首先在字典中找出句中所有单词，并使用 one-hot向量 表示，乘以 词嵌入矩阵E ，得到单词的 嵌入向量e
1. 如果在很大的语料库中训练 词嵌入矩阵E 比如壹佰亿的单词，这样就能获得很多知识甚至从有些不常见的词中获取，然后应用到你的问题上，即使你的标记数据集里没有这些词。
得到的 嵌入向量e 是一个具有300维特征的向量，将句子中所有单词的 嵌入向量e 进行加和或求平均，此时会得到一个300维度的特征向量，把这个特征向量送进softmax分类器，然后输出$\hat{y}$
1. 其中softmax 分类器能够输出5个分类结果，从一星到五星。
2. 而求和和平均的操作则避免模型考虑原有句子的长短。无论原先句子都多长，在求和或平均操作后都只有300维度，即只和原有的特征定义相关。

缺点这个算法的缺点是没有考虑语序的问题，对于 Completely lacking in good taste,good service, and good ambience(完全没有好的味道，好的服务，好的环境) 但是这个语句中使用了很多次 good ,如果仅仅是把所有单词的 嵌入向量e 相加，你最后的特征向量会有很多 good 的特征。

基于RNN的情感分类模型

Completely lacking in good taste,good service, and good ambience(完全没有好的味道，好的服务，好的环境)

首先将每一个单词使用one-hot向量进行表示
将每个单词的one-hot向量乘以 词嵌入矩阵E 得到每个单词的 词嵌入向量e
将其送入RNN中，在RNN的最后一个时间步计算一个特征表示，用来预测 $\hat{y}$

优点这样就能考虑句子中单词的顺序，对于情感分类的效果就会更好了，结合句中的短语对整个句子的情感有新的导向。

[DeeplearningAI笔记]序列模型2.9情感分类的更多相关文章

[DeeplearningAI笔记]序列模型1.5-1.6不同类型的循环神经网络/语言模型与序列生成
5.1循环序列模型觉得有用的话,欢迎一起讨论相互学习~Follow Me 1.5不同类型的循环神经网络上节中介绍的是具有相同长度输入序列和输出序列的循环神经网络,但是对于很多应用\(T_{x}和 ...
[DeeplearningAI笔记]序列模型1.1-1.2序列模型及其数学符号定义
5.1循环序列模型觉得有用的话,欢迎一起讨论相互学习~Follow Me 1.1什么是序列模型在进行语音识别时,给定了一个输入音频片段X,并要求输出片段对应的文字记录Y,这个例子中的输入和输出都输 ...
[DeeplearningAI笔记]序列模型3.9-3.10语音辨识/CTC损失函数/触发字检测
5.3序列模型与注意力机制觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.9语音辨识 Speech recognition 问题描述对于音频片段(audio clip)x ,y生成文本 ...
[DeeplearningAI笔记]序列模型3.7-3.8注意力模型
5.3序列模型与注意力机制觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.7注意力模型直观理解Attention model intuition 长序列问题 The problem of ...
[DeeplearningAI笔记]序列模型3.6Bleu得分/机器翻译得分指标
5.3序列模型与注意力机制觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.6Bleu得分在机器翻译中往往对应有多种翻译,而且同样好,此时怎样评估一个机器翻译系统是一个难题. 常见的解决 ...
[DeeplearningAI笔记]序列模型3.3集束搜索
5.3序列模型与注意力机制觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.3 集束搜索Beam Search 对于机器翻译来说,给定输入的句子,会返回一个随机的英语翻译结果,但是你想要一 ...
[DeeplearningAI笔记]序列模型3.2有条件的语言模型与贪心搜索的不可行性
5.3序列模型与注意力机制觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.2选择最可能的句子 Picking the most likely sentence condition lan ...
[DeeplearningAI笔记]序列模型3.1基本的 Seq2Seq /image to Seq
5.3序列模型与注意力机制觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.1基础模型 [1] Sutskever I, Vinyals O, Le Q V. Sequence to Se ...
[DeeplearningAI笔记]序列模型1.10-1.12LSTM/BRNN/DeepRNN
5.1循环序列模型觉得有用的话,欢迎一起讨论相互学习~Follow Me 1.10长短期记忆网络(Long short term memory)LSTM Hochreiter S, Schmidhu ...

随机推荐

第二章：Internet地址结构
引言本章主要介绍了: 如何为Internet中的设备分配IP地址. 有助于理由可扩展性的地址结构分配方式. 特殊用途的地址. 表示IP地址 IPv4地址长32位,采用点分四组或点分十进制来表示. ...
Access连接数据源配置(新手必知)
今天要连接Access时发现win7 64位旗舰版控制面板中管理工具下的数据源(ODBC)配置竟然只有SQLServer的驱动,其他的都没有了,这可不好玩!上网百度了一番,有人也遇过这样的问题,我在此 ...
lintcode-402-连续子数组求和
[402-连续子数组求和(http://www.lintcode.com/zh-cn/problem/continuous-subarray-sum/) 给定一个整数数组,请找出一个连续子数组,使得该 ...
xpath的学习
xpath的作用就是两个字“定位”,运用各种方法进行快速准确的定位,推荐两个非常有用的的firefox工具:firebug和xpath checker 定位 1.依靠自己属性,文本定位 //td[ ...
[历史百科]抗战时期兵团简介 From 百度知道
中央军委1948年11月1日和1949年1月15日两次关于统一全军组织和部队番号的训令,我军先后进行了整编.西北野战军改称第一野战军,司令员兼政治委员彭德怀,第一副司令员张宗逊,第二副司令员赵寿山,参 ...
Html5新增元素中Canvas 与内联SVG的比较！
SVG与Canvas的区别与比较如下: svg:使用xml描述2D图形,canvas使用javascript描述2D图形. Canvas 是逐像素进行渲染的,在 canvas 中,一旦图形被绘制完成, ...
this.$http & vue
this.$http & vue https://github.com/pagekit/vue-resource Alias axios to Vue.prototype.$http http ...
【bzoj1430】小猴打架 Prufer序列
题目描述给出 $n$ 个点,每次选择任意一条边,问这样 $n-1$ 次后得到一棵树的方案数是多少. 输入一个整数N. 输出一行,方案数mod 9999991. 样例输入 4 样例输出 96 题解 ...
再谈获取网站图标Icon
上一篇文章讨论了一下获取网站图标方法,是通过从根目录直接获取和html解析结合的方式来获取的,并给出了相应的代码示例.这一篇来讨论一个更现成的方法,这个方法是从360导航的页面发现的,在导航页面中点击 ...
java 调试
作为一名java开发程序员,或者有时候需要利用工具调试的时候,但是却感觉不会使用,其实只要记住四个键即可. 一般java开发工具使用的都是Eclipse或者MyEclipse,下面都有这几个键F5(进 ...

[DeeplearningAI笔记]序列模型2.9情感分类