文章目录

(1) rateof emoticons;
(2) rate of tokens which have no less than 3 tandem duplicated letters or symbols;
(3) rate of capital letters;
(4) rate of capitalized words;
(5) total number of text posts of each user.

2.2 提取基于字典的语言特征

作者通过Linguistic Inquiry and Word Count (LIWC)工具，分析出64个基于字典的语言特征

3. 基于深度学习的文本建模

3.1 基于无监督学习的词嵌入

基于词袋模型，使用word2vec 训练我们的文本，然后得到每个单词的词向量，对于未知的word全部随机给一个[-0.25， +0.25]的正态分布的参数

3.2 基于监督学习的深度语义特征提取

这是文章的重点部分，作者定义了一个叫做AttRCNN-CNNs的模型来提取语义特征，因为它是一个AttRCNN， CNNs 的分层结构，

可以从这张图看到AttRCNN-CNNs模型的层次:

3.2.1 AttRCNN进行句子向量化

由RCNN作为启发，作者构想出一种AttRCNN用于把句子变成句子向量。

结构图如下：

具体过程分为5个步骤，下面将详细解释

S1. Word Embedding

通过训练好的词嵌入矩阵，把句子里的每个word，变成词向量。

S2. 基于GRU的神经网络得到word上下文特征

GRU是LSTM网络的一种效果很好的变体，它较LSTM网络的结构更加简单，而且效果也很好，因此也是当前非常流形的一种网络。GRU既然是LSTM的变体，因此也是可以解决RNN网络中的长依赖问题。

输入词向量到不同的两个GRU分别得到单词的上文特征，和下文特征，两个GRU结构相同，只是扫描方向不同，下面已向前扫描的GRU作为解释。

S2-1. 提取上文特征

使用前向的GRU，在顶层使用batch normalization训练。对于每个word得到一个50维的注释向量

下图是如何从

S2-2. 使用ReLU作为激活函数

使用ReLU函数作为激活函数

线性整流函数（Rectified Linear Unit, ReLU），又称修正线性单元，是一种人工神经网络中常用的激活函数（activation function），通常指代以斜坡函数及其变种为代表的非线性函数。

S2-3. 加入dropout层

为防止过拟合，还加上了dropout层

S3. 组合上文特征，下文特征，本身特征

通过上面的两个GRU神经网络, 我们分别得到每个单词的上文或下文特征，我们将其组合

50(上文) + E(word本身) + 50(下文)

S4. 全连接层

通过全连接层把100+E维的特征变成100维

S5. 词向量组变句向量

通过max-pooling层，我们把词向量变成句向量，完成此模块的任务。

3.2.2 CNNs进行文档向量化

使用CNNs来把得到的句子向量变成文档向量，

作者使用的是CNN-based Inception architecture，一种基于CNN的结构来实现。

（注意不是CNN）

CNNs的具体结构如下

3.2.3 训练模型

模型采用批量梯度下降，使用均方误差作为目标函数，最大迭代30轮.

4.预测

经过上面的步骤我们得到了一个119维的特征向量，其中包括5个特殊方面的语言特征， 64个基于字典的语言特征， 50个文档语义特征，我们将其放到GBR里，得到分数，当然这个回归算法在后面的实验中会尝试很多。

三、实验结果

待分析~~

Deep learning-based personality recognition from text posts of online social networks 阅读笔记的更多相关文章

个性探测综述阅读笔记——Recent trends in deep learning based personality detection
目录 abstract 1. introduction 1.1 个性衡量方法 1.2 应用前景 1.3 伦理道德 2. Related works 3. Baseline methods 3.1 文本 ...
吴恩达《深度学习》-第一门课 (Neural Networks and Deep Learning)-第三周：浅层神经网络(Shallow neural networks) -课程笔记
第三周:浅层神经网络(Shallow neural networks) 3.1 神经网络概述(Neural Network Overview) 使用符号$ ^{[
论文笔记: Deep Learning based Recommender System: A Survey and New Perspectives
(聊两句,突然记起来以前一个学长说的看论文要能够把论文的亮点挖掘出来,合理的进行概括23333) 传统的推荐系统方法获取的user-item关系并不能获取其中非线性以及非平凡的信息,获取非线性以及非平 ...
论文翻译：2021_Towards model compression for deep learning based speech enhancement
论文地址:面向基于深度学习的语音增强模型压缩论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域深耕多年引用格式:Tan K, Wang D L. Towards model c ...
【RS】Deep Learning based Recommender System: A Survey and New Perspectives - 基于深度学习的推荐系统：调查与新视角
[论文标题]Deep Learning based Recommender System: A Survey and New Perspectives ( ACM Computing Surveys ...
Predicting effects of noncoding variants with deep learning–based sequence model | 基于深度学习的序列模型预测非编码区变异的影响
Predicting effects of noncoding variants with deep learning–based sequence model PDF Interpreting no ...
Paper Reading——LEMNA:Explaining Deep Learning based Security Applications
Motivation: The lack of transparency of the deep learning models creates key barriers to establishi ...
【Deep Learning】Hinton. Reducing the Dimensionality of Data with Neural Networks Reading Note
2006年,机器学习泰斗.多伦多大学计算机系教授Geoffery Hinton在Science发表文章,提出基于深度信念网络(Deep Belief Networks, DBN)可使用非监督的逐层贪心 ...
What are some good books/papers for learning deep learning?
What's the most effective way to get started with deep learning? 29 Answers Yoshua Bengio, ...

随机推荐

Ubuntu14.04 安装VMware tools
Ubuntu14.04 安装VMware tools 方法一: 1. 在VMware 11(个人的测试环境为vm 11版本)下安装Ubuntu镜像:ubuntu-14.04.1-desktop-amd ...
Nginx之伪404（ root与alias ）
目录一.现象二.root与alias的区别三.建议四.写在最后一.现象人类善于伪装,机器某些时候也善于伪装:Nginx请求看到404,第一反应就是文件不存在:但我们去检查的时候,它就正 ...
微信小程序开发（一）基础知识学习
1.特点: ①无DOM对象(虚拟DOM),一切基于组件化(复用.解耦) ②四个重要文件: *.js.*.wxml --> html..wxss --> css.*.json ③无需下载 ...
java 成员变量和局部变量的区别
将对象的存储在数组中会报错 public static void main(String[] args) { ArrayList<Goods> arrayList = new ArrayL ...
django-rest-framework-源码解析003-视图家族和路由(APIView/GenericAPIView/mixins/generics/viewsets)
视图家族视图家族在rest_framework源码位置和学习曲线为: rest_framework.views: 基本视图(APIView) rest_framework.generics: 工具视 ...
单例模式—Java实现
饿汉法顾名思义,饿汉法就是在第一次引用该类的时候就创建对象实例,而不管实际是否需要创建.代码如下: 1 2 3 4 5 6 7 public class Singleton { priv ...
R语言基本绘图-plot参数：标题，坐标轴和颜色
标题 plot(c(1:2,2:4),main = "这是主标题",sub = "这是副标题",xlab = "这是x轴", ylab = ...
Shell变量的作用域：Shell全局变量、环境变量和局部变量
Shell 变量的作用域(Scope),就是 Shell 变量的有效范围(可以使用的范围). 在不同的作用域中,同名的变量不会相互干涉,就好像 A 班有个叫小明的同学,B 班也有个叫小明的同学,虽然他 ...
python学习笔记1 -- 函数式编程之高阶函数 map 和reduce
我用我自己,就是高阶函数,直接表现就是函数可以作为另一个函数的参数,也可以作为返回值首先一个知识点是函数的表现形式,印象中的是def fw(参数)这种方式定义一个函数 python有很多的内置函 ...
友好城市dp
// // Created by Arc on 2020/4/27. //对了,这篇题解的代码是小白自己写的．有啥错误还请各位大佬多多包涵． /* * 某国有一条大河(一条大河~~~~,波浪宽~~~~ ...

Deep learning-based personality recognition from text posts of online social networks 阅读笔记