深度学习与NLP简单应用

在深度学习中，文本分类的主要原型：Text  label，坐边是输入端“X”，右边是输出端“Y”。行业baseline：用BoW（bag of words）表示sentences（如何将文本表达成一个数字的形式），然后用LR或者SVM做回归。
中英文做自然语言处理主要区别，中文需要分词（启发式Heuristic, 机器学习、统计方法HMM、CRF））
深度学习：从端到端的方式，以不掺和人为的计算，从X到Y暴力粗暴的学习。通过很隐层（包含大量线性和非线性的计算）试图模拟数据的内在结构。
新手推荐用kreas，它下面有两个底层，一个是theano，一个是tensorflow，可以自由转换backend也就是说可以让它跑在theano底下，也可以跑在tensorflow底下，它把其他几个深度学习框架综合起来成一种。
关于自然语言相关的库，gensim https://radimrehurek.com/gensim/
一、 Auto-Encoder自编码器
应用场景：无标签的时候需要使用；就算有标签的情况下一本书的内涵太多太大，你希望降维，使得其在后面模型处理中能够接受；
自编码是自己学习自己，通过encoder压缩成一个中继量，目的是希望这个中继量可以通过下一把完全反向的encoder，返回成原本的Input。这里面没有用到任何的label，而是照片2本身和照片2本身，中间加了两个对立漏斗形的神经网络。最后我们可以取中间那个更小的中继量代替原来的图片（因为它可以decoder回原来的图片）。
实现了不用人为提取特征向量。
只能达到局部最优点，无法达到全局最优点。
距离的计算，文本上常用列文斯坦距离，从A变B需要多少步。或者把整个文本表达为矩阵向量，词向量的距离可以用cosine距离等。

二、 CNN4Text（卷积+text）
卷积神经网络，用简单的例子解释，就是手机上的修图软件，拍的照片给个滤镜，照片是不是就长得不一样了，cnn就是用很多滤镜给我原始的图片，进行照耀，照完之后会得到在不同滤镜下的显示形式，这些显示形式也许就暗含这些图片的一些特征。通过滤镜扫过之后得到新的featureMap我们称为convolved feature。滤镜是怎么得到的呢，是人为初始化一个滤镜，通过之后无数次的学习来更新这个滤镜值，使得这个滤镜值是最好的能提取出fetureMap的滤镜。（加号老师讲）右下图，左边是模糊，右边是边缘化。

如何迁移到文字处理？
1.把每个单词处理成一个横向的向量，就把句子拓展成了类似图片的表达式，

2.把sentence变成1维的，

案例

三、 RNN（带记忆）
Rnn的目的是让有sequential关系的信息得到考虑，St是基于这一个时间点的input和上一个时间点的记忆，然后St再乘以output weight V得到最终输出。
如果Rnn的长度不能记忆几天前的S的话，它的上下文处理能力还是为0，因为它还是不知道你的上下文前提是什么，因此需要LSTM。
四、 LSTM（带记忆）

通过各种运算符号和规则使得整个神经网络里面每个神经网络都能记得一点东西，又会及时的忘记一些东西，使得我记忆的距离能够变得够长。（RNN是一个叠加的过程，下一个永远基于上一个，就会变得非常大和慢）
长效记忆网络，把记忆长效的保留下来。

LSTM中最重要的就是Cell State(记忆纽带) S，它一路向下，贯穿整个时间线，代表了记忆的纽带。它会被XOR（遗忘层处理）和AND（记忆处理）运算符搞一搞来更新记忆，通过这两个运算来知道要记得什么和忘掉什么。

而控制信息的增加和减少的，就是靠这些阀门：Gate，阀门就是输出一个1和0之间的值，1代表把这一趟的信息记着，0代表这一趟的信息可以忘记了。有些记忆比较久的还需不需要留着。

最后得到记忆纽带Ct

五、案例
可以用在不同的维度上：
维度1：下一个字母是什么？
维度2：下一个单词是什么？
维度3：下一个句子是什么？
维度4：下一个图片、音符是什么？
LSTM案例

深度学习与NLP简单应用的更多相关文章

转载：深度学习在NLP中的应用
之前研究的CRF算法,在中文分词,词性标注,语义分析中应用非常广泛.但是分词技术只是NLP的一个基础部分,在人机对话,机器翻译中,深度学习将大显身手.这篇文章,将展示深度学习的强大之处,区别于之前用符 ...
回望2017，基于深度学习的NLP研究大盘点
回望2017,基于深度学习的NLP研究大盘点雷锋网百家号01-0110:31 雷锋网 AI 科技评论按:本文是一篇发布于 tryolabs 的文章,作者 Javier Couto 针对 2017 ...
斯坦福深度学习与nlp第四讲词窗口分类和神经网络
http://www.52nlp.cn/%E6%96%AF%E5%9D%A6%E7%A6%8F%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%8Enlp%E7%A ...
深度学习解决NLP问题：语义相似度计算
在NLP领域,语义相似度的计算一直是个难题:搜索场景下query和Doc的语义相似度.feeds场景下Doc和Doc的语义相似度.机器翻译场景下A句子和B句子的语义相似度等等.本文通过介绍DSSM.C ...
Sony深度学习框架 - Neural Network Console - 教程（1）- 原来深度学习可以如此简单
“什么情况!?居然不是黑色背景+白色文字的命令行.对,今天要介绍的是一个拥有白嫩的用户界面的深度学习框架.” 人工智能.神经网络.深度学习,这些概念近年已经涌入每个人的生活中,我想很多人早就按捺不住想 ...
深度学习之NLP维基百科数据模型
知识点 """ 1) from gensim.model import Word2Vec import jieba 2) opencc :将繁体字转换为简体字转换命令: ...
关于深度学习之TensorFlow简单实例
1.对TensorFlow的基本操作 import tensorflow as tf import os os.environ[" a=tf.constant(2) b=tf.constan ...
NLP 第10章基于深度学习的NLP 算法
DSSM 深度学习解决 NLP 问题：语义相似度计算
https://cloud.tencent.com/developer/article/1005600

随机推荐

随机排序std::vector，扑克牌，麻将类尤其合用
有些需要重新对std::vector对象重新排序,特别是游戏,例如说:扑克牌,麻将,抽奖等,C++标准已经为std::vector写好了随机排序的方式,这里做个笔记: #include <alg ...
华为笔记HOSTS，便于访问云端存储
# Copyright (c) - Microsoft Corp. # # This is a sample HOSTS file used by Microsoft TCP/IP for Windo ...
ZooKeeper 之快速入门
-----------------破镜重圆,坚持不懈! 1. 概述 Zookeeper是Hadoop的一个子项目,它是分布式系统中的协调系统,可提供的服务主要有:配置服务.名字服务.分布式同步.组服务 ...
modelsim10.1a安装破解说明
安装包网盘下载链接:https://pan.baidu.com/s/1X9kUUXMCoikyjCQ_HKdD5g 提取码:3lfd 1.下载文件解压找到"modelsim-win32-10 ...
小小知识点（十一）——MATLAB中fftshift的作用
form单选框
form中的单选框: var resultStartRadio = new Ext.form.RadioGroup({ id : 'resultStartRadio', name :"for ...
Centos 7（linux）系统下如何给jar应用程序创建桌面快捷方式
1.创建系统自带的应用程序快捷方式对于系统自带的应用程序,其桌面快捷方式存储的位置为以下三个目录中的其中一个: /usr/share/applications ~/.local/share/appl ...
JavaScript的数据结构和算法
所有JavaScript对象都有hasOwnProperty(value)的方法,用来返回一个表明对象是不是具有这个value Key值属性的布尔值. javaScript的方法具有delete的方 ...
plus.webview更新上一个页面的信息
let currentWebview = plus.webview.currentWebview(); let backWebview = currentWebview.opener(); ...
火眼发布Windows攻击工具集
导读渗透测试员的喜讯:安全公司火眼发布Windows攻击工具集--足足包含140个程序. Kali Linux 已成为攻击型安全专家的标配工具,但对需要原生Windows功能的渗透测试员来说,维护良 ...

深度学习与NLP简单应用

深度学习与NLP简单应用的更多相关文章

随机推荐

热门专题