NLP（二十四）使用LSTM构建生成式聊天机器人

原文链接：http://www.one2know.cn/nlp24/

准备

数据集：AIML数据集

下载数据集并用Notepad++打开，复制到txt文件中方便打开
代码实现

数据很少，训练轮次不多，结果不好，仅当示例

import numpy as np

import pandas as pd

with open('bot.txt','r') as content_file:

    botdata = content_file.read()

Questions = []

Answers = []

for line in botdata.split('</pattern>'):

    if '<pattern>' in line:

        Quesn = line[line.find('<pattern>')+len('<pattern>'):]

        Questions.append(Quesn.lower())

for line in botdata.split('</template>'):

    if '<template>' in line:

        Ans = line[line.find('<template>')+len('<template>'):]

        Answers.append(Ans.lower())

QnAdata = pd.DataFrame(np.column_stack([Questions,Answers]),columns=['Questions','Answers'])

QnAdata['QnAcomb'] = QnAdata['Questions'] + ' ' + QnAdata['Answers']

print(QnAdata[:5])

import nltk

import collections

## 向量化

counter = collections.Counter()

for i in range(len(QnAdata)):

    for word in nltk.word_tokenize(QnAdata.iloc[i][2]):

        counter[word] += 1

word2idx = {w:(i+1) for i,(w,_) in enumerate(counter.most_common())}

idx2word = {v:k for k,v in word2idx.items()}

idx2word[0] = 'PAD'

vocab_size = len(word2idx) + 1

print('\nVocabulary size:',vocab_size)

def encode(sentence, maxlen,vocab_size):

    indices = np.zeros((maxlen, vocab_size))

    for i, w in enumerate(nltk.word_tokenize(sentence)):

        if i == maxlen: break

        indices[i, word2idx[w]] = 1

    return indices

def decode(indices, calc_argmax=True):

    if calc_argmax:

        indices = np.argmax(indices, axis=-1)

    return ' '.join(idx2word[x] for x in indices)

question_maxlen = 10

answer_maxlen = 20

def create_questions(question_maxlen,vocab_size):

    question_idx = np.zeros(shape=(len(Questions),question_maxlen,vocab_size))

    for q in range(len(Questions)):

        question = encode(Questions[q],question_maxlen,vocab_size)

        question_idx[i] = question

    return question_idx

quesns_train = create_questions(question_maxlen=question_maxlen,vocab_size=vocab_size)

def create_answers(answer_maxlen,vocab_size):

    answer_idx = np.zeros(shape=(len(Answers),answer_maxlen,vocab_size))

    for q in range(len(Answers)):

        answer = encode(Answers[q],answer_maxlen,vocab_size)

        answer_idx[i] = answer

    return answer_idx

answs_train = create_answers(answer_maxlen=answer_maxlen,vocab_size=vocab_size)

from keras.layers import Input,Dense,Dropout,Activation

from keras.models import Model

from keras.layers.recurrent import LSTM

from keras.layers.wrappers import Bidirectional

from keras.layers import RepeatVector,TimeDistributed,ActivityRegularization

n_hidden = 128

question_layer = Input(shape=(question_maxlen,vocab_size))

encoder_rnn = LSTM(n_hidden,dropout=0.2,recurrent_dropout=0.2)(question_layer)

# encoder_rnn = Bidirectional(LSTM(n_hidden,dropout=0.2,recurrent_dropout=0.2),merge_mode='concat')(question_layer)

# RNN的双向包装 向前和向后RNN的输出将合并

# merge_mode（合并模型）参数：{'sum', 'mul', 'concat', 'ave', None}

repeat_encode = RepeatVector(answer_maxlen)(encoder_rnn)

# 重复输入n次 shape加了一维 比如(a,b,c)=>(n,a,b,c)

dense_layer = TimeDistributed(Dense(vocab_size))(repeat_encode)

# TimeDistributed和Dense一起使用,

# 在静态形状中查找非特定维度,并用张量的相应动态形状代替它们

regularized_layer = ActivityRegularization(l2=1)(dense_layer)

# 对基于代价函数的输入活动应用更新的层

softmax_layer = Activation('softmax')(regularized_layer)

model = Model([question_layer],[softmax_layer])

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

print(model.summary())

# 模型训练

quesns_train_2 = quesns_train.astype('float32')

answs_train_2 = answs_train.astype('float32')

model.fit(quesns_train_2, answs_train_2,batch_size=32,epochs=30,validation_split=0.05)

# 模型预测

ans_pred = model.predict(quesns_train_2[0:3])

print(decode(ans_pred[0]))

print(decode(ans_pred[1]))

NLP（二十四）使用LSTM构建生成式聊天机器人的更多相关文章

(C/C++学习笔记) 二十四. 知识补充
二十四. 知识补充 ● 子类调用父类构造函数 ※ 为什么子类要调用父类的构造函数? 因为子类继承父类,会继承到父类中的数据,所以子类在进行对象初始化时,先调用父类的构造函数,这就是子类的实例化过程. ...
Bootstrap<基础二十四> 缩略图
Bootstrap 缩略图.大多数站点都需要在网格中布局图像.视频.文本等.Bootstrap 通过缩略图为此提供了一种简便的方式.使用 Bootstrap 创建缩略图的步骤如下: 在图像周围添加带有 ...
二十四、Struts2中的UI标签
二十四.Struts2中的UI标签 Struts2中UI标签的优势: 数据回显页面布局和排版(Freemark),struts2提供了一些常用的排版(主题:xhtml默认 simple ajax) ...
WCF技术剖析之二十四: ServiceDebugBehavior服务行为是如何实现异常的传播的?
原文:WCF技术剖析之二十四: ServiceDebugBehavior服务行为是如何实现异常的传播的? 服务端只有抛出FaultException异常才能被正常地序列化成Fault消息,并实现向客户 ...
VMware vSphere 服务器虚拟化之二十四桌面虚拟化之手动池管理物理机
VMware vSphere 服务器虚拟化之二十四桌面虚拟化之手动池管理物理机 VMwareView手动池可以管理物理计算机说明: 环境基于实验二十三 1.准备一台Windows 7的物理计算机名 ...
Bootstrap入门（二十四）data属性
Bootstrap入门(二十四)data属性你可以仅仅通过 data 属性 API 就能使用所有的 Bootstrap 插件,无需写一行 JavaScript 代码.这是 Bootstrap 中的一 ...
3360: [Usaco2004 Jan]算二十四
3360: [Usaco2004 Jan]算二十四 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 6 Solved: 6[Submit][Statu ...
JAVA之旅（二十四）——I/O流，字符流，FileWriter，IOException，文件续写，FileReader，小练习
JAVA之旅(二十四)--I/O流,字符流,FileWriter,IOException,文件续写,FileReader,小练习 JAVA之旅林林总总也是写了二十多篇了,我们今天终于是接触到了I/O了 ...
二十四. Python基础(24)--封装
二十四. Python基础(24)--封装 ● 知识结构 ● 类属性和__slots__属性 class Student(object): grade = 3 # 也可以写在__slots ...

随机推荐

2019前端面试系列——Vue面试题
Vue 双向绑定原理 mvvm 双向绑定,采用数据劫持结合发布者-订阅者模式的方式,通过 Object.defineProperty()来劫持各个属性的 setter.getter,在数 ...
el-upload自定义上传文件，并携带其余参数，且action不报错
用el-upload组件自定义上传按钮,并携带其余参数,且必传参数action 不报错 <template> <el-col :span="6" :mode=&q ...
Cordova-iOS SDK封装
源码编译与制作静态库下载cordova-ios源码,下载地址为:cordova-ios 解压后使用Xcode进行编译,编译选定模拟器和Generic iOS Device,cmd+B,编译成功(Dy ...
ansible批量管理服务上
1 ansible简介 1.1 ansible批量管理服务概述 (1)是基于python语言开发的自动化软件工具(2)是基于SSH远程管理服务实现远程主机批量管理(3)并行管理,部署简单,应用也简单方 ...
5.源码分析---SOFARPC调用服务
我们这一次来接着上一篇文章<4. 源码分析---SOFARPC服务端暴露>讲一下服务暴露之后被客户端调用之后服务端是怎么返回数据的. 示例我们还是和上篇文章一样使用一样的bolt协议来讲: ...
Spark 系列（十一）—— Spark SQL 聚合函数 Aggregations
一.简单聚合 1.1 数据准备 // 需要导入 spark sql 内置的函数包 import org.apache.spark.sql.functions._ val spark = SparkSe ...
Appium+python自动化（三十二）- 代码写死一时爽，框架重构火葬场 - PageObject+unittest（超详解）
简介江湖有言:”代码写死一时爽,框架重构火葬场“,更有人戏言:”代码动态一时爽,一直动态一直爽
Lasso估计论文学习笔记(一)
最近课程作业让阅读了这篇经典的论文,写篇学习笔记. 主要是对论文前半部分Lasso思想的理解,后面实验以及参数估计部分没有怎么写,中间有错误希望能提醒一下,新手原谅一下. 1.整体思路作者提出了一种 ...
并发模型与IO模型梳理
并发模型常见的并发模型一般包括3类,基于线程与锁的内存共享模型,actor模型和CSP模型,其中尤以线程与锁的共享内存模型最为常见.由于go语言的兴起,CSP模型也越来越受关注.基于锁的共享内存模型 ...
python学习之并发编程(理论部分)
第一章操作系统管理控制协调计算机中硬件与软件的关系. 操作系统的作用? 第一个作用: 将一些对硬件操作的复杂丑陋的接口,变成简单美丽的接口. open函数. 第二个作用: 多个进程抢占一个(CPU ...

NLP（二十四）使用LSTM构建生成式聊天机器人

NLP（二十四）使用LSTM构建生成式聊天机器人的更多相关文章

随机推荐

热门专题