基于LSTM + keras 的诗歌生成器

最近在github 上发现了一个好玩的项目，一个基于LSTM + keras 实现的诗歌生成器，地址是:https://github.com/youyuge34/Poems_generator_Keras. 我去看了一下代码，实现的原理其实很common,就是普通的基于LSTM 的序列模型。模型使用了43030首诗进行训练,最后生成的诗歌还是有模有样的(当然仅限于有模有样，自然是不能深究的了)

模型的核心思路:

 input_tensor = Input(shape=(self.config.max_len, len(self.words)))

 lstm = LSTM(512, return_sequences=True)(input_tensor)

 dropout = Dropout(0.6)(lstm)

 lstm = LSTM(256)(dropout)

 dropout = Dropout(0.6)(lstm)

 dense = Dense(len(self.words), activation='softmax')(dropout)

 self.model = Model(inputs=input_tensor, outputs=dense)

 optimizer = Adam(lr=self.config.learning_rate)

 self.model.compile(loss='categorical_crossentropy', optimizer=optimizer, metrics=['accuracy'])

keras 真的是极简的深度学习语言，上述短短的9行代码就已经包括了全部的模型结构，而且不需要注释基本都能看懂代码在做什么。

第一行: 构造输入向量
第二行，构造了一个LSTM layer, hidden units size = 512
第三行,构造了一个dropout layer,dropout rate = 0.6
第四行,构造了一个LSTM layer,hidden units size = 256
第五行,构造了一个dropout layer,dropout rate = 0.6
第六行，构造了一个全连接层+softmax 作为 output layer
第七行,利用 inputs 和 outputs 构造Model
第八行,使用 Adam 优化器
第九行,compile model,指定了模型的损失函数类型为交叉熵损失,优化器以及评价指标

2. 数据，https://github.com/youyuge34/Poems_generator_Keras/blob/master/dataset/poetry.txt，部分数据格式如下:

首春:寒随穷律变，春逐鸟声开。初风飘带柳，晚雪间花梅。碧林青旧竹，绿沼翠新苔。芝田初雁去，绮树巧莺来。

初晴落景:晚霞聊自怡，初晴弥可喜。日晃百花色，风动千林翠。池鱼跃不同，园鸟声还异。寄言博通者，知予物外志。

初夏:一朝春夏改，隔夜鸟花迁。阴阳深浅叶，晓夕重轻烟。哢莺犹响殿，横丝正网天。珮高兰影接，绶细草纹连。碧鳞惊棹侧，玄燕舞檐前。何必汾阳处，始复有山泉。

度秋:夏律昨留灰，秋箭今移晷。峨嵋岫初出，洞庭波渐起。桂白发幽岩，菊黄开灞涘。运流方可叹，含毫属微理。

冒号前的是诗的名字，冒号后的是诗的内容

3. 训练

我使用的单卡 RTX2080ti(11G显存) 进行训练，按照作者的默认配置，一共训练了 34000+ epoch,每个 epoch 耗时 1s 左右，总共训练了接近10个小时。最终得到的keras 可用的模型文件以及训练日志我放到百度云了，地址是:https://pan.baidu.com/s/1XV9InTe9vMmwKNs5lBS-tQ

4.训练完成之后，原始的代码一共提供了4个进行predict 的API:

predict_first:给定一个汉字，输出一首五言绝句
predict_random:随机从全部的训练诗作当中抽出一首诗的首句，然后生成一首诗
predict_gen:给定五个汉字作为首句，生成一首五言绝句
predict_hide:给定四个汉字，输出以这个四个汉字开头的藏头诗
为了方便预测，我封装了一个简单的命令行工具，提供了四种预测，代码可以参考我对原始repo 的 fork 版本(https://github.com/Lyrichu/Poems_generator_Keras/tree/huchengchun),使用方式如下:

5. 愉快地生成诗歌玩耍吧

基于LSTM + keras 的诗歌生成器的更多相关文章

深度学习|基于LSTM网络的黄金期货价格预测--转载
深度学习|基于LSTM网络的黄金期货价格预测前些天看到一位大佬的深度学习的推文,内容很适用于实战,争得原作者转载同意后,转发给大家.之后会介绍LSTM的理论知识. 我把code先放在我github上 ...
Thomas Brinkhoff 基于路网的移动对象生成器的使用
Thomas Brinkhoff 基于路网的移动对象生成器的使用网站:http://iapg.jade-hs.de/personen/brinkhoff/generator/ 各个移动对象在路网中进 ...
tensorflow实现基于LSTM的文本分类方法
tensorflow实现基于LSTM的文本分类方法作者:u010223750 引言学习一段时间的tensor flow之后,想找个项目试试手,然后想起了之前在看Theano教程中的一个文本分类的实 ...
基于redis的分布式ID生成器
基于redis的分布式ID生成器
在TensorFlow中基于lstm构建分词系统笔记
在TensorFlow中基于lstm构建分词系统笔记(一) https://www.jianshu.com/p/ccb805b9f014 前言我打算基于lstm构建一个分词系统,通过这个例子来学习下 ...
Thomas Brinkhoff 基于路网的移动对象生成器的使用[第二版]
Thomas Brinkhoff 基于路网的移动对象生成器的使用 Thomas Brinkhoff 基于路网的移动对象生成器的使用相关操作的说明相关文件的说明运行导入eclipse后运行时选择 ...
Tensorflow之基于LSTM神经网络写唐诗
最近看了不少关于写诗的博客,在前人的基础上做了一些小的改动,因比较喜欢一次输入很长的开头句,所以让机器人输出压缩为一个开头字生成两个诗句,写五言和七言诗,当然如果你想写更长的诗句是可以继续改动的. 在 ...
基于 lstm 的股票收盘价预测 -- python
开始导入 MinMaxScaler 时会报错 “from . import _arpack ImportError: DLL load failed: 找不到指定的程序.” (把sklearn更新下) ...
一文详解如何用 TensorFlow 实现基于 LSTM 的文本分类（附源码）
雷锋网按:本文作者陆池,原文载于作者个人博客,雷锋网已获授权. 引言学习一段时间的tensor flow之后,想找个项目试试手,然后想起了之前在看Theano教程中的一个文本分类的实例,这个星期就用 ...

随机推荐

linux实操_shell自定义函数
基本语法: #定义函数 function 函数名(){ 函数体 } #调用函数函数名参数1 参数2... 实例:计算两个数的和. 运行后
洛谷P1373 小a和uim之大逃离【线性dp】
题目:https://www.luogu.org/problemnew/show/P1373 题意: 有一个n*m的地图,每个点上有一个数值.两个人在任一点开始任一点结束,只能往右或往下走,轮流收集数 ...
0、Spring 注解驱动开发
0.Spring注解驱动开发 0.1 简介 <Spring注解驱动开发>是一套帮助我们深入了解Spring原理机制的教程: 现今SpringBoot.SpringCloud技术非常火热,作 ...
position:absolute 按钮左右分布：left:0 和 right:0 以及雪碧图
问题:把两个a标签按钮垂直居中,并且分别把两个按钮放在水平左右两边顶部1,祖父元素设定:position:relative2,把.arrow 设定上下垂直居中 position:absolute; ...
事务日志已满请参阅sys.databases中的log_reuse_wait_desc列解决办法
http://www.myexception.cn/sql-server/153219.html http://blog.csdn.net/kedingboy12345/article/details ...
MySQL中使用LIMIT分页
需求:客户端通过传递pageNum(页码)和pageSize(每页显示的条数)两个参数去分页查询数据库表中的数据. 我们知道MySQL提供了分页函数limit m,n,但是该函数的用法和需求不一样,所 ...
layer 漂亮的弹窗
layer.confirm('<font color="red">请认真核对账目信息,提交后将不可撤回!!</font>', { icon:3, title ...
yquery-操作样式属性
前几天回家,参加了全国的成人高考,都说学历是找工作的敲门砖,其实一点都不假,尤其是现在的社会竞争力那么强,你不学就会被淘汰.像要过自己想要的生活,就必须努力学习,努力赚钱,买自己想买的,过自己想过的. ...
OpenResty之指令与常用API
1. 指令通过 Lua 编写 Nginx 脚本的基本构建块是指令.指令常用于指定 Lua 代码是几时执行的以及如何使用运行的结果.下图展示了指令执行的顺序. lua_capture_error_lo ...
html中如何获取元素在文档中的位置
html中如何获取元素在文档中的位置一.总结一句话总结: $("#elem").offset().top $("#elem").offset().left ...

基于LSTM + keras 的诗歌生成器

基于LSTM + keras 的诗歌生成器的更多相关文章

随机推荐

热门专题