先处理中文语料。参考上篇笔记

1. 准备`model_definition_file`文件

官方文档给了例子，

plato/example/config/ludwig/metalWOZ_seq2seq_ludwig.yaml

---

input_features:

    -

        name: user

        type: text

        level: word

        encoder: rnn

        cell_type: lstm

        reduce_output: null

output_features:

    -

        name: system

        type: text

        level: word

        decoder: generator

        cell_type: lstm

        attention: bahdanau

training:

  epochs: 100

2. 开始训练模型

注意模型的保存路径

ludwig train \

       --data_csv data/metalwoz.csv \

       --model_definition_file plato/example/config/ludwig/metalWOZ_seq2seq_ludwig.yaml \

       --output_directory "models/joint_models/"

3. 写类文件，加载模型

模型训练完毕之后，就可以使用了。

那么如何使用呢？需要写类实现接口。

写一个类，继承Conversational Module，来加载和查询模型。

这个类只需要加载模型，查询并负责输出。

我们需要把输入文本转换为pandas dataframe，从输出捕获预测序列，将他们组织为字符串，并返回。

参考 plato.agent.component.joint_model.metal_woz_seq2seq.py

package: plato.agent.component.joint_model.metal_woz_seq2seq

class: MetalWOZSeq2Seq

文件：

plato/agent/component/joint_model/metal_woz_seq2seq.py

"""

MetalWOZ is an MetalWOZ class that defines an interface to Ludwig models.

"""

class MetalWOZSeq2Seq(ConversationalModule):

    ……

4. 运行Agent

写一个yaml文件，就可以运行Agent了，

参考plato/example/config/application/metalwoz_generic.yaml ，这是一个seq2seq的例子。

plato run --config metalwoz_text.yaml

plato/example/config/application/metalwoz_text.yaml

5. 测试结果

可以做一些输入和测试，看看效果

学习笔记（24）- plato-训练中文模型的更多相关文章

GIS案例学习笔记-多边形内部缓冲区地理模型
GIS案例学习笔记-多边形内部缓冲区地理模型联系方式:谢老师,135-4855-4328,xiexiaokui#qq.com 目的:对于多边形,建立内部缓冲区. 问题:ArcGIS缓冲工具不支持内部 ...
TensorFlow学习笔记——LeNet-5（训练自己的数据集）
在之前的TensorFlow学习笔记——图像识别与卷积神经网络(链接:请点击我)中了解了一下经典的卷积神经网络模型LeNet模型.那其实之前学习了别人的代码实现了LeNet网络对MNIST数据集的训练 ...
《Master Bitcoin》学习笔记02——比特币的交易模型
比特币的交易模型模型基本描述前面一篇学习笔记01提到了一个交易模型(第三章的内容),在第五章中,除了对这个模型做个详细介绍之外,其实和我上一篇理解的交易模型差不多,一个交易包含输入与输出,比特币是 ...
[原创]java WEB学习笔记17：关于中文乱码的问题和 tomcat在eclipse中起动成功，主页却打不开
本博客为原创:综合尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和网络上的现有资源(博客,文档,图书等),资源的出处我会标明本博客的目的:①总结自己的学习过程,相当 ...
【Spring学习笔记-MVC-7】Spring MVC模型对象-模型属性讲解
作者:ssslinppp 来自为知笔记(Wiz) 附件列表处理模型数据.png
[原创]java WEB学习笔记24：MVC案例完整实践(part 5)---删除操作的设计与实现
本博客为原创:综合尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和网络上的现有资源(博客,文档,图书等),资源的出处我会标明本博客的目的:①总结自己的学习过程,相当 ...
DeepLearning.ai学习笔记（五）序列模型 -- week2 序列模型和注意力机制
一.基础模型假设要翻译下面这句话: "简将要在9月访问中国" 正确的翻译结果应该是: "Jane is visiting China in September" ...
word2vec训练中文模型
-- 这篇文章是一个学习.分析的博客 --- 1.准备数据与预处理首先需要一份比较大的中文语料数据,可以考虑中文的维基百科(也可以试试搜狗的新闻语料库).中文维基百科的打包文件地址为 https: ...
自然语言处理NLP学习笔记一：概念与模型初探
前言先来看一些demo,来一些直观的了解. 自然语言处理: 可以做中文分词,词性分析,文本摘要等,为后面的知识图谱做准备. http://xiaosi.trs.cn/demo/rs/demo 知识图 ...
DeepLearning.ai学习笔记（五）序列模型 -- week1 循环序列模型
一.为什么选择序列模型序列模型可以用于很多领域,如语音识别,撰写文章等等.总之很多优点... 二.数学符号为了后面方便说明,先将会用到的数学符号进行介绍. 以下图为例,假如我们需要定位一句话中人名 ...

随机推荐

【Python】字符串操作符
[一本通学习笔记] 最近公共祖先LCA
本节内容过于暴力没什么好说的.借着这个专题改掉写倍增的陋习,虽然写链剖代码长了点不过常数小还是很香. 10130. 「一本通 4.4 例 1」点的距离 #include <bits/stdc++ ...
Ubuntu，更新Sourses.list
1.备份原文件 sudo cp /etc/apt/sources.list /etc/apt/sources_list.bak 2.加载文件 vim:vim sourses.list ubuntu d ...
python collections 模块常用集合
1.nametulpe # tuple 可以表示不变集合列如坐标 point = (1,1) # 缺点是只可以通过下标方式访问 #namedtuple是一个函数,它用来创建一个自定义的tuple对 ...
hfs 文件存储
hfs 服务器上面的和本地拖上去的文件是同一个文件.对本地文件拖上去之后再修改,服务器文件也会修改.所以服务器要有一个自己的文件存放.
http断点续传的原理
——————————————先讲原理,如下:—————————————————— 举一个详细的例子: 一般场景,要访问的域名:www.jizhuomi.com/android,文件名为down.zip ...
[thinkphp] 启用__PUBLIC__
我真是受够了,,, 为了解决__PUBLIC__不能用的问题我折腾了好几天了,然后终于被我找到了原因解决过程首先必须贴出来帮助我的人 https://my.oschina.net/u/12630 ...
Hadoop TextInputFormat
1. TextInputFortmat TextInputFormat是默认的InputFormat.每条记录是一行输入.Key是LongWritable类型,存储该行在整个文件中的字节偏移量(不是行 ...
Tomcat无法成功启动——双击startup.bat闪退
使用的Tomcat是免安装版本的.因为在启动tomcat是需要读取环境变量和配置信息,缺少了这些信息,就不能登记环境变量,导致了tomcat的闪退. 解决办法: 1:在已解压的tomcat的bin文件 ...
阻塞队列BlockingQueue之ArrayBlockingQueue
ArrayBlockingQueue 是数组实现的有界阻塞队列,此队列按照先进先出(FIFO)的原则对元素进行排序. 构造方法: public ArrayBlockingQueue(int capa ...

学习笔记（24）- plato-训练中文模型

1. 准备model_definition_file文件