学习笔记(26)- plato-端到端模型-定闹钟
今天用了定闹钟的场景语料,在plato框架尝试了端到端的模型。
本文先记录英文的训练过程,然后记录中文的训练过程。
训练端到端的模型
发现使用英文的模型,还是显示有中文,所以,新建目录,重新训练
1. 用英文训练模型
工作目录:
xuehp@haomeiya002:~/git/plato-0224$
注意
metalwoz.json 和 metalwoz.hdf5 ,自动生成这2个文件
1.1. 准备文件
- 数据文件
metalwoz.csv
- 模型定义文件
metalWOZ_seq2seq_ludwig.yaml
定义了输入输出的特征
- 运行加载文件
metalwoz_text.yaml
运行Agent时使用,定义了模型的路径
1.2. 训练模型
ludwig train \
--data_csv data/metalwoz.csv \
--model_definition_file metalWOZ_seq2seq_ludwig.yaml \
--output_directory "models/joint_models/"
训练完毕

1.3. 使用模型
plato run --config metalwoz_text.yaml

看样子是可以运行起来的。
接下来使用中文语料进行训练
2. 用中文训练模型
工作目录:
xuehp@haomeiya002:~/git/plato-0223$
注意
metalwoz.json 和 metalwoz.hdf5 ,自动生成这2个文件
2.1. 准备文件
工作目录:
xuehp@haomeiya002:~/git/plato-0223$
- 数据文件
INSURANCE_zh_seg.txt
这是翻译成中文的语料文件
已分词的对话语料文件
- 模型定义文件
metalWOZ_seq2seq_ludwig.yaml
定义了输入输出的特征
- 运行加载文件
metalwoz_text.yaml
运行Agent时使用,定义了模型的路径
2.2. 处理文件
分词,将中文的语料文件进行分词
解析,将txt文件解析为csv文件
- 定义配置文件
Parse_MetalWOZ.yaml
- 执行转换
plato parse --config Parse_MetalWOZ.yaml
解析之后的文件在data/metalwoz.csv
2.3. 训练模型
ludwig train \
--data_csv data/metalwoz.csv \
--model_definition_file metalWOZ_seq2seq_ludwig.yaml \
--output_directory "models/joint_models/"
训练完毕

2.4. 使用模型
plato run --config metalwoz_text.yaml

学习笔记(26)- plato-端到端模型-定闹钟的更多相关文章
- CTR学习笔记&代码实现3-深度ctr模型 FNN->PNN->DeepFM
这一节我们总结FM三兄弟FNN/PNN/DeepFM,由远及近,从最初把FM得到的隐向量和权重作为神经网络输入的FNN,到把向量内/外积从预训练直接迁移到神经网络中的PNN,再到参考wide& ...
- GIS案例学习笔记-明暗等高线提取地理模型构建
GIS案例学习笔记-明暗等高线提取地理模型构建 联系方式:谢老师,135-4855-4328,xiexiaokui#qq.com 目的:针对数字高程模型,通过地形分析,建立明暗等高线提取模型,生成具有 ...
- CTR学习笔记&代码实现4-深度ctr模型 NFM/AFM
这一节我们总结FM另外两个远亲NFM,AFM.NFM和AFM都是针对Wide&Deep 中Deep部分的改造.上一章PNN用到了向量内积外积来提取特征交互信息,总共向量乘积就这几种,这不NFM ...
- CTR学习笔记&代码实现5-深度ctr模型 DeepCrossing -> DCN
之前总结了PNN,NFM,AFM这类两两向量乘积的方式,这一节我们换新的思路来看特征交互.DeepCrossing是最早在CTR模型中使用ResNet的前辈,DCN在ResNet上进一步创新,为高阶特 ...
- CTR学习笔记&代码实现6-深度ctr模型 后浪 xDeepFM/FiBiNET
xDeepFM用改良的DCN替代了DeepFM的FM部分来学习组合特征信息,而FiBiNET则是应用SENET加入了特征权重比NFM,AFM更进了一步.在看两个model前建议对DeepFM, Dee ...
- Binder学习笔记(九)—— 服务端如何响应Test()请求 ?
从服务端代码出发,TestServer.cpp int main() { sp < ProcessState > proc(ProcessState::self()); sp < I ...
- cips2016+学习笔记︱简述常见的语言表示模型(词嵌入、句表示、篇章表示)
在cips2016出来之前,笔者也总结过种类繁多,类似词向量的内容,自然语言处理︱简述四大类文本分析中的"词向量"(文本词特征提取)事实证明,笔者当时所写的基本跟CIPS2016一 ...
- [原创]java WEB学习笔记44:Filter 简介,模型,创建,工作原理,相关API,过滤器的部署及映射的方式,Demo
本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...
- 《深入Java虚拟机学习笔记》- 第8章 连接模型
Java虚拟机学习笔记(八)连接模型
随机推荐
- hashmap与currentHashMap
hashmap的缺点 多线程不安全,在并发场景下使用时容易出现死循环,脏读问题等 死循环:https://juejin.im/post/5a66a08d5188253dc3321da0 (这篇好点)h ...
- 解决 jmeter 压测Non HTTP response code: java.net.NoRouteToHostException/Non HTTP response message: Cannot assign requested address (Address not available)
针对centos : 先检查下tcp port range 在合理范围内: cat /proc/sys/net/ipv4/ip_local_port_range 1024 65535 上述为ce ...
- C++学习网站总结
http://club.topsage.com/thread-361504-1-1.html Visual C++ (VC) / MFC 电子书下载: Visual C++ 2008 入门经典 (中文 ...
- can总线中什么是远程帧
所谓“远程帧”是一个传统翻译上的误区.Remote Frame实际上它的意义是“遥控帧”,发起方发起特定ID的远程帧,并且只发送ID部分,那么与其ID相符的终端设备就有义务在后半段的数据部分接管总线控 ...
- oracle查询第几行到第几行的数据
我想查询10条到20条的数据 注意: 1.大数在前,小数在后面 2.都是小于 () minus (); 运行结果:
- 路飞-Redis的使用,登录注册接口
复习 """ 1.git项目开发 提供公钥成为开发者.copy项目.开发项目 先commit.再pull(可能出现冲突).最后push 特殊功能可以新建dev的子分支进行 ...
- 【14】 DFS 机器人活动范围 (static插曲)
题目 地上有一个m行n列的方格,从坐标 [0,0] 到坐标 [m-1,n-1] .一个机器人从坐标 [0, 0] 的格子开始移动,它每次可以向左.右.上.下移动一格(不能移动到方格外),也不能进入行坐 ...
- 【C语言】数组名作函数参数,完成数据的升序排列
#include<stdio.h> void sort(int x[],int n); int main() { ] = { ,,,,,,,,, },i; sort(arr, ); pri ...
- 如何在windows和linux搭建django环境
注:本文以python3为例,python2.x是一样的不再赘述 提前准备: python/python3已经安装好,如果没有请参考以下资料进行安装 linux安装python3 win安装pytho ...
- JQuery/JS插件 jsTree加载树,预先加载,初始化时加载前三级节点,当展开第三级节点时 就加载该节点下的所有子节点
jsTree加载树, 初始化时 加载前三级节点, 当展开第三级节点时 就加载该节点下的所有子节点 html: <!DOCTYPE html> <html> <head&g ...