今天用了定闹钟的场景语料,在plato框架尝试了端到端的模型。

本文先记录英文的训练过程,然后记录中文的训练过程。

训练端到端的模型

发现使用英文的模型,还是显示有中文,所以,新建目录,重新训练

1. 用英文训练模型

工作目录:

xuehp@haomeiya002:~/git/plato-0224$

注意

metalwoz.jsonmetalwoz.hdf5 ,自动生成这2个文件

1.1. 准备文件

  • 数据文件

metalwoz.csv

  • 模型定义文件

metalWOZ_seq2seq_ludwig.yaml

定义了输入输出的特征

  • 运行加载文件

metalwoz_text.yaml

运行Agent时使用,定义了模型的路径

1.2. 训练模型

ludwig train \
--data_csv data/metalwoz.csv \
--model_definition_file metalWOZ_seq2seq_ludwig.yaml \
--output_directory "models/joint_models/"

训练完毕

1.3. 使用模型

plato run --config metalwoz_text.yaml

看样子是可以运行起来的。

接下来使用中文语料进行训练

2. 用中文训练模型

工作目录:

xuehp@haomeiya002:~/git/plato-0223$

注意

metalwoz.jsonmetalwoz.hdf5 ,自动生成这2个文件

2.1. 准备文件

工作目录:

xuehp@haomeiya002:~/git/plato-0223$

  • 数据文件

INSURANCE_zh_seg.txt

这是翻译成中文的语料文件

已分词的对话语料文件

  • 模型定义文件

metalWOZ_seq2seq_ludwig.yaml

定义了输入输出的特征

  • 运行加载文件

metalwoz_text.yaml

运行Agent时使用,定义了模型的路径

2.2. 处理文件

分词,将中文的语料文件进行分词

解析,将txt文件解析为csv文件

  • 定义配置文件

Parse_MetalWOZ.yaml

  • 执行转换
plato parse --config Parse_MetalWOZ.yaml

解析之后的文件在data/metalwoz.csv

2.3. 训练模型

ludwig train \
--data_csv data/metalwoz.csv \
--model_definition_file metalWOZ_seq2seq_ludwig.yaml \
--output_directory "models/joint_models/"

训练完毕

2.4. 使用模型

plato run --config metalwoz_text.yaml

学习笔记(26)- plato-端到端模型-定闹钟的更多相关文章

  1. CTR学习笔记&代码实现3-深度ctr模型 FNN->PNN->DeepFM

    这一节我们总结FM三兄弟FNN/PNN/DeepFM,由远及近,从最初把FM得到的隐向量和权重作为神经网络输入的FNN,到把向量内/外积从预训练直接迁移到神经网络中的PNN,再到参考wide& ...

  2. GIS案例学习笔记-明暗等高线提取地理模型构建

    GIS案例学习笔记-明暗等高线提取地理模型构建 联系方式:谢老师,135-4855-4328,xiexiaokui#qq.com 目的:针对数字高程模型,通过地形分析,建立明暗等高线提取模型,生成具有 ...

  3. CTR学习笔记&代码实现4-深度ctr模型 NFM/AFM

    这一节我们总结FM另外两个远亲NFM,AFM.NFM和AFM都是针对Wide&Deep 中Deep部分的改造.上一章PNN用到了向量内积外积来提取特征交互信息,总共向量乘积就这几种,这不NFM ...

  4. CTR学习笔记&代码实现5-深度ctr模型 DeepCrossing -> DCN

    之前总结了PNN,NFM,AFM这类两两向量乘积的方式,这一节我们换新的思路来看特征交互.DeepCrossing是最早在CTR模型中使用ResNet的前辈,DCN在ResNet上进一步创新,为高阶特 ...

  5. CTR学习笔记&代码实现6-深度ctr模型 后浪 xDeepFM/FiBiNET

    xDeepFM用改良的DCN替代了DeepFM的FM部分来学习组合特征信息,而FiBiNET则是应用SENET加入了特征权重比NFM,AFM更进了一步.在看两个model前建议对DeepFM, Dee ...

  6. Binder学习笔记(九)—— 服务端如何响应Test()请求 ?

    从服务端代码出发,TestServer.cpp int main() { sp < ProcessState > proc(ProcessState::self()); sp < I ...

  7. cips2016+学习笔记︱简述常见的语言表示模型(词嵌入、句表示、篇章表示)

    在cips2016出来之前,笔者也总结过种类繁多,类似词向量的内容,自然语言处理︱简述四大类文本分析中的"词向量"(文本词特征提取)事实证明,笔者当时所写的基本跟CIPS2016一 ...

  8. [原创]java WEB学习笔记44:Filter 简介,模型,创建,工作原理,相关API,过滤器的部署及映射的方式,Demo

    本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...

  9. 《深入Java虚拟机学习笔记》- 第8章 连接模型

    Java虚拟机学习笔记(八)连接模型

随机推荐

  1. 如何在vivado中调用ultraedit 编辑器

    ISE下点击菜单Edit -> Preferences -> Editor. 在Editor选项框里选择Custom,在Command line syntax文本框里输入: {C:/Pro ...

  2. 五、抗DDOS防火墙

    简介 DDoS全名是Distribution Denial of service (分布式拒绝服务攻击).拒绝服务攻击的攻击方式有很多种,最基本的Dos攻击就是利用合理的服务请求来占用过多的服务资源, ...

  3. 移动 APP 端与服务器端用户身份认证的安全方案

    最近要做一个项目是java开发后端服务,然后移动APP调用.由于之前没有接触过这块,所以在网上搜索相关的方案.然后搜到下面的一些方案做一些参考. 原文:移动 APP 端与服务器端用户身份认证的安全方案 ...

  4. shiro中setUnauthorizedUrl("/403")不起作用

    最近学习shiro框架,在用户没有权限的情况下想让其跳转到403页面,结果非自己预想的效果.后来找到一个解决办法如下: 转载来源 SpringBoot中集成Shiro的时候, 配置setUnautho ...

  5. mysql数据库函数之left()、right()、substring()、substring_index()

    在实际的项目开发中有时会有对数据库某字段截取部分的需求,这种场景有时直接通过数据库操作来实现比通过代码实现要更方便快捷些,mysql有很多字符串函数可以用来处理这些需求,如Mysql字符串截取总结:l ...

  6. Vue中父组件向子组件echarts传值问题

    原文链接:https://blog.csdn.net/Uookic/article/details/80638883?utm_source=copy 问题:当父组件传值给子组件echarts时,发现子 ...

  7. Java中的Collections类

    转载:https://blog.csdn.net/yangxingpa/article/details/80515963 从[Java]Java中的Collections类——Java中升级版的数据结 ...

  8. webpack4.41.0配置二(加载器_url-loader/babel-loader/sass-loader)

    loader是webpack用来预处理源文件的,比如typesrcipt形式的文件最终都得转成浏览器可以执行的js文件 (注:以下的配置代码不一定与下方一摸一样,具体与官网上https://webpa ...

  9. MySQL学习(四)死锁及死锁检测

    文章图片来自参考资料 MySQL 的锁     根据加锁的范围,MySQL里面的锁大致可以分成全局锁.表级锁和行锁三类.我们需要明白锁的服务是为了数据统一,或者说是事务,数据隔离. 全局锁     全 ...

  10. 转:unittest的几种运行方式

    #unittest-test.py import unittestfrom demo import RunMainimport HtmlTestRunner class TestMethod(unit ...