基于人工智能标记语言 (AIML)和任务型对话系统(Task)的深度智能对话机器人demo
起因
本demo基于基于人工智能标记语言 (AIML)和开放域问答(WebQA)的深度智能对话模型而来
无意间发现一个基于人工智能标记语言 (AIML)和开放域问答(WebQA)的深度智能对话模型,但由于年代久远代码已经跑不通了,而且采用的是py2,于是边看变改,在自己摸索下,写了一个相对完整的demo且有相对完整的注释,特此开源供各位参考学习
源码与介绍
本项目相较于原项目
实现功能
- 知识库匹配(AIML)回答问题
- 任务型对话系统(Task)
- 利用API完成的闲聊系统回答问题
- 待更新....
特点
- AIML知识库更多(共35个)
- 敏感词库更广(共1.5W个),同时敏感词判断更合理
- 新增NLP功能,用于处理文本相似度。
- 针对文本相似度使用了:音形码算法+余弦相似度算法
- 更多的API接口demo可以调用(支持莉莉、青云客、ownthink、如意、mcenjoy)
使用方法
首先下载解压你会得到一个这样一个目录结构
目录结构
chatbot_aiml_task_demo
├─ init.py
└─ core
├─ init.py
├─ chatbot.py
├─ config.cfg
├─ crawler
│ ├─ init.py
│ ├─ crawl.py
│ ├─ search.py
│ ├─ stationID.json
│ └─ weather.py
├─ deeplearning
│ ├─ NLP.py
│ ├─ .......
│ ├─ SimilarCharactor
│ ├─ init.py
│ └─ deep.py
├─ log
│ ├─ .gitkeep
│ └─ .......
├─ resources
│ ├─ Book.aiml
│ ├─ .......
│ ├─ save.aiml
│ ├─ load.aiml
│ ├─ main.aiml
│ ├─ sensitive.txt
│ ├─ .......
│ └─ .......
└─ tool
├─ init.py
└─ filter.py
其中:
chatbot.py 是主程序
config.cfg 是各种路径的配置文件
tool文件夹 下是存放的是用于敏感词过滤使用的filter.py文件
resources文件夹 建议存放AIML知识库和敏感词库
deeplearning文件夹 存放的是NLP主要代码
crawler文件夹 存放的是任务型对话系统(Task)主要代码
源码介绍与处理流程
- 预处理
限制字数
过滤敏感词(恶心、政治、色情、违法......)当你需要增加敏感词时候直接在sensitive.txt中添加即可
当你需要更改敏感词库位置时候请在config.cfg中修改filter_file
- 知识库匹配(AIML)
基本功能:打招呼、闲聊......
异常处理:问题太长、空白问题、找不到回复......
情绪回答:表情、夸奖、嘲笑......
如果匹配不到回答,进行步骤三 - 任务型对话匹配
如果可以请不要完全依赖于本人提供的任务功能,请自行修改接口和对应的匹配关键词。因为本人提供的接口随时可能失效,无法保证效果。
你可以自行添加功能和匹配关键词。包括但不限制于天气查询、汉字查询、空气质量查询、百科等机器人功能任务型对话系统(Task)功能函数建议放在search.py中
关键词逻辑判断建议写在crawl.py文件中
同时你可要单独写一个功能文件调用,例如给出的例子weather.py用于取天气
- 神经网络
与原作者相同,我也暂时实现不了神经网络部分功能,同样使用了API代替,同时加入了NLP文本相似度计算。如果你需要使用API请到deep.py对应的函数中填入自己的api_key
在deep.py的bot_reply()函数中,你可以选择使用的API接口和个数,同时也支持你自己添加API
学习功能
利用AIML模板+shelve存储,同时修复了已知BUG
学习功能模板为learn.aiml库,可以自定义修改
- 说错 *
- 答错 *
- ......
效果展示:
源码
欢迎Star欢迎━(`∀´)ノ亻!
github
参考
基于人工智能标记语言 (AIML)和开放域问答(WebQA)的深度智能对话模型
中文相似度匹配算法
wenyangchou/SimilarCharactor
敏感词过滤的几种实现+某1w词敏感词库
基于人工智能标记语言 (AIML)和任务型对话系统(Task)的深度智能对话机器人demo的更多相关文章
- 分布式人工智能标记语言(DAIML)示例
DAIML(Distributed Artificial Intelligence Markup Language)是用于分布式人工智能系统中智能语言的标记库.DAIML主要分为Patte ...
- 标记语言XML
标记语言概述 标记语言,是一种将文本(Text)以及文本相关的其他信息结合起来,展现出关于文档结构和数据处理细节的电脑文字编码.一部分是标记,一部分是标记中的内容,两部分构成标记语言 <标记 ...
- XML 概述 (可扩展标记语言)
XML:eXtensible Markup Language 可扩展标记语言 概念:可扩展:xml中所有的标签都是自定义的.没有预定义的. 功能: 存储数据 ...
- Razor标记语言介绍
什么是Razor? Razor的中文意思是"剃刀",它不是编程语言,只是一种服务器段的标记语言,与PHP和ASP类似 Razor允许你向网页中嵌入基于服务器的代码(Visu ...
- html标记语言 --格式标记
html标记语言 --格式标记 一.格式标记 1.<br>单标记,强制换行标记,让后面的文字.图片.表格等显示在下一行 2.<p>换段落标记 3.<center>居 ...
- java XML(可扩展标记语言)
XML 是EXtensible Markup Language的缩写,它是一种类似于HTML的标记语言,称为可扩展标记语言,传输数据而不是显示数据,可以自定义标签,具有自我描述性是一种通用的数据交换格 ...
- 模型标准化——预测模型标记语言(PMML)
https://www.cnblogs.com/pinard/p/9220199.html 在机器学习用于产品的时候,我们经常会遇到跨平台的问题.比如我们用Python基于一系列的机器学习库训练了一个 ...
- 理解Xaml标记语言
理解XAML XAML基于XAML,因而具有与XAML相似的特性.在XAMl中,同样必须区分大小写,但是Xaml以.xaml作为扩展名,表示这是一个应用程序的标记扩展文件.WPF中的XAML主要用于创 ...
- [Markdown]纯文本标记语言MarkdowPad2--MD语法知识
##1.标题 代码 注:# 后面保持空格 # h1 ## h2 ### h3 #### h4 ##### h5 ###### h6 ####### h7 // 错误代码 ######## h8 // ...
随机推荐
- Linux配置yum源(离线和在线)
配置yum源有2种方法,一种是离线yum源,另外一种是在线yum源. 一.离线yum源,基于安装光盘提供的安装仓库. 建立一个属于仓库文件夹 mkdir /media/zidong cd /media ...
- 细谈 Java 匿名内部类 【分别 使用 接口 和 抽象类实现】
1.前言 匿名内部类是什么东西? 没有名字的内部类就是匿名内部类. 什么场景使用? 匿名内部类适合创建那种只需要一次使用的类. 这是个很有用的东西,可想而知,如果不使用匿名内部类,哪些只需要使用一次的 ...
- vue爬坑之路(axios 封装篇)
第一步还是先下载axios cnpm install axios -S第二步建立一个htttp.js import axios from 'axios'; import { Message } fro ...
- PingFang(苹方)字体的引用
原文 链接:https://pan.baidu.com/s/1rw39Yqo9fv9BYz_JZ5lyRw 提取码:o7kf 苹方-简 常规体 font-family: pingFangSC-Regu ...
- MongoDB-基础知识学习(一)
概述 最近mongodb在互联网的活跃度直线上升,并且我们公司也使用了mongoDB 3.6 作为生产重要的数据库,我们项目组要监控mongodb的op.log日志,在此整理以前学习的知识,为以后备份 ...
- 封装OCX
封装OCX的办法有2种: 1. 使用C++的MFC activex项目生成OCX 2. 使用C#的用户控件生成OCX(.net core好像不支持) 注意:以管理员身份运行Visual Studio ...
- 508. Most Frequent Subtree Sum
Given the root of a tree, you are asked to find the most frequent subtree sum. The subtree sum of a ...
- C++11之future(二)
如果有两个线程,其中一个线程想要获取另一个线程的返回值,该怎么办? 于是接下来要谈的package_task就是为了解决这个问题而诞生的. // ConsoleApplication5.cpp : 定 ...
- 聊一聊如何用C#轻松完成一个SAGA分布式事务
背景 银行跨行转账业务是一个典型分布式事务场景,假设 A 需要跨行转账给 B,那么就涉及两个银行的数据,无法通过一个数据库的本地事务保证转账的 ACID ,只能够通过分布式事务来解决. 市面上使用比较 ...
- Android开发----EditText&ImageView&第三方库的加载
EditText组件 一个实例描述该组件的全部属性(虚假的登录界面) 在activity.xml中 <?xml version="1.0" encoding="ut ...