Seq2SQL ：使用强化学习通过自然语言生成SQL

论文： https://einstein.ai/static/images/layouts/research/seq2sql/seq2sql.pdf

数据集：https://github.com/salesforce/WikiSQL

Seq2SQL属于natural language interface （NLI）的领域，方便普通用户接入并查询数据库中的内容，即用户不需要了解SQL语句，只需要通过自然语言，就可查询所需内容。

Seq2SQL借鉴的是Seq2Seq的思想，与Seq2Seq应用于机器翻译与Chatbot类似，Seq2SQL将输入的语句encode后再decode成结构化的SQL语言输出，强化学习是在Seq2SQL中的最后一个模块中应用。同时，这篇论文还推出一个数据集WikiSQL，数据集内有人工标注好的问句及其对应SQL语句。

试验结果显示，Seq2SQL的准确率也不是特别的高，只有60.3%

Seq2SQL结构：

Seq2SQL由三部分组成：

第一部分： Aggregation classifier 这一部分其实是一个分类器，将用户输入的语句分类成是select count/max/min 等统计相关的约束条件

在此处采用的Augmented Pointer Network，Augmented Pointer Network总体而言也是ecoder-to-decoder的结构，

encoder采用的是两层的bi-LSTM, decoder 采用的是两层的unidirectional LSTM，

encoder输出h，ht对应的是第t个词的输出状态

decoder的每一步是，输入y s-1，输出状态gs，接着，decoder为每个位置t生成一个attention的score

，最终生成

在Seq2SQL中，首先为input生成一个表征向量

（agg：aggregation clasifier， inp：input，enc:encoder）

首先为Augmented Pointer Network类似，计算出一个attention的分数，，

量化后，通过softmax函数

input的表征向量

通过一个多层的网络和softmax完成分类任务

，

第二部分： select column 这一部分是看用户输入的问句命中了哪个column

首先将每个column name 通过LSTM encode

将用户输入encode成与第一部分

类似的

最终通过一个多层的神经元和softmax确定是命中哪一行

第三部分：where clause 确定约束条件，因为最终生成的SQL可能与标注中的不太一样，但是依旧有一样的结果，所以不能像前两部分一样使用交叉熵作为loss训练，因此使用强化训练中reward函数 (g: ground-truth), loss使用梯度

WikiSQL：

WikiSQL包含一系列与SQL相关的问题集以及SQL table

null

Seq2SQL ：使用强化学习通过自然语言生成SQL的更多相关文章

强化学习（三）用动态规划（DP）求解
在强化学习(二)马尔科夫决策过程(MDP)中,我们讨论了用马尔科夫假设来简化强化学习模型的复杂度,这一篇我们在马尔科夫假设和贝尔曼方程的基础上讨论使用动态规划(Dynamic Programming, ...
【转载】 “强化学习之父”萨顿：预测学习马上要火，AI将帮我们理解人类意识
原文地址: https://yq.aliyun.com/articles/400366 本文来自AI新媒体量子位(QbitAI) ------------------------------- ...
ICML 2018 | 从强化学习到生成模型：40篇值得一读的论文
https://blog.csdn.net/y80gDg1/article/details/81463731 感谢阅读腾讯AI Lab微信号第34篇文章.当地时间 7 月 10-15 日,第 35 届 ...
(转) 深度强化学习综述：从AlphaGo背后的力量到学习资源分享（附论文）
本文转自:http://mp.weixin.qq.com/s/aAHbybdbs_GtY8OyU6h5WA 专题 | 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文) 原创 201 ...
强化学习7-Sarsa
之前讲到时序差分是目前主流强化学习的基本思路,这节就学习一下主流算法之一 Sarsa模型. Sarsa 是免模型的控制算法,是通过更新状态动作价值函数来得到最优策略的方法. 更新方法 Q(S,A)=Q ...
【转载】强化学习（三）用动态规划（DP）求解
原文地址: https://www.cnblogs.com/pinard/p/9463815.html ------------------------------------------------ ...
强化学习论文（Scalable agent alignment via reward modeling: a research direction）
原文地址: https://arxiv.org/pdf/1811.07871.pdf ======================================================== ...
深度强化学习资料（视频+PPT+PDF下载）
https://blog.csdn.net/Mbx8X9u/article/details/80780459 课程主页:http://rll.berkeley.edu/deeprlcourse/ 所有 ...
深度强化学习day01初探强化学习
深度强化学习基本概念强化学习强化学习(Reinforcement Learning)是机器学习的一个重要的分支,主要用来解决连续决策的问题.强化学习可以在复杂的.不确定的环境中学习如何实现我们设 ...

随机推荐

设计模式之Protocol实现代理模式
使用场合使用步骤不使用protocol实现代理使用protocol实现代理一.使用场合 A想让B帮忙,就让B代理 A想通知B发生了一些事情,或者传一些数据给B 观察者模式二.使用步骤定义一 ...
点击出现黑色背景的解决：-webkit-tap-highlight-color:rgba(0,0,0,0)
在手机上(iphone)点击按钮的时候,屏幕总会闪动一下,这让页面看起来很不友好也不流畅.解决方案加了一句css就解决了: -webkit-tap-highlight-color:rgba(0,0,0 ...
提升Web性能的技巧
1. 采用反向代理服务器(Reverse Proxy Server)来对应用进行加速和保护其作用主要在以下三方面: 负载平衡 – 运行在反向代理服务器上的负载平衡器会在不同的不服务器间进行传输 ...
easyui datagrid自己定义操作列
通过formatter方法给Jquery easyui 的datagrid 每行添加操作链接我们都知道Jquery的EasyUI的datagrid能够加入而且自己定义Toolbar. 这样我们选择一 ...
JavaScript 作用域链图具体解释
<script type="text/javascript"> /** * 作用域链: */ var a = "a"; function hao94 ...
spring中xml配置和autowired混用
1.类的混用: 配置文件中的配置: <bean id="a" class="com.ab.cc.A" /> 类中的配置 @Autowired A a ...
Github的基本功能：
作者:Fadeoc Khaos链接:http://www.zhihu.com/question/20070065/answer/30521531来源:知乎著作权归作者所有,转载请联系作者获得授权. G ...
【BZOJ4167】永远的竹笋采摘分块+树状数组
[BZOJ4167]永远的竹笋采摘题解:我们考虑有多少点对(a,b)满足a与b的差值是[a,b]中最小的.以为是随机数据,这样的点对数目可能很少,实测是O(n)级别的,那么我们已知了有这么多可能对答 ...
计算机网络 --万维网www
万维网是一个分布式的超媒体系统,客户程序向服务器程序发出请求,服务器程序向客户程序送回客户所需要的万维网文档.万维网必须解决的几个问题:1.怎样标志分布在整个因特网上的万维网文档?答:万维网使用统一的 ...
Vue知识随记
数据绑定内支持JavaScript表达式:string字符串反转用.隔开 js: msg:'Hello ' html: {{ msg.split('').reverse().join('.') }} ...

Seq2SQL ：使用强化学习通过自然语言生成SQL

Seq2SQL ：使用强化学习通过自然语言生成SQL的更多相关文章

随机推荐

热门专题