keras中的mask操作
使用背景
最常见的一种情况, 在NLP
问题的句子补全方法中, 按照一定的长度, 对句子进行填补和截取操作. 一般使用keras.preprocessing.sequence
包中的pad_sequences
方法, 在句子前面或者后面补0. 但是这些零是我们不需要的, 只是为了组成可以计算的结构才填补的. 因此计算过程中, 我们希望用mask
的思想, 在计算中, 屏蔽这些填补0值得作用. keras中提供了mask
相关的操作方法.
原理
在keras中, Tensor
在各层之间传递, Layer
对象接受的上层Layer
得到的Tensor
, 输出的经过处理后的Tensor
.
keras是用一个mask
矩阵来参与到计算当中, 决定在计算中屏蔽哪些位置的值. 因此mask
矩阵其中的值就是True/False
, 其形状一般与对应的Tensor
相同. 同样与Tensor
相同的是, mask
矩阵也会在每层Layer
被处理, 得到传入到下一层的mask
情况.
使用方法
最直接的, 在
NLP
问题中, 对句子填补之后, 就要输入到Embedding
层中, 将token
由id
转换成对应的vector
. 我们希望被填补的0值在后续的计算中不产生影响, 就可以在初始化Embedding
层时指定参数mask_zero
为True
, 意思就是屏蔽0值, 即填补的0值.在
Embedding
层中的compute_mask
方法中, 会计算得到mask
矩阵. 虽然在Embedding
层中不会使用这个mask
矩阵, 即0值还是会根据其对应的向量进行查找, 但是这个mask
矩阵会被传入到下一层中, 如果下一层, 或之后的层会对mask
进行考虑, 那就会起到对应的作用.也可以在
keras.layers
包中引用Masking
类, 使用mask_value
指定固定的值被屏蔽. 在调用call
方法时, 就会输出屏蔽后的结果.需要注意的是
Masking
这种层的compute_mask
方法, 源码如下:def compute_mask(self, inputs, mask=None):
output_mask = K.any(K.not_equal(inputs, self.mask_value), axis=-1)
return output_mask
可以看到, 这一层输出的
mask
矩阵, 是根据这层的输入得到的, 具体的说是会比输入第一个维度, 这是因为最后一个维度被K.any(axis=-1)
给去掉了. 在使用时需要注意这种操作的意义以及维度的变化.
自定义使用方法
更多的, 我们还是在自定义的层中, 需要支持mask
操作, 因此需要对应的逻辑.
首先, 如果我们希望自定义的这个层支持mask
操作, 就需要在__init__
方法中指定:
self.supports_masking = True
如果在本层计算中需要使用到mask
, 则call
方法需要多传入一个mask
参数, 即:
def call(self, inputs, mask=None):
pass
然后, 如果还要继续输出mask, 供之后的层使用, 如果不对mask
矩阵进行变换, 这不用进行任何操作, 否则就需要实现compute_mask
函数:
def compute_mask(self, inputs, mask=None):
pass
这里的inputs
就是输入的Tensor
, 与call
方法中接收到的一样, mask
就是上层传入的mask
矩阵.
如果希望mask
到此为止, 之后的层不再使用, 则该函数直接返回None
即可:
def compute_mask(self, inputs, mask=None):
return None
参考资料
Keras自定义实现带masking的meanpooling层
keras中的mask操作的更多相关文章
- keras中的loss、optimizer、metrics
用keras搭好模型架构之后的下一步,就是执行编译操作.在编译时,经常需要指定三个参数 loss optimizer metrics 这三个参数有两类选择: 使用字符串 使用标识符,如keras.lo ...
- keras中自定义Layer
最近在学习SSD的源码,其中有两个自定的层,特此学习一下并记录. import keras.backend as K from keras.engine.topology import InputSp ...
- 深度学习基础系列(十一)| Keras中图像增强技术详解
在深度学习中,数据短缺是我们经常面临的一个问题,虽然现在有不少公开数据集,但跟大公司掌握的海量数据集相比,数量上仍然偏少,而某些特定领域的数据采集更是非常困难.根据之前的学习可知,数据量少带来的最直接 ...
- OpenCV计算机视觉学习(2)——图像算术运算 & 掩膜mask操作(数值计算,图像融合,边界填充)
在OpenCV中我们经常会遇到一个名字:Mask(掩膜).很多函数都使用到它,那么这个Mask到底是什么呢,下面我们从图像基本运算开始,一步一步学习掩膜. 1,图像算术运算 图像的算术运算有很多种,比 ...
- 关于JavaScript中的delete操作
关于JavaScript中的delete操作 看到一道题,是这样的: (function(x){ delete x; return x; })(1); 1 null undefined Error 我 ...
- 理解CSV文件以及ABAP中的相关操作
在很多ABAP开发中,我们使用CSV文件,有时候,关于CSV文件本身的一些问题使人迷惑.它仅仅是一种被逗号分割的文本文档吗? 让我们先来看看接下来可能要处理的几个相关组件的词汇的语义. Separat ...
- 第32课 Qt中的文件操作
1. Qt的中IO操作 (1)Qt中IO操作的处理方式 ①Qt通过统一的接口简化了文件和外部设备的操作方式 ②Qt中的文件被看作一种特殊的外部设备 ③Qt中的文件操作与外部设备的操作相同 (2)IO操 ...
- 【Java EE 学习 33 上】【JQuery样式操作】【JQuery中的Ajax操作】【JQuery中的XML操作】
一.JQuery中样式的操作 1.给id=mover的div采用属性增加样式.one $("#b1").click(function(){ $("#mover" ...
- 【Java EE 学习 32 下】【JQuery】【JQuey中的DOM操作】
一.JQuery中的DOM操作. 什么是DOM:DOM是一中和浏览器.平台.语言无关的接口,使用该接口可以轻松访问页面中所有的标准组件.DOM简称文档对象模型,是Document Oject Mode ...
随机推荐
- git 生成并添加 SSH key
git config --global user.name "wangjunqiang" git config --global user.email "wangjunq ...
- cinder migrate基础内容-源码分析
一.cinder-api服务入口 D:\code-program\cinder-codejuno\api\contrib\admin_actions.py from cinder import vol ...
- 基于 abp vNext 微服务开发的敏捷应用构建平台 - 设计构想
许多中小企业的管理模式都是在自身的发展过程中不断摸索,逐步建立起来的,每一家都有其独有的管理模式,而且随着企业的不断发展,管理模式也在不断变化中.企业在发展壮大的过程中离不开信息化系统的支撑,企业在构 ...
- 5. java 的类和对象
1.什么是类 类 :是一组相关属性和行为的集合.可以看成是一类事物的模板,使用事物的属性特征和行为特征来描述该类事物.现实中,描述一类事物:属性 :就是该事物的状态信息.行为 :就是该事物能够做什么. ...
- akka-grpc - 应用案例
上期说道:http/2还属于一种不算普及的技术协议,可能目前只适合用于内部系统集成,现在开始大面积介入可能为时尚早.不过有些项目需求不等人,需要使用这项技术,所以研究了一下akka-grpc,写了一篇 ...
- express-session中的saveUninitialized和resave
app.use(session({ name: config.session.name, secret: config.session.secret, resave: true, saveUninit ...
- 深度优先搜索(DFS)解题总结
定义 深度优先搜索算法(Depth-First-Search),是搜索算法的一种.它沿着树的深度遍历树的节点,尽可能深的搜索树的分支. 例如下图,其深度优先遍历顺序为 1->2->4-&g ...
- [ASP.NET Core开发实战]基础篇06 配置
配置,是应用程序很重要的组成部分,常常用于提供信息,像第三方应用登录钥匙.上传格式与大小限制等等. ASP.NET Core提供一系列配置提供程序读取配置文件或配置项信息. ASP.NET Core项 ...
- PHP 日期与时间函数详解
在开发过程中,我们经常碰到日期与时间戳相关的功能,今天趁此机会做个详细笔记. date_default_timezone_set('PRC'); /*把时间调到北京时间,php5默认为格林威治标准时间 ...
- 《52讲轻松搞定网络爬虫》读书笔记 - Session和Cookie
为什么要用Session和Cookie? 简单一句话,因为Session和Cookie可以记录用户状态信息 嘶..这到底啥意思呢? 背景一:动态网页的出现 什么是静态网页 含义:一个网页的内容是HTM ...