CRF keras代码实现

这份代码来自于苏剑林

# -*- coding:utf-8 -*-

from keras.layers import Layer

import keras.backend as K

class CRF(Layer):

    """纯Keras实现CRF层

    CRF层本质上是一个带训练参数的loss计算层，因此CRF层只用来训练模型，

    而预测则需要另外建立模型，但是还是要用到训练好的转移矩阵

    """

    def __init__(self, ignore_last_label=False, **kwargs):

        """ignore_last_label：定义要不要忽略最后一个标签，起到mask的效果

        """

        self.ignore_last_label = 1 if ignore_last_label else 0

        super(CRF, self).__init__(**kwargs)

    def build(self, input_shape):

        self.num_labels = input_shape[-1] - self.ignore_last_label

        self.trans = self.add_weight(name='crf_trans',

                                     shape=(self.num_labels, self.num_labels),

                                     initializer='glorot_uniform',

                                     trainable=True)

    def log_norm_step(self, inputs, states):

        """递归计算归一化因子

        要点：1、递归计算；2、用logsumexp避免溢出。

        技巧：通过expand_dims来对齐张量。

        """

        states = K.expand_dims(states[0], 2) # previous

        inputs = K.expand_dims(inputs, 2) # 这个时刻的对标签的打分值，Emission score

        trans = K.expand_dims(self.trans, 0) # 转移矩阵

        output = K.logsumexp(states+trans+inputs, 1) # e 指数求和，log是防止溢出

        return output, [output] 

    def path_score(self, inputs, labels):

        """计算目标路径的相对概率（还没有归一化）

        要点：逐标签得分，加上转移概率得分。

        技巧：用“预测”点乘“目标”的方法抽取出目标路径的得分。

        """

        # 在CRF中涉及到标签得分加上转移概率，而这个point score就是相当于是标签得分（在真是标签的情况下，查看预测对于真实标签位置的总得分），因为labels的shape是[B, T, N]，而在N这个维度是one-hot，

        # 这里再乘以pred，相当于是对labels存在1的地方进行打分，其余地方全为0，再进行第2个维度相加表示去除0的值，再相加表示求一个总的标签得分

        point_score = K.sum(K.sum(inputs*labels, 2), 1, keepdims=True) # 逐标签得分, shape [B, 1]

        labels1 = K.expand_dims(labels[:, :-1], 3) # shape [B, T-1, N, 1]

        labels2 = K.expand_dims(labels[:, 1:], 2) # shape [B, T-1, 1, N]

        # 这里相乘的目的相当于从上一时刻转移到当前时刻，确定当前时刻是从上一时刻哪一个标签转移过来的，因为labels是one-hot的形式，所以在最后两个维度只有1个元素为1，其他全部为0，表示转移标志

        labels = labels1 * labels2 # 两个错位labels，负责从转移矩阵中抽取目标转移得分 shape [B, T-1, N, N]

        trans = K.expand_dims(K.expand_dims(self.trans, 0), 0)

        # K.sum(trans*labels, [2, 3])，因为trans*labels的结果是[B, T-1, N, N], 而后面两个维度中只有1个有值，表示转移得分

        trans_score = K.sum(K.sum(trans*labels, [2, 3]), 1, keepdims=True) # 求出所有T-1时刻的概率转移总得分，K.sum(trans*labels, [2, 3]), 表示每个时刻的转移得分

        return point_score+trans_score # 两部分得分之和

    def call(self, inputs): # CRF本身不改变输出，它只是一个loss

        return inputs

    def loss(self, y_true, y_pred): # 目标y_pred需要是one hot形式

        mask = 1-y_true[:, 1:, -1] if self.ignore_last_label else None

        y_true, y_pred = y_true[:, :, :self.num_labels], y_pred[:, :, :self.num_labels]

        init_states = [y_pred[:, 0]] # 初始状态

        log_norm, _, _ = K.rnn(self.log_norm_step, y_pred[:, 1:], init_states, mask=mask) # 计算Z向量（对数） shape[batch_size, output_dim]

        log_norm = K.logsumexp(log_norm, 1, keepdims=True) # 计算Z（对数）shape [batch_size, 1] 计算一个总的

        path_score = self.path_score(y_pred, y_true) # 计算分子（对数）

        return log_norm - path_score # 即log(分子/分母)

    def accuracy(self, y_true, y_pred): # 训练过程中显示逐帧准确率的函数，排除了mask的影响

        mask = 1-y_true[:,:,-1] if self.ignore_last_label else None

        y_true,y_pred = y_true[:,:,:self.num_labels],y_pred[:,:,:self.num_labels]

        isequal = K.equal(K.argmax(y_true, 2), K.argmax(y_pred, 2))

        isequal = K.cast(isequal, 'float32')

        if mask == None:

            return K.mean(isequal)

        else:

            return K.sum(isequal*mask) / K.sum(mask)

CRF keras代码实现的更多相关文章

从 python 中 axis 参数直觉解释到 CNN 中 BatchNorm 的工作方式(Keras代码示意)
1. python 中 axis 参数直觉解释网络上的解释很多,有的还带图带箭头．但在高维下是画不出什么箭头的．这里阐述了 axis 参数最简洁的解释．假设我们有矩阵a, 它的shape是(4, ...
深度学习（七）U-Net原理以及keras代码实现医学图像眼球血管分割
原文作者:aircraft 原文链接:https://www.cnblogs.com/DOMLX/p/9780786.html DRIVE数据集下载百度云链接:链接:https://pan.baidu ...
大数据开发之keras代码框架应用
总体来讲keras这个深度学习框架真的很“简易”,它体现在可参考的文档写的比较详细,不像caffe,装完以后都得靠技术博客,keras有它自己的官方文档(不过是英文的),这给初学者提供了很大的学习空间 ...
Keras代码超详细讲解LSTM实现细节
1.首先我们了解一下keras中的Embedding层:from keras.layers.embeddings import Embedding: Embedding参数如下: 输入尺寸:(batc ...
条件随机场CRF原理介绍以及Keras实现
本文是对CRF基本原理的一个简明的介绍.当然,“简明”是相对而言中,要想真的弄清楚CRF,免不了要提及一些公式,如果只关心调用的读者,可以直接移到文末. 图示# 按照之前的思路,我们依旧来对比一下普通 ...
到底该如何入门Keras、Theano呢？（浅谈）
目前刚刚开始学习Theano,可以说是一头雾水,后来发现Keras是对Theano进行了包装,直接使用Keras可以减少很多细节程序的书写,它是模块儿化的,使用比较方便,但更为细节的内容,还没有理解, ...
Keras 学习之旅（一）
软件环境(Windows): Visual Studio Anaconda CUDA MinGW-w64 conda install -c anaconda mingw libpython CNTK ...
Inception模型和Residual模型卷积操作的keras实现
Inception模型和Residual残差模型是卷积神经网络中对卷积升级的两个操作. 一. Inception模型(by google) 这个模型的trick是将大卷积核变成小卷积核,将多个卷积核 ...
Keras官方中文文档：序贯模型
快速开始序贯(Sequential)模型序贯模型是多个网络层的线性堆叠,也就是"一条路走到黑". 可以通过向Sequential模型传递一个layer的list来构造该模型: f ...

随机推荐

《软件安装》VMware 安装 centos8
上期问题回顾搞技术的同学应该都听过docker,那么请问docker和虚拟机有什么区别呢? 传统的虚拟机架构是:物理机 -> 宿主机操作系统 -> Hypervisor支持 -> ...
阿里云ubuntu16.04搭建pptpd
一.搭建pptp vpn 需开放1723端口和gre协议 1.阿里云有个安全组需要开放端口才能访问,需添加新的安全组规则. 登陆阿里云服务器管理控制台,添加安全组规则入/出方向都填写端口范围为17 ...
闲话复数（1） | 不现实的虚数 i 为什么虚？它长成什么样？
原文 | https://mp.weixin.qq.com/s/y-Nb3S508UZuf_0GtRuNaQ 复数的英文是complex number,直译是复杂的数.最早接触复数大概是在高中时期,只 ...
Nginx + FastCGI + Django在windows上部署及nginx常用命令
一般应用都是部署在linux系统上,不会在windows上部署,emmm..所以有兴趣的就瞧瞧吧哈哈 nginx工作原理: nginx用于处理静态文件,动态部分经由fastcgi .scgi或uWSG ...
bzoj5093图的价值：多项式，斯特林数（二项式反演）
Description “简单无向图”是指无重边.无自环的无向图(不一定连通). 一个带标号的图的价值定义为每个点度数的k次方的和. 给定n和k,请计算所有n个点的带标号的简单无向图的价值之和. 因为 ...
使用vue-cli创建工程的时候提示vue-cli Failed to download repo vuejs-templates/webpack-simple:self signed certificate in certificate chain的解决方法
最近在使用 vue-cli 脚手架创建项目的时候,遇到 webpack-simple 模板下载不成功的情况,提示 vue-cli Failed to download repo vuejs-templ ...
16套java架构师，高并发，高可用，高性能，集群，大型分布式电商项目实战视频教程
16套Java架构师,集群,高可用,高可扩展,高性能,高并发,性能优化,设计模式,数据结构,虚拟机,微服务架构,日志分析,工作流,Jvm,Dubbo ,Spring boot,Spring cloud ...
Docker 镜像与容器
镜像和容器的关系容器提交 commint 作用: 根据容器生成一个新的镜像命令格式: docker commit [OPTIONS] CONTAIN ...
Prism_Commanding(2)
Commanding 除了提供对要在视图中显示或编辑的数据的访问之外,ViewModel还可能定义可由用户执行的一个或多个动作或操作.用户可以通过UI执行的动作或操作通常被定义为命令.命令提供了一种方 ...
Command CompileSwiftSources failed with a nonzero exit code
Xcode错误提示:Command CompileSwiftSources failed with a nonzero exit code,网上找了好多才搞定,通过在Build Setting里面自添 ...

CRF keras代码实现

CRF keras代码实现的更多相关文章

随机推荐

热门专题