CRF基础知识以及如何实现Learning，Inference

CRF:Conditional Random Field，即条件随机场。

首先介绍一下基础背景知识。机器学习中的分类问题可以分为硬分类和软分类。硬分类常见的模型有SVM、PLA、LDA等。SVM可以称为max margin classifier，基于几何间隔进行分类。软分类一般分为logistic Regnesstion（概率判别模型）和 Naive Bayes（概率生成模型）。概率判别模型和概率生成模型的区别是，概率判别模型是对\(P\left ( y|x \right )\)进行建模，概率生成模型是对\(P\left ( x,y \right )\)进行建模。

1.概率生成模型

Naive即朴素贝叶斯假设，公式表示就是\(P\left ( x|y=y_{0} \right )= \prod_{i=1}^{p}P\left ( x_{i}|y=y_{0} \right )\),通俗的解释就是给定隐变量的条件下，观测变量之间相互独立，即\(x_{i}\perp x_{j}|y,i\neq j\)，如图1所示。当\(y\)被观测时，阻断了观测变量之间的路径。

当隐变量一个line的时候，就是HMM(Hidden markov model)模型，如图2所示。

如果大家有学过概率图模型的话，肯定知道有向图中的d-分离。通过有向图的独立性假设，我们可以非常直观的得到HMM的两大假设。即齐次Markov假设和观测独立假设。这两个假设的表达式分别为：

齐次Markov假设：\(P\left ( y_{t}|y_{1:t-1},x_{1:t-1} \right )= P\left ( y_{t}|y_{t-1} \right )\)

观测独立假设：\(P\left ( x_{t}|y_{1:t},x_{1:t-1} \right )= P\left ( x_{t}|y_{t} \right )\)

2.概率判别模型

比如最大熵模型，采用最大熵思想。比如：给定方差和均值，高斯分布熵最大。。

3.两者结合就出现了MEMM:Maximum Entropy Markov Model。这是一种概率判别模型。

进行独立性分析可以发现，该模型打破了HMM的观测独立假设，模型变得更加的合理了。比如，文本标注问题中，上下文对于标注会产生影响。

但是同样存在标注偏差问题，原因是局部归一化。John Lafferty的论文中讲解了该问题为什么存在。用一句话来概括就是：Conditional distribution with low entropy take less notice of observation.

4.Chain-structure CRF

该模型克服了标注偏差问题，CRF的模型如下图4所示，隐变量之间变为无向边，所以是全局归一化。

接下来会写如何利用CRF实现Learning、Inference等任务。

CRF基础知识以及如何实现Learning，Inference的更多相关文章

转载 Deep learning：一(基础知识_1)
前言: 最近打算稍微系统的学习下deep learing的一些理论知识,打算采用Andrew Ng的网页教程UFLDL Tutorial,据说这个教程写得浅显易懂,也不太长.不过在这这之前还是复习下m ...
Deep learning：一(基础知识_1)
本文纯转载: 主要是想系统的跟tornadomeet的顺序走一遍deeplearning; 前言: 最近打算稍微系统的学习下deep learing的一些理论知识,打算采用Andrew Ng的网页教程 ...
Deep Reinforcement Learning 基础知识
Introduction 深度增强学习Deep Reinforcement Learning是将深度学习与增强学习结合起来从而实现从Perception感知到Action动作的端对端学习的一种全新的算 ...
Deep Reinforcement Learning 基础知识（DQN方面）
Introduction 深度增强学习Deep Reinforcement Learning是将深度学习与增强学习结合起来从而实现从Perception感知到Action动作的端对端学习的一种全新的算 ...
关于图计算&图学习的基础知识概览：前置知识点学习（Paddle Graph Learning (PGL)）
关于图计算&图学习的基础知识概览:前置知识点学习(Paddle Graph Learning (PGL)) 欢迎fork本项目原始链接:关于图计算&图学习的基础知识概览:前置知识点学习 ...
PRML 基础知识
1 一个经典例子一个经典的例子就是Polynomial Curve Fitting问题,现在将以此为基础介绍一些基本概念和方法.该问题的主要思路是针对给定的训练集\(\mathbf{x}\equ ...
TFLite基础知识
此基础知识仅为个人学习记录,如有错误或遗漏之处,还请各位同行给个提示. 概述 TFLite主要含有如下内容: (1)TFLite提供一系列针对移动平台的核心算子,包括量化和浮点运算.另外,TFLite ...
C/C++ 基础知识
C/C++ 基础知识 C 语言优秀学习网站 [C Programming Language] C 语言的注释单行注释 /* comment goes here */ // comment goes ...
逻辑回归Logistic Regression 之基础知识准备
0. 前言这学期 Pattern Recognition 课程的 project 之一是手写数字识别,之二是做一个网站验证码的识别(鸭梨不小哇).面包要一口一口吃,先尝试把模式识别的经典问题—— ...

随机推荐

Sunday算法解决字符串匹配问题
概述提起字符串匹配可能更多人会想到KMP算法,该算法时间复杂度为O(m+n),而且也是我们在学习数据结构过程中最早接触到的比较好的算法.但KMP算法需要在模式字符串有关联的情况下,也即模式字符串前后 ...
nginx系列(七)静态文件合并combo
根据雅虎性能优化准则,可以将大量的小型JS文件进行合并,用来提高WEB服务器的性能.下面就是笔者的一个实践. 目前必须安装在1.4.+才可以官方:http://wiki.nginx.org/Http ...
从IL角度彻底理解回调_委托_指针
从IL角度彻底理解回调_委托_指针目录从IL角度彻底理解回调_委托_指针 1.创作此文的背景 1.1.委托能帮助代码更好地封装 1.2.委托能随时随地更方便地运行其他类中的方法 1.3.委托非常适 ...
虚拟机：主机能ping通虚拟机，虚拟机不可以ping通主机
解决办法: 1.虚拟机可使用nat模式 2.虚拟机使用桥接模式,并且和主机再同一个ip段内 3.主机的防火墙关闭(不推荐使用,主机不安全) 4.主机中有个ICMPv4-In这个规则需要启用: 打开防火 ...
【python练习册】1.3 将1.2题生成的n个激活码保存到mysql关系型数据库中
该题涉及到mysql中一些指令,先熟悉一下 MySQL指令参考:https://www.cnblogs.com/zhuyongzhe/p/7686105.html mysql -u root -p ...
[程序员代码面试指南]链表问题-将单链表的每k个节点之间逆序
题目描述给定一个单链表的表头节点head,实现一个调整单链表的函数,是的每k个节点之间逆序,如果最后不够k个节点一组,则不调整最后几个节点. 题解内部函数reverse实现链表beg到end的翻转 ...
升级微服务架构5：API网关
API网关是一个服务器,是系统的唯一入口.从面向对象设计的角度看,它与外观模式类似.API网关封装了系统内部架构,为每个客户端提供一个定制的API.它可能还具有其它职责,如身份验证.监控.负载均衡.缓 ...
HashTable学习
HashTable虽然加上了线程安全,但是源码走向和思想比hashMap还是要简单直白很多,hashmap还得再看,因为很多关键点没有get,下午&明天自己去debug一遍再继续看看博客脑子 ...
并发编程（四）Thread类详解
一.引言 Thread类中存在着许多操作线程的方法,学习Thread类是非常有必要的,前面我们也嘘唏了创建线程的几种方式,若线程的创建不是以继承Thread类的方式创建的,那我们又改如何使用Threa ...
ServletContex对象学习
问题: 不同的用户使用相同的数据解决: ServletContext对象特点: 服务器创建用户共享作用域: 整个项目内生命周期: 服务器启动到服务器关闭使用: 1.获取SercvletCo ...

CRF基础知识以及如何实现Learning，Inference

CRF基础知识以及如何实现Learning，Inference的更多相关文章

随机推荐

热门专题