无向图

举例:“Bob drank coffee at Starbucks”

标记方式1:(名词,动词,名词,介词,名词) 称为l

标记方式2:(名词,动词,动词,介词,名词)

挑选出一个最靠谱的:

我们给每一个标注序列打分,打分越高代表这个标注序列越靠谱,如,凡是标注中出现了动词后面还是动词的标注序列,要给它负分!!

上面所说的动词后面还是动词就是一个特征函数,我们可以定义一个特征函数集合,用这个集合来为一个标注序列打分,并据此选出最靠谱的标注序列。

每一个特征函数都可以用来为一个标注序列评分,把集合中所有特征函数对同一个标注序列的评分综合起来,就是这个标注序列最终的评分值。

定义特征函数:

S:句子S

i: 句子中的第i个单词

L_i:标注序列第i个单词标注的结果【B首部 / M 内部 / E 尾部/S 单独/ O 不是地理命名实体]

L_i-1:标注序列第i个单词标注的结果

输出值;1标识评分标准符合这个特征

过程:

(1) 给每个特征函数 f_j 赋予一个权重 λ_j

(2)句子对应的标记序列为l,得分函数为:

Score(L/s)=Σj Σi  λj   fj ( s,i,Li,Li-1 )(函数函数 j=1....m,   单词数量  i=1....n)

        [外面求和是用来求每个特征函数的评分值,里面求和是每个位置单词的特征值]

(3) 对分数进行指数化和标准化

P(L/s)=exp(Score(L/s)) /ΣL'  exp(Score(L'/s))

   

图结构:

线性链条随机磁场:Oi不仅考虑上一状态Oi-1,还考虑下一装填Oi+1

λ代表输入的词,O代表标签

状态变量   O0-------O1------O2------On

↓           ↓          ↓          ↓

↓           ↓          ↓          ↓

观测变量 λ0          λ1         λ2       λn

推理:

(1)利用贝叶斯公式 P(O/ λ)=P( λ/O) *P(O) / P( λ)

(2) P( λ/O) = P( λ1/O1) * P( λ2/O2).........*P( λn/On)

P(O)=P(O1) *P(O2/O1)  *P(O3/O2)......*P(On/On-1)

(3)P( λ/O) *P(O) =P(O1)*     P( λ1/O1) *P(O2/O1) * P( λ2/O2) *P(O3/O2).....  P( λn/On)*P(On/On-1)

=P(O1)*  Π P(Oi / Oi-1* P(λi/ Oi)

条件随机场_CRF的更多相关文章

  1. 【NLP】前戏:一起走进条件随机场(一)

    前戏:一起走进条件随机场 作者:白宁超 2016年8月2日13:59:46 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务中都有 ...

  2. 【NLP】条件随机场知识扩展延伸(五)

    条件随机场知识扩展延伸 作者:白宁超 2016年8月3日19:47:55 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务中都有应 ...

  3. 条件随机场(CRF) - 2 - 定义和形式(转载)

    转载自:http://www.68idc.cn/help/jiabenmake/qita/20160530618218.html 参考书本: <2012.李航.统计学习方法.pdf> 书上 ...

  4. 条件随机场(CRF) - 1 - 简介(转载)

    转载自:http://www.68idc.cn/help/jiabenmake/qita/20160530618222.html 首先我们先弄懂什么是"条件随机场",然后再探索其详 ...

  5. 条件随机场matlab程序下载

    19:44:23 1 http://www.cs.ubc.ca/~murphyk/Software/CRF/crf.html matlab程序包: 该条件随机场程序(CRF)是针对语句进行标注,mat ...

  6. CRF条件随机场简介

    CRF(Conditional Random Field) 条件随机场是近几年自然语言处理领域常用的算法之一,常用于句法分析.命名实体识别.词性标注等.在我看来,CRF就像一个反向的隐马尔可夫模型(H ...

  7. 条件随机场CRF简介

    http://blog.csdn.net/xmdxcsj/article/details/48790317 Crf模型 1.   定义 一阶(只考虑y前面的一个)线性条件随机场: 相比于最大熵模型的输 ...

  8. 条件随机场CRF(一)从随机场到线性链条件随机场

    条件随机场CRF(一)从随机场到线性链条件随机场 条件随机场CRF(二) 前向后向算法评估观察序列概率(TODO) 条件随机场CRF(三) 模型学习与维特比算法解码(TODO) 条件随机场(Condi ...

  9. NLP —— 图模型(二)条件随机场(Conditional random field,CRF)

    本文简单整理了以下内容: (一)马尔可夫随机场(Markov random field,无向图模型)简单回顾 (二)条件随机场(Conditional random field,CRF) 这篇写的非常 ...

随机推荐

  1. weblogic threadpool has stuck threads

    https://blog.csdn.net/wyx713510713/article/details/12705221 最近项目启动时出问题,weblogic的nohup日志文件中找到下面一段(红色部 ...

  2. php拓展

    https://github.com/phalcon/zephirhttp://blog.csdn.net/black_OX/article/details/43700707

  3. pta l3-20(至多删三个字符)

    题目链接:https://pintia.cn/problem-sets/994805046380707840/problems/994805046946938880 题意:给定一个长度<=106 ...

  4. while 解决 10000米绳子 对折当 绳长小于5米时求绳的对折次数

    public static void main(String args[]){ double length = 10000; int day = 0; while(day > 5){ lengt ...

  5. JS获取鼠标左(右)滑事件

    鼠标左(右)滑也是网站开发中常见的效果之一,这里对鼠标左(右)滑做出一些解释. 首先要获取需要左右滑事件的节点: eg: var div=document.getElementById("d ...

  6. synchronized细节问题(一)

    synchronized锁重入: 关键字synchronized拥有锁重入的功能,也就是在使用synchronized时,当一个线程得到一个对象的锁后,再次请求此对象时是可以再次得到该对象的锁. 下面 ...

  7. 明明白白你的Linux服务器——日志篇

    日志对于安全来说,非常重要,它记录了系统每天发生的各种各样的事情,你可以通过他来检查错误发生的原因,或者受到攻击时攻击者留下的痕迹.日志主要的功能有:审计和监测.他还可以实时的监测系统状态,监测和追踪 ...

  8. HDU 6315 Naive Operations(线段树区间整除区间)

    Problem DescriptionIn a galaxy far, far away, there are two integer sequence a and b of length n.b i ...

  9. VS unable to update auto-refresh path。。。。

    手工创建提示报错的路径,重新生成,成功

  10. os & sys

    os os.getcwd() 获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") 改变当前脚本工作目录:相当于shell下cd os.c ...