条件随机场_CRF
无向图
举例:“Bob drank coffee at Starbucks”
标记方式1:(名词,动词,名词,介词,名词) 称为l
标记方式2:(名词,动词,动词,介词,名词)
挑选出一个最靠谱的:
我们给每一个标注序列打分,打分越高代表这个标注序列越靠谱,如,凡是标注中出现了动词后面还是动词的标注序列,要给它负分!!
上面所说的动词后面还是动词就是一个特征函数,我们可以定义一个特征函数集合,用这个集合来为一个标注序列打分,并据此选出最靠谱的标注序列。
每一个特征函数都可以用来为一个标注序列评分,把集合中所有特征函数对同一个标注序列的评分综合起来,就是这个标注序列最终的评分值。
定义特征函数:
S:句子S
i: 句子中的第i个单词
L_i:标注序列第i个单词标注的结果【B首部 / M 内部 / E 尾部/S 单独/ O 不是地理命名实体]
L_i-1:标注序列第i个单词标注的结果
输出值;1标识评分标准符合这个特征
过程:
(1) 给每个特征函数 f_j 赋予一个权重 λ_j
(2)句子对应的标记序列为l,得分函数为:
Score(L/s)=Σj Σi λj fj ( s,i,Li,Li-1 )(函数函数 j=1....m, 单词数量 i=1....n)
[外面求和是用来求每个特征函数的评分值,里面求和是每个位置单词的特征值]
(3) 对分数进行指数化和标准化
P(L/s)=exp(Score(L/s)) /ΣL' exp(Score(L'/s))
图结构:
线性链条随机磁场:Oi不仅考虑上一状态Oi-1,还考虑下一装填Oi+1
λ代表输入的词,O代表标签
状态变量 O0-------O1------O2------On
↓ ↓ ↓ ↓
↓ ↓ ↓ ↓
观测变量 λ0 λ1 λ2 λn
推理:
(1)利用贝叶斯公式 P(O/ λ)=P( λ/O) *P(O) / P( λ)
(2) P( λ/O) = P( λ1/O1) * P( λ2/O2).........*P( λn/On)
P(O)=P(O1) *P(O2/O1) *P(O3/O2)......*P(On/On-1)
(3)P( λ/O) *P(O) =P(O1)* P( λ1/O1) *P(O2/O1) * P( λ2/O2) *P(O3/O2)..... P( λn/On)*P(On/On-1)
=P(O1)* Π P(Oi / Oi-1* P(λi/ Oi)
条件随机场_CRF的更多相关文章
- 【NLP】前戏:一起走进条件随机场(一)
前戏:一起走进条件随机场 作者:白宁超 2016年8月2日13:59:46 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务中都有 ...
- 【NLP】条件随机场知识扩展延伸(五)
条件随机场知识扩展延伸 作者:白宁超 2016年8月3日19:47:55 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务中都有应 ...
- 条件随机场(CRF) - 2 - 定义和形式(转载)
转载自:http://www.68idc.cn/help/jiabenmake/qita/20160530618218.html 参考书本: <2012.李航.统计学习方法.pdf> 书上 ...
- 条件随机场(CRF) - 1 - 简介(转载)
转载自:http://www.68idc.cn/help/jiabenmake/qita/20160530618222.html 首先我们先弄懂什么是"条件随机场",然后再探索其详 ...
- 条件随机场matlab程序下载
19:44:23 1 http://www.cs.ubc.ca/~murphyk/Software/CRF/crf.html matlab程序包: 该条件随机场程序(CRF)是针对语句进行标注,mat ...
- CRF条件随机场简介
CRF(Conditional Random Field) 条件随机场是近几年自然语言处理领域常用的算法之一,常用于句法分析.命名实体识别.词性标注等.在我看来,CRF就像一个反向的隐马尔可夫模型(H ...
- 条件随机场CRF简介
http://blog.csdn.net/xmdxcsj/article/details/48790317 Crf模型 1. 定义 一阶(只考虑y前面的一个)线性条件随机场: 相比于最大熵模型的输 ...
- 条件随机场CRF(一)从随机场到线性链条件随机场
条件随机场CRF(一)从随机场到线性链条件随机场 条件随机场CRF(二) 前向后向算法评估观察序列概率(TODO) 条件随机场CRF(三) 模型学习与维特比算法解码(TODO) 条件随机场(Condi ...
- NLP —— 图模型(二)条件随机场(Conditional random field,CRF)
本文简单整理了以下内容: (一)马尔可夫随机场(Markov random field,无向图模型)简单回顾 (二)条件随机场(Conditional random field,CRF) 这篇写的非常 ...
随机推荐
- 1.5、CDH 搭建Hadoop在安装之前(定制安装解决方案)
Cloudera托管两种类型的软件存储库,您可以使用它们来安装诸如Cloudera Manager或CDH-parcel存储库和软件包存储库之类的产品. 在大多数情况下,这些存储库是有效的解决方案,但 ...
- STOP OUR NEGATIVE THOUGHTS
Do you ever feel like you're in over your head and at any moment you're going to burst? You're not a ...
- 更新linux下python版本
# 安装所有的开发工具包 yum groupinstall -y "Development tools" # 安装其它的必需包 yum install -y zlib-devel ...
- JMeter学习(三十六)发送HTTPS请求(转载)
转载自 http://www.cnblogs.com/yangxia-test Jmeter一般来说是压力测试的利器,最近想尝试jmeter和BeanShell进行接口测试.由于在云阅读接口测试的过程 ...
- Swagger2
参考文档:https://www.jianshu.com/p/5ae7267385b9 官网:https://swagger.io/ 注解参考:https://blog.csdn.net/weixin ...
- python学习day7 数据类型及内置方法补充
http://www.cnblogs.com/linhaifeng/articles/7133357.html#_label4 1.列表类型 用途:记录多个值(一般存放同属性的值) 定义方法 在[]内 ...
- 【OpenGL】glsl、glew、glfw
glsl: OpenGL着色语言(OpenGL Shading Language)是用来在OpenGL中着色编程的语言,也即开发人员写的短小的自定义程序,他们是在图形卡的GPU (Graphic Pr ...
- python基础入门学习简单程序练习
1.简单的乘法程序 i = 256*256 print('The value of i is', i) 运行结果: The value of i is 65536 2.执行python脚本的两种方式 ...
- avcodec_decode_video2少帧问题
使用libav转码视频时发现一个问题:使用下面这段代码解码视频时,解码中会不时丢掉几帧. ){ ret = avcodec_decode_video2(video_dec_ctx, vframe, & ...
- LibreOJ 6277. 数列分块入门 1
题目链接:https://loj.ac/problem/6277 参考博客:https://www.cnblogs.com/stxy-ferryman/p/8547731.html 两个操作,区间增加 ...