【NLP_Stanford课堂】语言模型2

A_Present 2024-10-26 02:00:28 原文

一、如何评价语言模型的好坏

　　标准：比起语法不通的、不太可能出现的句子，是否为“真实”或"比较可能出现的”句子分配更高的概率

　　过程：先在训练数据集上训练模型的参数，然后在测试数据集上测试模型的效果。

　　要求：测试数据集与训练数据集完全不同

　　评价指标：用以评价模型的测试数据集上的效果

二、N-gram 模型的外部评测

1. 比较两个模型最好的评价方法：

将两个模型A和B应用于同一个任务：拼写检查、语音识别、机器翻译等
运行这个任务，分别得到A和B的准确性：有多少个拼写错误的单词被恰当的纠正了？或者有多少单词被准确翻译了？
比较A和B的准确率，哪个更高，哪个模型就更好

2. 难点

非常耗时，可能需要好几天甚至几个星期

三、N-gram 模型的内部评测

由于外部评测会非常耗时，所以我们有时候采用内部评测，也就是perplexity，其不需要任何其他的应用，只依赖于模型本身。

但是perlexity对于外部评测来说非常不好，除非测试数据跟训练数据非常相似，所以其一般只适用于预实验（中间实验）。

例1：预测下一个单词时，模型的表现如何？

当要求预测以上内容时，一个好的模型应该给实际上出现的答案分配更高的概率。

发现：unigrams在这个任务上非常不好。

一个最好的模型应该是能在非可见的测试数据集上预测最准的那个模型，即在给出的所有句子的概率中正确的句子的概率最高。

定义：Perplexity是测试数据集上的概率矩阵，并用来单词数做了归一化

要求：最小化perplexity，即PP(W)。实质上，跟要求最大化概率是一样的。

例2：识别数字‘0,1,2,3,4,5,6,7,8,9’有多难？

比如以上这个任务的perplexity就是10

定义：Perplexity是带权重的分支因子。

验证：

假定有一个句子是由N个随机数字组成，每个数字的概率是1/10，那么

【NLP_Stanford课堂】语言模型2的更多相关文章

【NLP_Stanford课堂】语言模型3
一.产生句子方法:Shannon Visualization Method 过程:根据概率,每次随机选择一个bigram,从而来产生一个句子比如: 从句子开始标志的bigram开始,我们先有一个( ...
【NLP_Stanford课堂】语言模型1
一.语言模型旨在:给一个句子或一组词计算一个联合概率作用: 机器翻译:用以区分翻译结果的好坏拼写校正:某一个拼错的单词是这个单词的概率更大,所以校正语音识别:语音识别出来是这个句子的概率更大 ...
【NLP_Stanford课堂】语言模型4
平滑方法: 1. Add-1 smoothing 2. Add-k smoothing 设m=1/V,则有从而每一项可以跟词汇表的大小相关 3. Unigram prior smoothing 将上 ...
【NLP_Stanford课堂】文本分类1
文本分类实例:分辨垃圾邮件.文章作者识别.作者性别识别.电影评论情感识别(积极或消极).文章主题识别及任何可分类的任务. 一.文本分类问题定义: 输入: 一个文本d 一个固定的类别集合C={c1,c2 ...
【NLP_Stanford课堂】拼写校正
在多种应用比如word中都有拼写检查和校正功能,具体步骤分为: 拼写错误检测拼写错误校正: 自动校正:hte -> the 建议一个校正建议多个校正拼写错误类型: Non-word Err ...
【NLP_Stanford课堂】情感分析
一.简介实例: 电影评论.产品评论是positive还是negative 公众.消费者的信心是否在增加公众对于候选人.社会事件等的倾向预测股票市场的涨跌 Affective States又分为: ...
【NLP_Stanford课堂】文本分类2
一.实验评估参数实验数据本身可以分为是否属于某一个类(即correct和not correct),表示本身是否属于某一类别上,这是客观事实:又可以按照我们系统的输出是否属于某一个类(即selecte ...
【NLP_Stanford课堂】最小编辑距离
一.什么是最小编辑距离最小编辑距离:是用以衡量两个字符串之间的相似度,是两个字符串之间的最小操作数,即从一个字符转换成另一个字符所需要的操作数,包括插入.删除和置换. 每个操作数的cost: 每个操 ...
【NLP_Stanford课堂】句子切分
依照什么切分句子——标点符号无歧义的:!?等存在歧义的:. 英文中的.不止表示句号,也可能出现在句子中间,比如缩写Dr. 或者数字里的小数点4.3 解决方法:建立一个二元分类器: 检查“.” 判断 ...

随机推荐

一篇在一个Excel表中创建多个sheet的代码
package projectUtil; import org.apache.commons.lang3.StringUtils; import org.apache.poi.hssf.usermod ...
springboot 接口返回数据时 net.sf.json.JSONNull["empty"]) 异常
@ResetController返回数据时出现异常 Could not write JSON: Object is null; nested exception is com.fasterxml.ja ...
透视效果shader（边缘光）
思路:渲染两次. 1.第一次渲染:利用Greater进行深度测试,当目标被遮挡时,用一个边缘光的效果显示. 2.第二次渲染:正常渲染. 边缘光的思路:观察方向和顶点法向量夹角越大,边缘光越明显.边缘光 ...
DataAdapter对象
DataAdapter对象在物理数据库表和内存数据表(结果集)之间起着桥梁的作用.它通常与DataTable对象或DataSet对象配合来实现对数据库的操作. DataAdapter对象是一个双向通道 ...
转 linux 内存释放
原文 http://blog.zol.com.cn/2322/article_2321774.html #cat /proc/meminfo | grep "MemFree" | ...
CentOS7下Django安装
Django安装介绍安装环境: CentOS7 安装Django比较简单,但需要安装其依赖的东西,还是需要一定时间的.我使用的环境是CentOS Linux release 7.3.1611. 内核 ...
JavaScript中类型检测
文章首发: http://www.cnblogs.com/sprying/p/4349426.html 本文罗列了一般Js类型检测的方法,是构建Js知识体系的一小块,这篇文章是我很早之前总结的. 一. ...
.netCore2.0 WebApi 传递form表单
随着it的技术发展,目前越来越多的项目采用前后端分离的开发模式,通过webapi提供接口数据来进行交互最近项目用的是.netCore WebApi,在最近的项目使用中发现一些问题,进行记录.个人简介 ...
plpgsql 函数定义
--Function: dbo.fn_test(integer) --DROP FUNCTION dbo.fn_test(integer); CREATE OR REPLACE FUNCTION db ...
C++Array类模板编写笔记
C++Array类模板函数模板和类模板都属于泛型技术,利用函数模板和类模板来创建一个具有通用功能的函数和类,以支持多种不同的形参,从而进一步简化重载函数的函数体设计. 声明方法:template&l ...