预训练

预先训练

我们有两个相似的任务 A 和 B,任务 A 已经完成了得到了一个模型 A

任务 B(数据量小)

用到了一个特性:CNN 浅层参数通用

任务 B 就可以使用模型 A 的浅层参数,后面的参数通过任务 B 训练--》1. 冻结(浅层参数不变)2. 微调(变)

任务 B(大数据)可以训练出模型 B(我还可以使用模型 A 的浅层参数,节省训练时间,节省成本)

统计语言模型

语言模型

语言(人说的话)+模型(表示某个东西,完成某个任务)

  1. P(“判断这个词的词性”),P(“判断这个词的磁性”)
  2. “判断这个词的______

统计语言模型

用统计的方法去解决上述两个问题

“判断这个词的词性” = “判断”,“这个”,“词”,“的”,“词性”

这句话是序列(有顺序的)

用了一个条件概率的链式法则(概率论)

![image-20220611203051818](../../Library/Application Support/typora-user-images/image-20220611203051818.png)

通过这个法则,我们可以求出每一个词出现的概率,然后连乘,就是这句话出现的概率

解决第二个问题:

“判断这个词的__

P(w_next | “判断”,“这个”,“词”,“的”) (1)

词库(词典)V--》新华字典,高处一个集合,把所有词装到集合 V 里

把集合里的每一个词,都进行上一步(1)的计算

词库 V = { “词性”, “火星”}

P(词性| “判断”,“这个”,“词”,“的”)

P(火星| “判断”,“这个”,“词”,“的”)

P(词性| “判断”,“这个”,“词”,“的”,……, “……”)

![image-20220611203813910](../../Library/Application Support/typora-user-images/image-20220611203813910.png)

n 元统计语言模型

P(词性|“这个”,“词”,“的”)

P(火星| “这个”,“词”,“的”)

P(词性|“词”,“的”)

P(火星|“词”,“的”)

P(词性|“的”)

P(火星|“的”)

把 n 个词,取 2 个词(2 元),取 3 个词(3 元)

如何去计算

“词性是动词”
“判断单词的词性”
“磁性很强的磁铁”
“北京的词性是名词”

(词性|的) = \(\frac{cout(词性,的)}{count(的)}\) = \(\frac{2}{3}\)

平滑策略

P(策略|平滑) = \(\frac{0}{0}\)

![image-20220611204401168](../../Library/Application Support/typora-user-images/image-20220611204401168.png)

统计语言模型

语言模型:计算一句话的概率,计算下一个词可能是什么

统计语言模型:统计的方法去解决语言模型的问题(条件概率)

a 元语言模型:只取 a 个词(马尔科夫链)

平滑策略:

下节课:神经网络语言模型

统计语言模型:神经网络的方法去解决语言模型的问题

04 统计语言模型(n元语言模型)的更多相关文章

  1. language model —— basic model 语言模型之基础模型

    一.发展 起源:统计语言模型起源于 Ponte 和 Croft 在 1998年的 SIGIR上发表的论文 应用:语言模型的应用很多: corsslingual retrieval distribute ...

  2. N-gram统计语言模型(总结)

    N-gram统计语言模型 1.统计语言模型 自然语言从它产生開始,逐渐演变成一种上下文相关的信息表达和传递的方式.因此让计算机处理自然语言.一个主要的问题就是为自然语言这样的上下文相关特性建立数学模型 ...

  3. NLP(三)_统计语言模型

    概念 统计语言模型:是描述自然语言内在的规律的数学模型.广泛应用于各种自然语言处理问题,如语音识别.机器翻译.分词.词性标注,等等.简单地说,语言模型就是用来计算一个句子的概率的模型 即P(W1,W2 ...

  4. 语言模型(Language Modeling)与统计语言模型

    1. n-grams 统计语言模型研究的是一个单词序列出现的概率分布(probability distribution).例如对于英语,全体英文单词构成整个状态空间(state space). 边缘概 ...

  5. [IR课程笔记]统计语言模型

    Basic idea 1.一个文档(document)只有一个主题(topic) 2.主题指的是这个主题下文档中词语是如何出现的 3.在某一主题下文档中经常出现的词语,这个词语在这个主题中也是经常出现 ...

  6. Python并发编程04 /多线程、生产消费者模型、线程进程对比、线程的方法、线程join、守护线程、线程互斥锁

    Python并发编程04 /多线程.生产消费者模型.线程进程对比.线程的方法.线程join.守护线程.线程互斥锁 目录 Python并发编程04 /多线程.生产消费者模型.线程进程对比.线程的方法.线 ...

  7. BLEU (Bilingual Evaluation Understudy)

    什么是BLEU? BLEU (Bilingual Evaluation Understudy) is an algorithm for evaluating the quality of text w ...

  8. 机器翻译质量评测算法-BLEU

    机器翻译领域常使用BLEU对翻译质量进行测试评测.我们可以先看wiki上对BLEU的定义. BLEU (Bilingual Evaluation Understudy) is an algorithm ...

  9. python: 模型的统计信息

    /*! * * Twitter Bootstrap * */ /*! * Bootstrap v3.3.7 (http://getbootstrap.com) * Copyright 2011-201 ...

  10. [DeeplearningAI笔记]序列模型3.2有条件的语言模型与贪心搜索的不可行性

    5.3序列模型与注意力机制 觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.2选择最可能的句子 Picking the most likely sentence condition lan ...

随机推荐

  1. 【转载】 解决运行docker命令要用sudo的问题

    将当前登录的用户添加到docker组中,这样以后在访问docker时就不用在sudo了 1. 查看是否创建docker 组 cat /etc/group | grep docker 2.创建docke ...

  2. vscode配置docker插件

    参考: https://zhuanlan.zhihu.com/p/530413695 ================================================ 本文不对vsco ...

  3. 国产深度学习框架MindSpore的高校发展之旅——“样本点”计划

    MindSpore这个框架我是使用时间比较早的了,因为这是华为的产品,而且正好是我所在的领域,再加上前些年华为的那些爱国宣传,我是大力支持这个软件的,而且是非常支持的那种.虽然之前就知道华为的这个软件 ...

  4. Python-目标检测-将xml文件转换成.txt文件

    代码说明:labels文件夹是工程下的一个文件夹,里面存放的是一些xml文件. 然后我们将这些xml文件中的内容取出来,放在路径path1的文件名下.这样也就完成了xml文件到txt文件的转化. 该代 ...

  5. MFC制作带界面的DLL库

    ## MFC如何创建一个带界面的DLL(动态链接库) 1.创建项目 打开VS,文件->新建->项目: 点击确定之后弹出来的界面,点击下一步->选择"使用共享MFC DLL的 ...

  6. SCC缩点模板

    struct SCC { int top = 0, cntscc = 0, dfncnt = 0, n; vector<int> dfn, low, stk, instk; vector& ...

  7. 代码随想录Day15

    110.平衡二叉树 (优先掌握递归) 给定一个二叉树,判断它是否是 平衡二叉树 平衡二叉树 是指该树所有节点的左右子树的深度相差不超过 1. 示例 1: 输入:root = [3,9,20,null, ...

  8. grpc断路器之hystrix

    上一章介绍了grpc断路器sentinel, grpc断路器之sentinel 但是由于公司线上系统用的告警与监控组件是prometheus,而sentinel暂时还没有集成prometheus,所以 ...

  9. Notes for uc/OS-III User Guide

    1. Architecture F2-1(1) The application code consists of project or product files. For convenience, ...

  10. Cookie,Session Filter,Listener详解

    HTTP请求的无状态性 HTTP的无状态性是其一个重要的特征,指的是HTTP协议本身并不保留客户端与服务器交互的历史信息,换而言之,即每次的HTTP请求都是独立的,服务器在处理每一个请求时都不会记住前 ...