预训练

预先训练

我们有两个相似的任务 A 和 B,任务 A 已经完成了得到了一个模型 A

任务 B(数据量小)

用到了一个特性:CNN 浅层参数通用

任务 B 就可以使用模型 A 的浅层参数,后面的参数通过任务 B 训练--》1. 冻结(浅层参数不变)2. 微调(变)

任务 B(大数据)可以训练出模型 B(我还可以使用模型 A 的浅层参数,节省训练时间,节省成本)

统计语言模型

语言模型

语言(人说的话)+模型(表示某个东西,完成某个任务)

  1. P(“判断这个词的词性”),P(“判断这个词的磁性”)
  2. “判断这个词的______

统计语言模型

用统计的方法去解决上述两个问题

“判断这个词的词性” = “判断”,“这个”,“词”,“的”,“词性”

这句话是序列(有顺序的)

用了一个条件概率的链式法则(概率论)

![image-20220611203051818](../../Library/Application Support/typora-user-images/image-20220611203051818.png)

通过这个法则,我们可以求出每一个词出现的概率,然后连乘,就是这句话出现的概率

解决第二个问题:

“判断这个词的__

P(w_next | “判断”,“这个”,“词”,“的”) (1)

词库(词典)V--》新华字典,高处一个集合,把所有词装到集合 V 里

把集合里的每一个词,都进行上一步(1)的计算

词库 V = { “词性”, “火星”}

P(词性| “判断”,“这个”,“词”,“的”)

P(火星| “判断”,“这个”,“词”,“的”)

P(词性| “判断”,“这个”,“词”,“的”,……, “……”)

![image-20220611203813910](../../Library/Application Support/typora-user-images/image-20220611203813910.png)

n 元统计语言模型

P(词性|“这个”,“词”,“的”)

P(火星| “这个”,“词”,“的”)

P(词性|“词”,“的”)

P(火星|“词”,“的”)

P(词性|“的”)

P(火星|“的”)

把 n 个词,取 2 个词(2 元),取 3 个词(3 元)

如何去计算

“词性是动词”
“判断单词的词性”
“磁性很强的磁铁”
“北京的词性是名词”

(词性|的) = \(\frac{cout(词性,的)}{count(的)}\) = \(\frac{2}{3}\)

平滑策略

P(策略|平滑) = \(\frac{0}{0}\)

![image-20220611204401168](../../Library/Application Support/typora-user-images/image-20220611204401168.png)

统计语言模型

语言模型:计算一句话的概率,计算下一个词可能是什么

统计语言模型:统计的方法去解决语言模型的问题(条件概率)

a 元语言模型:只取 a 个词(马尔科夫链)

平滑策略:

下节课:神经网络语言模型

统计语言模型:神经网络的方法去解决语言模型的问题

04 统计语言模型(n元语言模型)的更多相关文章

  1. language model —— basic model 语言模型之基础模型

    一.发展 起源:统计语言模型起源于 Ponte 和 Croft 在 1998年的 SIGIR上发表的论文 应用:语言模型的应用很多: corsslingual retrieval distribute ...

  2. N-gram统计语言模型(总结)

    N-gram统计语言模型 1.统计语言模型 自然语言从它产生開始,逐渐演变成一种上下文相关的信息表达和传递的方式.因此让计算机处理自然语言.一个主要的问题就是为自然语言这样的上下文相关特性建立数学模型 ...

  3. NLP(三)_统计语言模型

    概念 统计语言模型:是描述自然语言内在的规律的数学模型.广泛应用于各种自然语言处理问题,如语音识别.机器翻译.分词.词性标注,等等.简单地说,语言模型就是用来计算一个句子的概率的模型 即P(W1,W2 ...

  4. 语言模型(Language Modeling)与统计语言模型

    1. n-grams 统计语言模型研究的是一个单词序列出现的概率分布(probability distribution).例如对于英语,全体英文单词构成整个状态空间(state space). 边缘概 ...

  5. [IR课程笔记]统计语言模型

    Basic idea 1.一个文档(document)只有一个主题(topic) 2.主题指的是这个主题下文档中词语是如何出现的 3.在某一主题下文档中经常出现的词语,这个词语在这个主题中也是经常出现 ...

  6. Python并发编程04 /多线程、生产消费者模型、线程进程对比、线程的方法、线程join、守护线程、线程互斥锁

    Python并发编程04 /多线程.生产消费者模型.线程进程对比.线程的方法.线程join.守护线程.线程互斥锁 目录 Python并发编程04 /多线程.生产消费者模型.线程进程对比.线程的方法.线 ...

  7. BLEU (Bilingual Evaluation Understudy)

    什么是BLEU? BLEU (Bilingual Evaluation Understudy) is an algorithm for evaluating the quality of text w ...

  8. 机器翻译质量评测算法-BLEU

    机器翻译领域常使用BLEU对翻译质量进行测试评测.我们可以先看wiki上对BLEU的定义. BLEU (Bilingual Evaluation Understudy) is an algorithm ...

  9. python: 模型的统计信息

    /*! * * Twitter Bootstrap * */ /*! * Bootstrap v3.3.7 (http://getbootstrap.com) * Copyright 2011-201 ...

  10. [DeeplearningAI笔记]序列模型3.2有条件的语言模型与贪心搜索的不可行性

    5.3序列模型与注意力机制 觉得有用的话,欢迎一起讨论相互学习~Follow Me 3.2选择最可能的句子 Picking the most likely sentence condition lan ...

随机推荐

  1. 【Java】实体类转换框架 MapStruct

    简单尝试了下发现比Dozer还有BeanUtil还方便小巧 注解的作用是在生成字节码文件时实现具体GetterSetter方法,实际转换时就是赋值操作,嘎嘎快 参考文章: https://juejin ...

  2. 【Java】Collection子接口:其二 Set 组接口

    Collection子接口:其二 Set 组接口 - Set接口是Collection的子接口,Set没有提供额外的方法 - Set集合中不允许包含重复的元素,如果重复添加,只保留最新添加的那一个 - ...

  3. 【Scala】05 对象特性Part2

    特质重复继承关系 父类特质 A 子类特质B 继承 A 子类特质C 继承A 类D 继承了 B 又实现了 C class D extends B with C 继承顺序是 D 继承 C 继承 B 继承 A ...

  4. 【转载】 固定随机种子比较强化学习算法——pytorch框架

    原文地址: https://www.cnblogs.com/lucifer1997/p/13801102.html ========================================== ...

  5. Vue Vine:带给你全新的 Vue 书写体验!

    你好,我是 Kagol,个人公众号:前端开源星球. 上个月和 TinyVue 的小伙伴们一起参加了 VueConf 24 大会,有幸认识沈青川大佬,并了解了他的 Vue Vine 项目,Vue Vin ...

  6. [COCI2015-2016#1] RELATIVNOST 题解

    前言 题目链接:洛谷. 这道题有很多做法,但是模拟赛寄了,故记之. Update on 2024.7.23 修复了一处时间复杂度的笔误. 题意简述 给你两个长为 \(n\) 的序列 \(A\) 和 \ ...

  7. WhaleStudio 2.6正式发布,WhaleTunnel同步性能与连接器数量再创新高!

    在这个数据驱动的大模型时代,数据集成的作用和意义愈发重要.数据不仅仅是信息的载体,更是推动企业决策和创新的关键因素.作为全球最流行的批流一体数据集成工具,WhaleTunnel随着WhaleStudi ...

  8. Linux系统中目录和文件夹是一个东西吗

    目录和文件夹的区别   在阐述Linux系统的目录前,我们先来回忆一下现实中的目录和文件夹是什么:   在现实中,文件夹(封套)可以用来保存几个文件(或其他项目).而目录则可以用来维护项目的索引,这样 ...

  9. bazel简介(二)——从makefile向bazel转变(使用genrule)

    0x01 背景 上篇中已经介绍了bazel的基本工作原理和相关的概念.这篇将继续介绍下,现有的makefile构建工程如何切换到bazel构建系统. bazel提供了丰富的扩展方式,当然也支持从目前的 ...

  10. redux开发中的一个小坑

    redux的actiontypes,不可以重名,重名将会报错 When called with an action of type "inserttoken", the slice ...