概率生成函数(PGF)简记
基本搬运自《浅谈生成函数在掷骰子问题上的应用》。
对于定义在非负整数上的离散随机变量 \(X\),级数 \(F(z) = \sum\limits_{i\ge 0} \operatorname{Pr}(X=i) z^i\) 记为 \(X\) 的概率生成函数(PGF),本质上是有特殊性质的普通型生成函数。概率生成函数在一方面提供了一种刻画概率相关模型的工具,另一方面比较形式化地总结了一类概率问题的一般性思路。
一些性质
\(F(1) = \sum\limits_{i\ge 0} \operatorname{Pr}(X=i) = 1\)
显然。
\(F^{\prime}(1) = \sum\limits_{i\ge 0} i\operatorname{Pr}(X=i) = E(X)\)
显然。类似的可以得出 \(F^{(k)}(1) = E(x^{\underline{k}})\)。
\(F^{\prime\prime}(1) + F^{\prime}(1) - (F^{\prime}(1))^2 = \bigg(\sum\limits_{i\ge 0}i^2\operatorname{Pr}(X=i)\bigg) - \bigg(\sum\limits_{i\ge 0} i\operatorname{Pr}(X=i)\bigg)^2 = \sigma^2(X)\)
其中 \(\sigma^2(X)\) 表示 \(X\) 的方差,定义为 \(\sigma^2(X) = E\big((x-E(x))^2\big)=E(x^2)-E^2(x)\)。这一条不常用到。
这一类性质基本在期望问题时用到,核心思路是利用题目性质列出 PGF 或其导数的方程,代入 \(z=1\) 解出得到答案。
论文涉及了许多例题,但本质基本相同,只要理解了方法也不难独立推导出。在这里记录一些比较有代表性的题目。
[CTSC2006]歌唱王国
给定一个长度为 \(L\) 的序列 \(A\)。然后每次掷一个标有 \(1\) 到 \(m\) 的公平骰子并将其上的数字加入到初始为空的序列 \(B\) 的末尾,如果序列 \(B\) 中已经出现了给定序列 \(A\) ,即 \(A\) 是 \(B\) 的子串,则停止,求序列 \(B\) 的期望长度。
记 \(a_i\) 表示 \([1,i]\) 是 \(A\) 的 border。记 \(f_i,g_i\) 表示 \(B\) 长度为 \(i\) 时,过程结束/未结束的方案数,其 PGF 分别为 \(F(z),G(z)\)。考虑随机加入一个字符,和钦定加入序列 \(A\) 之后的情况:
F(z) + G(z) &= zG(z)+1 \\
G(z)\bigg(\dfrac{z}{m}\bigg)^L &= \sum\limits_{i=1}^{L}a_iF(z)\bigg(\dfrac{z}{m}\bigg)^{L-i}
\end{align}
\]
其中第二个等式是由于我们可以从 border 处开始匹配。
将等式 \((1)\) 求导并代入 \(z=1\),得到
F^{\prime}(z) + G^{\prime}(z) &= zG^{\prime}(z) + G(z) \\
F^{\prime}(1) &= G(1)
\end{align}
\]
将 \(z=1\) 代入等式 \((2)\) 中可得
G(1)\bigg(\dfrac{1}{m}\bigg)^L &= \sum\limits_{i=1}^{L}a_iF(1)\bigg(\dfrac{1}{m}\bigg)^{L-i} \\
G(1) &= \sum\limits_{i=1}^La_im^i
\end{align}
\]
其中用到了 \(F(1)=1\)。至此我们已经可以高效且简洁的计算答案了。
[SDOI2017]硬币游戏]
给定 \(n\) 个长度分别为 \(L_i\) 的序列 \(A_i\),保证每个序列互不相同。再给出一个标有 \(1\) 到 \(m\) 的骰子,其中抛出 \(i\) 的概率为 \(P_i\)。然后每次抛一次骰子将骰子上的数字加入到初始为空的序列 \(B\) 末尾,如果给定的 \(n\) 个序列的其中一个是 \(B\) 的子串,则停止,这个序列获胜。求每个序列获胜的概率,并求结束时 \(B\) 长度的期望。
较原题有所改动,不影响解题。
上一题的拓展。类似上一题的思路,记 PGF \(F_i(z),G(z)\) 分别表示第 \(i\) 个串长度为 \(i\) 时获胜的 PGF、长度为 \(i\) 时未结束的 PGF,\(b_{i,j,k}\) 表示第 \(j\) 个串的 \([1,k]\) 和第 \(i\) 个串的 \([l_i-k+1,l_i]\) 相同。考虑随机加入一个字符,和加入一个目标串:
G(z)+\sum\limits_{i=1}^n F_i(z) &= zG(z)+1 \\
\forall i \in [1,n],\ G(z)\bigg(\dfrac{z}{m}\bigg)^{l_i} &= \sum\limits_{j=1}^{n}\sum\limits_{k=1}^{l_j}a_{i,j,k}F_j(z)\bigg(\dfrac{z}{m}\bigg)^{L-k}
\end{align}
\]
我们的目标是求每个 \(F_i(1)\)。照例求导并代入 \(z=1\):
\sum\limits_{i=1}^n{F_i}^{\prime}(1) &= G(1) \\
\forall i \in [1,n],\ G(1)\bigg(\dfrac{1}{m}\bigg)^{l_i} &= \sum\limits_{j=1}^{n}\sum\limits_{k=1}^{l_j}a_{i,j,k}F_j(1)\bigg(\dfrac{1}{m}\bigg)^{l_j-k}
\end{align}
\]
这样我们得到了关于 \(F_i(1)\) 和 \(G(1)\) 一共 \(n+1\) 个未知数的 \(n\) 个方程。发现 \(\sum\limits_{i=1}^nF_i(x)\) 即为随机序列长度的 PGF,于是得到最后一个方程
\]
高斯消元即可。
概率生成函数(PGF)简记的更多相关文章
- 洛谷 P4548 - [CTSC2006]歌唱王国(概率生成函数)
洛谷题面传送门 PGF 入门好题. 首先介绍一下 PGF 的基本概念.对于随机变量 \(X\),满足 \(X\) 的取值总是非负整数,我们即 \(P(v)\) 表示 \(X=v\) 的概率,那么我们定 ...
- 洛谷P3706 [SDOI2017]硬币游戏(概率生成函数+高斯消元)
题面 传送门 题解 不知道概率生成函数是什么的可以看看这篇文章,题解也在里面了 //minamoto #include<bits/stdc++.h> #define R register ...
- 洛谷P4548 [CTSC2006]歌唱王国(概率生成函数)
题面 传送门 给定一个长度为\(L\)的序列\(A\).然后每次掷一个标有\(1\)到\(m\)的公平骰子并将其上的数字加入到初始为空的序列\(B\)的末尾,如果序列B中已经出现了给定序列\(A\), ...
- 生成函数小结——[ EGF ][ ln 的一个套路 ][ 概率生成函数 ]
看了jcvb的WC2015交流课件.虽然没懂后面的复合逆部分,但生成函数感觉受益良多. 指数生成函数 集合中大小为 i 的对象的权值是 \( a_i \) ,该集合的生成函数是 \( \sum\lim ...
- 【题解】歌唱王国(概率生成函数+KMP)+伦讲的求方差
[题解]歌唱王国(概率生成函数+KMP)+伦讲的求方差 生成函数的本质是什么呀!为什么和It-st一样神 设\(f_i\)表示填了\(i\)个时候停下来的概率,\(g_i\)是填了\(i\)个的时候不 ...
- P4548-[CTSC2006]歌唱王国【概率生成函数,KMP】
正题 题目链接:https://www.luogu.com.cn/problem/P4548 题目大意 \(t\)次询问,给出一个长度为\(m\)的串\(S\)和一个空串\(T\),每次在\(T\)后 ...
- Luogu4548 CTSC2006 歌唱王国 概率生成函数、哈希
传送门 orz ymd 考虑构造生成函数:设\(F(x) = \sum\limits_{i=0}^\infty f_ix^i\),其中\(f_i\)表示答案为\(i\)的概率:又设\(G(x) = \ ...
- @loj - 2004@ 「SDOI2017」硬币游戏
目录 @description@ @solution@ @accepted code@ @details@ @description@ 周末同学们非常无聊,有人提议,咱们扔硬币玩吧,谁扔的硬币正面次数 ...
- 【BZOJ1152】歌唱王国(生成函数,KMP)
[BZOJ1152]歌唱王国(生成函数,KMP) 题面 BZOJ 洛谷 题解 根据\(YMD\)论文来的QwQ. 首先大家都知道普通型生成函数是\(\displaystyle \sum_{i=0}^{ ...
- 深度神经网络结构以及Pre-Training的理解
Logistic回归.传统多层神经网络 1.1 线性回归.线性神经网络.Logistic/Softmax回归 线性回归是用于数据拟合的常规手段,其任务是优化目标函数:$h(\theta )=\thet ...
随机推荐
- 【开源】基于.net6+gtksharp实现的Linux下的图形界面串口调试工具
背景 22年初从上家互联网公司离职以后,充分认识到互联网行业的风险,公司在没有自身稳定产品的情况下,互联网行业就是一个烧钱的行业,支出远远大于收入来源,上家公司就是如此,12年的公司转瞬间轰然倒地,1 ...
- Redis 如何批量设置过期时间?PIPLINE的使用
合理的使用缓存策略对开发同学来讲,就好像孙悟空习得自在极意功一般~ 抛出问题 Redis如何批量设置过期时间呢? 不要说在foreach中通过set()函数批量设置过期时间 给出方案 我们引入redi ...
- [常用工具] Caffe ssd常见问题集合
1 Check failed: a <= b <0 vs -1.19209e-007> 网上办法是注释掉 CHECK_LE(a, b),但是这样会出大问题.解决办法见2. 如果注释掉 ...
- Ajax+WCF+MySQL实现数据库部署并调用
最近的数据库课程要求将MySQL数据库部署在服务器上,参考了大佬们的博客后,总结一下. 先放上参考的大佬们的博客. [原创经验分享]JQuery(Ajax)调用WCF服务 - 南宫萧尘 - 博客园 ...
- python之路34 MySQL 2 配置文件 字段类型
字符编码与配置文件 1.\s查看MySQL相关信息 当前用户.版本.编码.端口号 MySQL5.6及之前的版本编码需要人为统一 之后的版本已经全部默认统一 如果想要永久修改编码配置 需要操作配置文件 ...
- 《深度探索C++对象模型》第六章 执行期语意学
new运算符和delete运算符 运算符new看似是一个简单的运算,比如: int *pi=new int(5); 但是它实际由两个步骤完成: 1.通过适当的new运算符函数实体,配置所需的内存: / ...
- Ansible 学习笔记 - 定位主机和组的模式
中英文对照表 英文 中文 备注 host 主机 group (主机)组 pattern 模式 ad hoc 特别命令 playbook 剧本 Ansible 专有名词,一段复杂的编排 inventor ...
- 聚合查询、分组查询、ORM中如何给表再次添加新的字段、F与Q查询、ORM查询优化、ORM事务操作、ORM常用字段类型、ORM常用字段参数、Ajax、数据编码格式(Content-Type)、ajax携带文件数据
今日内容 聚合查询 在ORM中支持单独使用聚合函数,需要使用aggregate方法. 聚合函数:Max最大.Min最小.Sum总和.Avg平均.count统计 from django.db.model ...
- Failed to find "GL/gl.h" in "/usr/include/libdrm"
环境qt5.12.3 deepin15.10 使用cmake构建项目时报错,网上查询了一下发现时未安装opengl,于是安装便是了 sudo apt install mesa-common-dev 问 ...
- chunjun同步两个带Kerberos认证的CDH集群数据
最近在项目中遇到同步两个 CDH 数据文件的需求,调研了一圈,发现 datax 不支持两个 cdh 同时进行 kerberos 认证,因此切换到 chunjun,chunjun 在 kerberos ...