???看不懂的期望DP

题目描述

小 K 不慎被 LL 邪教洗脑了,洗脑程度深到他甚至想要从亚瑟王邪教中脱坑。

他决定,在脱坑之前,最后再来打一盘亚瑟王。既然是最后一战,就一定要打得漂亮。众所周知,亚瑟王是一个看脸的游戏,技能的发动都是看概率的。作为一个非洲人,同时作为一个前 OIer,小 K 自然是希望最大化造成伤害的期望值。但他已经多年没写过代码,连 Spaly 都敲不对了,因此,希望你能帮帮小 K,让他感受一下当欧洲人是怎样的体验。

本题中我们将考虑游戏的一个简化版模型。

玩家有一套卡牌,共 \(n\) 张。游戏时,玩家将 \(n\) 张卡牌排列成某种顺序,排列后将卡牌按从前往后依次编号为 \(1\sim n\)。本题中,顺序已经确定,即为输入的顺序。

每张卡牌都有一个技能。第 \(i\) 张卡牌的技能发动概率为 \(p_i\),如果成功发动,则会对敌方造成 \(d_i\) 点伤害。也只有通过发动技能,卡牌才能对敌方造成伤害。基于现实因素以及小 K 非洲血统的考虑,\(p_i\) 不会为 0,也不会为 1,即 \(0<p_i<1\)。

一局游戏一共有 \(r\) 轮。在每一轮中,系统将从第一张卡牌开始,按照顺序依次考虑每张卡牌。在一轮中,对于依次考虑的每一张卡牌:

  1. 如果这张卡牌在这一局游戏中已经发动过技能,则

    1.1 如果这张卡牌不是最后一张,则跳过之(考虑下一张卡牌); 否则(是最后一张),结束这一轮游戏。
  2. 否则(这张卡牌在这一局游戏中没有发动过技能),设这张卡牌为第 \(i\) 张。

    2.1 将其以 \(p_i\) 的概率发动技能。

    2.2 如果技能发动,则对敌方造成 \(d_i\) 点伤害,并结束这一轮。

    2.3 如果这张卡牌已经是最后一张(即 \(i\) 等于 \(n\)),则结束这一轮;否则,考虑下一张卡牌。

请帮助小 K 求出这一套卡牌在一局游戏中能造成的伤害的期望值。

输入格式

输入文件的第一行包含一个整数 \(T\),代表测试数据组数。

接下来一共 \(T\) 组数据。

每组数据的第一行包含两个用空格分开的整数 \(n\) 和 \(r\),分别代表卡牌的张数和游戏的轮数。

接下来 \(n\) 行,每行包含一个实数和一个整数,由空格隔开,描述一张卡牌。第 \(i\) 行的两个数为 \(p_i\)​ 和 \(d_i\)​,分别代表第 \(i\) 张卡牌技能发动的概率(实数)和技能发动造成的伤害(整数)。保证 \(p_i\)​ 最多包含四位小数,且为一个合法的概率。

输出格式

对于每组数据,输出一行,包含一个实数,为这套卡牌在这一局游戏中造成的伤害的期望值。

对于每一行输出,只有当你的输出和标准答案的相对误差不超过 \(10^{-8}​\) 时——即 \(\frac{|a-o|}{a}\le 10^{-8}​\) 时 (其中 \(a​\) 是标准答案,\(o​\) 是输出),你的输出才会被判为正确。建议输出十位小数。

输入输出样例

输入样例:

1
3 2
0.5000 2
0.3000 3
0.9000 1

输出样例:

3.2660250000

样例解释:

一共有 \(13\) 种可能的情况:

  1. 第一轮中,第 \(1\) 张卡牌发动技能;第二轮中,第 \(2\) 张卡牌发动技能;概率为 ​\(0.15\),伤害为 \(5\)。
  2. 第一轮中,第 \(1\) 张卡牌发动技能;第二轮中,第 \(3\) 张卡牌发动技能;概率为 \(0.315\),伤害为 \(3\)。
  3. 第一轮中,第 \(1\) 张卡牌发动技能;第二轮不发动技能;概率为 \(0.035\),伤害为 \(2\)。
  4. 第一轮中,第 \(2\) 张卡牌发动技能;第二轮中,第 \(1\) 张卡牌发动技能;概率为 \(0.075\),伤害为 \(5\)。
  5. 第一轮中,第 \(2\) 张卡牌发动技能;第二轮中,第 \(3\) 张卡牌发动技能;概率为 \(0.0675\),伤害为 \(4\)。
  6. 第一轮中,第 \(2\) 张卡牌发动技能;第二轮不发动技能; 概率为 \(0.0075\),伤害为 \(3\)。
  7. 第一轮中,第 \(3\) 张卡牌发动技能;第二轮中,第 \(1\) 张卡牌发动技能;概率为 \(0.1575\),伤害为 \(3\)。
  8. 第一轮中,第 \(3\) 张卡牌发动技能;第二轮中,第 \(2\) 张卡牌发动技能;概率为 \(0.04725\),伤害为 \(4\)。
  9. 第一轮中,第 \(3\) 张卡牌发动技能;第二轮不发动技能; 概率为 \(0.11025\),伤害为 \(1\)。
  10. 第一轮不发动技能;第二轮中,第 \(1\) 张卡牌发动技能; 概率为 \(0.0175\),伤害为 \(2\)。
  11. 第一轮不发动技能;第二轮中,第 \(2\) 张卡牌发动技能; 概率为 \(0.00525\),伤害为 \(3\)。
  12. 第一轮不发动技能;第二轮中,第 \(3\) 张卡牌发动技能; 概率为 \(0.011025\),伤害为 \(1\)。
  13. 第一轮不发动技能;第二轮亦不发动技能; 概率为 \(0.001225\),伤害为 \(0\)。

造成伤害的期望值为概率与对应伤害乘积之和,为 \(3.266025\)。

数据范围与约定

对于所有测试数据, \(1\le T\le 444, \ 1\le n\le 220, \ 0\le r\le 132, \ 0<p_i<1, \ 0\le d_i\le 1000\)。

除非备注中有特殊说明,数据中 \(p_i\) 与 \(d_i\) 均为随机生成。

请注意可能存在的实数精度问题,并采取适当措施。

题解:

首先,如果直接一轮一轮地进行期望推导,会发现前面有冲突的情况。枚举第 \(i\) 轮第 \(j\) 张卡时既要保证前 \(i-1\) 轮都没有发动过第 \(j\) 张卡,又要保证第 \(i\) 轮没有发动过前 \(j-1\) 张卡,再乘 \(p_i\) 算概率。但是这样怎么算都算不对,其实感觉也是一个“意识”调题的过程吧,反正最终把样例调到 \(3.21​\) 左右发现概率对不上(样例解释),于是还是放弃了。

因此考虑建立无后效性的dp方程。因为需要满足 “如果发动了当前的卡”,那么就停止本轮,所以方程需要和前缀有关。令 \(f[i][j]\) 表示在所有的 \(r\) 轮里,前 \(i\) 张卡有 \(j\) 个发动了的概率。此时对于任意的第 \(k\) 张卡就可以用 \(f[k-1]\) 有关的数据推出来了。

考虑状态转移方程,对于 \(f[i][j]\),可以从 \(f[i-1][j-1]\) 或 \(f[i-1][j]\) 推过来。当从 \(f[i-1][j]\) 推过来时,表示第 \(i\) 张整场都没有发动,因此 \(f[i-1][j]\) 的贡献为 \(f[i-1][j]\times (1-p_i)^{r-j}\)。

其中 \((1-p_i)^{r-j}\) 表示在全部 \(r\) 轮中,由于在前 \(i-1\) 个中钦定了 \(j\) 个,占用了 \(j\) 轮,剩下的 \(r-j\) 轮中每次都没有发动第 \(i\) 张卡。

同时,为了便于理解,当我们dp做到 \(f[i]\) 时,如果认为第 \(i\) 张卡为此时的第一张卡,剩下的 \(r-j\) 轮里就只能选择下标为 \([i,n]\) 的卡了。此时第 \(i\) 张卡的发动不受前 \(i-1\) 张的限制。

当从 \(f[i-1][j-1]\) 推过来时(首先要满足 \(j>0\)),表示第 \(i\) 张被发动了,正难则反,被发动的概率就是用 \(1\) 减去没有被发动的概率。而没有被发动的概率在上文中被提到了,是 \((1-p_i)\) 的幂。此时由于只钦定了 \(j-1\) 张卡发动,所以指数为 \(r-j+1\)。因此 \(f[i-1][j-1]\) 的贡献为 \(f[i-1][j-1]\times\left(1-(1-p_i)^{r-j+1}\right)\)。

然后可以依次求出所有的 \(f\),此时我们再根据 \(f\) 推出每张卡被发动的概率 \(P_i\)。

仿照上面 \(f[i-1][j-1]\to f[i][j]\) 的过程,我们可以直接算出

\[P_i=\sum_{j=0}^{i-1}f[i-1][j]\times \left(1-(1-p_i)^{r-j}\right)
\]

答案是对每个 \(P_i\) 乘上伤害值 \(d_i\)。

对每个 \((1-p_i)\) 预处理幂后,时间复杂度为 \(O(nTr)\)。

Code:

#include<cstdio>
#include<cstring>
#define db double
db f[233][233],p[233];
db q[233][233];//q[i][j]表示(1-p[i])^j
int d[233];
int main()
{
int T;
scanf("%d",&T);
while(T--)
{
int n,r;
scanf("%d%d",&n,&r);
for(int i=1;i<=n;++i)
{
scanf("%lf%d",&p[i],&d[i]);
q[i][0]=1;
for(int j=1;j<=233;++j)
q[i][j]=q[i][j-1]*(1-p[i]);
}
f[0][0]=1;
for(int i=1;i<=n;++i)
for(int j=0;j<=i&&j<=r;++j)
{
f[i][j]=j?f[i-1][j-1]*(1-q[i][r-j+1]):0;
f[i][j]+=f[i-1][j]*q[i][r-j];
}
db ans=0;
for(int i=1;i<=n;++i)
for(int j=0;j<i&&j<r;++j)
ans+=d[i]*(f[i-1][j]*(1-q[i][r-j]));
printf("%.10lf\n",ans);
}
return 0;
}

洛谷 P3239 / loj 2112 [HNOI2015] 亚瑟王 题解【期望】【DP】的更多相关文章

  1. 【洛谷3239_BZOJ4008】[HNOI2015] 亚瑟王(期望 DP)

    题目: 洛谷 3239 分析: 卡牌造成的伤害是互相独立的,所以 \(ans=\sum f_i\cdot d_i\) ,其中 \(f_i\) 表示第 \(i\) 张牌 在整局游戏中 发动技能的概率.那 ...

  2. 洛谷P3239 [HNOI2015]亚瑟王(期望dp)

    传送门 stdcall大佬好强 期望的姿势不是很高……据大佬说期望有一个线性性质,也就是说可以把每一张牌的期望伤害算出来然后再加起来就是总的期望伤害 因为每一张牌只能用一次,我们设$dp[i]$表示第 ...

  3. 洛谷 P3239 [HNOI2015]亚瑟王(期望+dp)

    题面传送门 感觉是道挺好的题,可惜当时没写题解来着的? 根据期望的线性公式,我们求出每个卡牌被发动的概率 \(q_i\),然后 \[ans=\sum\limits_{i=1}^np_id_i \] 于 ...

  4. bzoj4008: [HNOI2015]亚瑟王【期望dp】

    一个特别神奇的dp,特别厉害. f(i, j) 表示 有 j 轮发动技能的牌在 [1, i] 另外的m - j轮在[i + 1, n]之间的概率. 怎么转移呢? 首先考虑i这张牌不选的情况,f(i - ...

  5. BZOJ4008 : [HNOI2015]亚瑟王(期望dp)

    题意 略(看了20min才看懂...) 题解 我一开始天真地一轮轮推期望,发现根本不好算... 唉~ 不会做就只能抄题解咯 看了一波DOFY大佬的解法qwq 发现有句神奇的话 记住,期望要倒着推... ...

  6. luoguP3239 [HNOI2015]亚瑟王 概率期望DP

    当初怎么想的来着.....又忘了...... 首先,总期望 = 每张卡片的期望之和 求期望,只要我们求出每张卡片被用掉的概率即可 如果直接上状态$f[i][j]$表示在第$i$轮中,第$j$张牌发动的 ...

  7. 洛谷P3830 随机树(SHOI2012)概率期望DP

    题意:中文题,按照题目要求的二叉树生成方式,问(1)叶平均深度 (2)树平均深度 解法:这道题看完题之后完全没头绪,无奈看题解果然不是我能想到的qwq.题解参考https://blog.csdn.ne ...

  8. 洛谷 P3244 / loj 2115 [HNOI2015] 落忆枫音 题解【拓扑排序】【组合】【逆元】

    组合计数的一道好题.什么非主流题目 题目背景 (背景冗长请到题目页面查看) 题目描述 不妨假设枫叶上有 \(n​\) 个穴位,穴位的编号为 \(1\sim n​\).有若干条有向的脉络连接着这些穴位. ...

  9. BZOJ4009 & 洛谷3242 & LOJ2113:[HNOI2015]接水果——题解

    https://www.lydsy.com/JudgeOnline/problem.php?id=4009 https://www.luogu.org/problemnew/show/P3242 ht ...

随机推荐

  1. Nginx+Tomcat集群+session共享

    Nginx+Tomcat集群+session共享 1)安装Nginx 2)配置多个Tomcat,在server.xml中修改端口(端口不出现冲突即可) 3)在nginx.conf文件中配置负载均衡池, ...

  2. 【转】LVS负载均衡之session解决方案 持久连接

    原文地址:http://minux.blog.51cto.com/8994862/1744761 1. 持久连接是什么? 1.1 在LVS中,持久连接是为了用来保证当来自同一个用户的请求时能够定位到同 ...

  3. Shell +Cygwinterminal+WinMySQL 传参数授权

    前言:新公司因为部分业务原因有好几百组win机器装MySQL授权登录比较麻烦,简单的写了一个shell传值自动授权的脚本,保存复用. #!/bin/bash #author liding@zlhy.c ...

  4. jqentitydetail

    using System;using System.Collections;using System.Collections.Generic;using System.Linq;using Syste ...

  5. 第十二课 Actionlib(1)

    一\Actionlib概念 在ROS系统中,有时需发送请求给某个节点完成相应的任务,同时获得一个一个响应,这种情况下可以通过ROS服务来 完成;然而,在某些情况下,服务需要很长时间才能执行完,如让机器 ...

  6. js选择文件夹路径

    该方法只支持IE. 语法:strDir=Shell.BrowseForFolder(Hwnd,Title,Options,[RootFolder])参数:Hwnd:包含对话框的窗体句柄(handle) ...

  7. this与$(this)的区别

    this,表示当前的上下文对象是一个html对象,可以调用html对象所拥有的属性和方法. $(this),代表的上下文对象是一个jquery的上下文对象,可以调用jQuery的方法和属性值.

  8. timer实现Grid自动换行(连续相同的id跳到下一行)

    private { Private declarations } FRow: Integer; procedure SetRow(const Value: Integer); public { Pub ...

  9. JavaScript随机数组(数组、随机、取整、取值的过程)

      <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&q ...

  10. 【BZOJ1853】[Scoi2010]幸运数字 容斥原理+搜索

    Description 在中国,很多人都把6和8视为是幸运数字!lxhgww也这样认为,于是他定义自己的"幸运号码"是十进制表示中只包含数字6和8的那些号码,比如68,666,88 ...