【BZOJ 1419】Red is good [概率DP]
我 是 Z Z
概率好玄啊(好吧是我太弱.jpg
Description
桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。
数据范围与提示
输出答案时,小数点后第六位后的全部去掉,不要四舍五入.
Solution
乍一看感觉是道普通求期望,然后就在错误的路上速度与激情。。其实不难,但也是道挺好的概率dp
由于要求的是最佳方案,所以并不是所有方案的平均值,即不能把期望作为最终答案。所以该怎么做?遇事不决就dp啊!
考虑开二维状态数组f[r][b],一维已抽出的红牌,一维已抽出的黑牌。那么对于f[i][j],有i/(i+j)的平均最优解是由抽出红牌转移而来,j/(i+j)的平均最优解是由抽出黑牌转移而来。即:
f[i][j]=(i×(f[i-1][j]+1)+j×f[i][j-1])/(i+j)
又因为要求最优解,所以抽牌赔钱不如不抽,即可将值为负的状态转移为0。
所以有状态转移方程:
f[i][j]=max(0.0,((f[i-1][j]+1)×i+(f[i][j-1]-1)×j)/(i+j))
几点注意:
1.输出不能四舍五入,我在网上搜的几种避免四舍五入的方式不知为何都没用,只能手模了一个。。
1 ans=((int)(ans*1e6))/1e6;
2 printf("%.6lf",ans);
2.题面空间限制64m,5000×5000显然会炸,要开滚动数组。
代码如下:

1 #include<bits/stdc++.h>
2 using namespace std;
3 int r,b,n;
4 double f[5001][5001],ans;
5 inline int read()
6 {
7 int x=0,f=1;
8 char ch=getchar();
9 while(ch<'0'||ch>'9')
10 {
11 if(ch=='-')
12 f=-1;
13 ch=getchar();
14 }
15 while(ch>='0'&&ch<='9')
16 {
17 x=(x<<1)+(x<<3)+(ch^48);
18 ch=getchar();
19 }
20 return x*f;
21 }
22 int main()
23 {
24 r=read(); b=read();
25 for(int i=1;i<=r;i++)
26 {
27 f[i&1][0]=i;
28 for(int j=1;j<=b;j++)
29 f[i&1][j]=max(0.0,((f[i-1&1][j]+1)*i+(f[i&1][j-1]-1)*j)/(i+j));
30 }
31 ans=((int)(f[r&1][b]*1e6))/1e6;
32 printf("%.6lf",ans);
33 return 0;
34 }
蒟蒻代码QAQ
(附身边高人JYFHYX T60的暴力搜索:

1 using namespace std;
2 int j,d;
3 double r,b;
4 double f[5001][5001];
5 inline double dp(double black,double red)
6 {
7 j=black,d=red;
8 if(f[j][d])
9 return f[j][d];
10 if(black+red==0)
11 return 0;
12 return f[j][d]=(red/(black+red))(max(dp(black,red-1.0),0.0)+1)+(black/(black+red))(max(dp(black-1.0,red),0.0)-1);
13 }
14 int main()
15 {
16 cin>>r>>b;
17 int n=r+b;
18 for(int i=1;i<=r;i++)
19 {
20 f[0][i]=i;
21 }
22 for(int i=1;i<=b;i++)
23 f[i][0]=-i;
24 double ans;
25 ans=dp(b,r);
26 ans=((int)(ans*1e6))/1e6;
27 printf("%.6lf",ans);
28 }
爆搜

#include<bits/stdc++.h>
using namespace std;
double r,b;
double f[5001][5001];
inline double dp(double black,double red)
{
int j=black,b=red;
if(f[j][b])
return f[j][b];
if(black+red==0)
return 0;
return f[j][b]=(red/(black+red))*(max(dp(black,red-1.0),0.0)+1)+(black/(black+red))*(max(dp(black-1.0,red),0.0)-1);
}
int main()
{
cin>>r>>b;
int n=r+b;
for(int i=1;i<=r;i++)
{
f[0][i]=i;
}
for(int i=1;i<=b;i++)
f[i][0]=-i;
double ans;
ans=dp(b,r);
ans=((int)(ans*1e6))/1e6;
printf("%.6lf",ans);
}
缩进版
【BZOJ 1419】Red is good [概率DP]的更多相关文章
- BZOJ 1419 Red is good ——期望DP
定义f[i][j]表示还剩i张红牌,j张黑牌的时候能取得的期望最大值 显然有$f[i][j]=max(0,\frac {i}{i+j}(f[i-1][j]+1)+ \frac {j}{i+j}(f[i ...
- BZOJ 1419: Red is good 期望dp
数学期望可以理解成一个 DAG 模型. Code: #include <bits/stdc++.h> #define N 5003 #define ll long long #define ...
- BZOJ 3143 [Hnoi2013]游走 ——概率DP
概率DP+高斯消元 与博物馆一题不同的是,最终的状态是有一定的概率到达的,但是由于不能从最终状态中出来,所以最后要把最终状态的概率置为0. 一条边$(x,y)$经过的概率是x点的概率$*x$到$y$的 ...
- bzoj 1419 Red is good - 动态规划 - 概率与期望
Description 桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元.可以随时停止翻牌,在最优策略下平均能得到多少钱. Input 一 ...
- bzoj 1419 Red is good(期望DP)
[题意] R红B蓝,选红得1选蓝失1,问最优状态下的期望得分. [思路] 设f[i][j]为i个Rj个B时的最优期望得分,则有转移式为: f[i][j]=max{ 0,(f[i-1][j]+1)*(i ...
- BZOJ 1419: Red is good
Sol 期望DP. \(f[i][j]\) 表示剩下 \(i\) 张红牌, \(j\) 张黑牌的期望. 有转移方程. \(f[i][j]=0,i=0\) 没有红色牌了,最优方案就是不再翻了. \(f[ ...
- BZOJ.1076.[SCOI2008]奖励关(概率DP 倒推)
题目链接 BZOJ 洛谷 真的题意不明啊.. \(Description\) 你有k次选择的机会,每次将从n种物品中随机一件给你,你可以选择选或不选.选择它会获得这种物品的价值:选择一件物品前需要先选 ...
- BZOJ 3640: JC的小苹果 [概率DP 高斯消元 矩阵求逆]
3640: JC的小苹果 题意:求1到n点权和\(\le k\)的概率 sengxian orz的题解好详细啊 容易想到\(f[i][j]\)表示走到i点权为j的概率 按点权分层,可以DP 但是对于\ ...
- BZOJ 3143: [Hnoi2013]游走 [概率DP 高斯消元]
一个无向连通图,顶点从1编号到N,边从1编号到M. 小Z在该图上进行随机游走,初始时小Z在1号顶点,每一步小Z以相等的概率随机选 择当前顶点的某条边,沿着这条边走到下一个顶点,获得等于这条边的编号的分 ...
随机推荐
- 最全Windows版本jemalloc库(5.2.1)及其使用:包含动态库和静态库、x86版本和x64版本、debug版本和release版本
编写服务器程序时,需要频繁的申请和释放内存,长时间运行会产生大量的内存碎片,这就导致即使当前系统中的闲置内存还足够多,但也无法申请到大的连续可用的内存块,因为此时的物理内存已经千疮百孔像个马蜂窝.此外 ...
- 物理机burp抓虚拟机包
先设置网络连接为NAT模式. 这就相当于主机虚拟出一个网卡,虚拟机单独成为一个网段(相当于虚拟机为单独一台主机,物理机作为路由器网关使用),我将会在物理机,也就是这个"路由器"上设 ...
- 一文详解JavaScript的继承模式
1 原型链继承 #### ES6中通过原型继承多个引用类型的属性和方法,由于原型和实例的关系,即每个构造函数都有自己的原型对象,同时原型有一个属性指向构造函数,并且实例有一个内部的指针指向原型.如果存 ...
- PHP的LZF压缩扩展工具
这次为大家带来的是另外一个 PHP 的压缩扩展,当然也是非常冷门的一种压缩格式,所以使用的人会比较少,而且在 PHP 中提供的相关的函数也只是对字符串的编码与解码,并没有针对文件的操作.因此,就像 B ...
- obs软件mac设置
1 远程电脑软件teamview或者向日葵 远程mac电脑会时黑屏或连不上, 需要设置系统偏好->设置软件权限 2 设置obs 显示不出画面或声音,也需要在系统偏好设置obs的权限(首先打开OB ...
- Java开发基础平台带集成的审批工作流
前言 activiti工作流,企业erp.oa.hr.crm等审批系统轻松落地,请假审批demo从流程绘制到审批结束实例. 一.项目形式 springboot+vue+activiti集成了activ ...
- disruptor笔记之二:Disruptor类分析
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
- jmeter如何确定ramp-up时间
原文来自:https://www.cnblogs.com/hjhsysu/p/9189897.html 线程属性包含了:线程数.Ramp-Up时间(秒).循环次数. 我整理下线程属性的定义,如图: 难 ...
- centos修改ssh默认端口号的方法
修改/etc/ssh/sshd_config配置文件(注意:这里是sshd_config,而不是ssh_config) vi /etc/ssh/sshd_config 在sshd_config文件中添 ...
- 【Vue】淘气三千问之 data为什么是函数而不是对象?这河狸吗
朋友,当你提出以上问题的时候建议你先去复习下原型链的知识 但是我好人做到底直接就讲了吧,我们先看一下下面的这段代码: function Component () { this.data = this. ...