概率DP入门学习QAQ
emmmm博客很多都烂尾了。。。但是没空写。。先写一下正在学的东西好了
概率DP这东西每次考到都不会。。听题解也是一脸懵逼。。所以决定学习一下这个东东。。毕竟NOIP考过。。。比什么平衡树实在多了QAQ
有时间再去复习一下平衡树和KMP,AC自动机什么的,都忘光了。。
概率DP这东东。。我也不好说啥定义(毕竟是蒟蒻嘛。。直接刷题咯)
T1:hdu3853
题意:一个r行c列的格子,起始点在(1,1),终点在(r,c),每一步可能的走法有:不动、向右走、向下走,每走一步花费两点魔法值,现给出在每一点三种走法的概率,求走完迷宫时所花魔法值的期望。
这道题目可以看出是概率DP吧、、、那么我们显然知道一个事实dp[r][c]=0,不难写出DP方程:dp[i][j] = p[i][j][1]*dp[i][j] + p[i][j][2]*dp[i][j+1] + p[i][j][3]*dp[i+1][j] + 2
但是接下来的化简我理解了很久。。。之后我才明白QAQ
下面贴出化简的关键步骤
因为dp[i][j]-p[i][j][1]*dp[i][j]=dp[i][j]*(1-p[i][j][1])
所以dp[i][j] = (p[i][j][2]*dp[i][j+1] + p[i][j][3]*dp[i+1][j] + 2)/(1-p[i][j][1])
下面贴上代码:
#include<cstdio>
using namespace std;
double dp[][];
double p[][][];
int n,m;
int main(){
scanf("%d%d",&n,&m);
for(int i=;i<=n;i++)
for(int j=;j<=m;j++)scanf("%lf%lf%lf",&p[i][j][],&p[i][j][],&p[i][j][]);
for(int i=n;i>=;i--)
for(int j=m;j>=;j--){
if(p[i][j][]==||(i==n&&j==m))continue;
dp[i][j]=(p[i][j][]*dp[i][j+]+p[i][j][]*dp[i+][j]+)/(-p[i][j][]);
}printf("%.3lf\n",dp[][]);
}
T2:hdu4405
有0-n个格子,初始点在0,终点是>=n,每走一步之前都要丢一次六个面的色子,标上1-6,扔到几就走几步,当然色子是等概率出现数字的,还有就是中间某一点可能和其它的一点联通,比如a和b联通,当我处于a时,就可以直接飞到b(不用耗费步数),最后问走到终点时所扔色子次数的期望。
这题显然期望DP,显然期望DP的初始值为dp[n]=0,做期望DP要记住一点,要从距离结果状态较近的状态推到结果状态较远的状态。所以不要从dp[0]开始推哦!
然后如果我们发现某个点能否飞到其他店那么显然dp[i]=dp[fly[i]]
否则dp[i]=sum(d[i+j]/6)+1(1<=j<=6)
然后暴力推就好啦
#include<cstdio>
#include<cstring>
using namespace std;
int fly[];
double dp[];
int n,m,x,y;
int main(){
while(~scanf("%d%d",&n,&m)){
if(n==&&m==)break;
memset(dp,,sizeof(dp));
memset(fly,,sizeof(fly));
for(int i=;i<=m;i++)scanf("%d%d",&x,&y),fly[x]=y;
for(int i=n-;i>=;i--){
if(fly[i])dp[i]=dp[fly[i]];
else for(int j=;j<=;j++)dp[i]+=(dp[i+j]+)/;
}printf("%.4lf\n",dp[]);
}
}
T3:poj2096
题意:有n类bug和s个子系统,bug数量不限,且每天只能发现一个bug,要求的是当在s个子系统中发现n类bug时所需要天数的期望(平均天数)。
emmm这道题目首先我们设置一下初始状态dp[n][s]=0,dp[i][j]表示从j个子系统中发现i个bug的状态转移到s个子系统中发现n个bug的状态的期望天数
那么显然dp[i][j]会从以下4个地方转移:dp[i][j],dp[i+1][j],dp[i+1][j+1],dp[i][j+1]
概率也很好算的QAQ,然后我们就能得到下面的式子:
dp[i][j]=dp[i+1][j+1]*((n-i)*(s-j)/n/s)+dp[i][j+1]*(i*j/n/s)+dp[i+1][j]*((n-i)*j/n/s)+dp[i][j]*(i*j/n/s)+1
因为递推式不能重复出现同一个变量,所以我们移项再化简,合并同类项得到下面的式子:
dp[i][j]=((dp[i+1][j+1]*(n-i)*(s-j)+dp[i][j+1]*i*(s-j)+dp[i+1][j]*(n-i)*j)/(1.0*n*s)+1)/(1-(1.0*i*j/n/s));
就刷完啦!QAQ
#include<cstdio>
using namespace std;
double dp[][];
int n,s;
int main(){
scanf("%d%d",&n,&s);
for(int i=n;i>=;i--)
for(int j=s;j>=;j--){
if(i==n&&j==s)continue;
dp[i][j]=((dp[i+][j+]*(n-i)*(s-j)+dp[i][j+]*i*(s-j)+dp[i+][j]*(n-i)*j)/(1.0*n*s)+)/(-(1.0*i*j/n/s));
}
printf("%.4lf\n",dp[][]);
}
T4:有2^n支队,现在要进行n次比赛,并且按次序进行比赛并淘汰,胜利的队继续按次序比赛并淘汰,比如1,2,3,4进行比赛,第一轮1和2比,3和4比,假如1和3胜利了,那么第二轮1和3继续比,2,4淘汰。最后问最有可能胜利的队伍是哪一支。输出数据以-1结束
这个题目很显然概率DP,注意:概率DP跟期望DP不一样,概率DP是正着推。0.0
方程很水emmmm:f[i][j]+=f[i-1][j]*(f[i-1][k]*beat[j][k])
但是我们的k有限制的QAQ因为按照顺序比赛,比如说1号队伍和3号队伍在第一局并不能比赛。
所以我们要找到一个性质:如果j>>(i-1)==k>>(i-1)^1那么第i局j和k就是在同一组的
然后就轻松啦QAQ
#include<cstdio>
#include<cstring>
using namespace std;
double f[][];
double beat[][],ans;
int n,ansnum;
int main(){
while(~scanf("%d",&n)&&n!=-){memset(beat,,sizeof(beat));
for(int i=;i<(<<n);i++)for(int j=;j<(<<n);j++)scanf("%lf",&beat[i][j]);
memset(f,,sizeof(f));ans=ansnum=;
for(int i=;i<(<<n);i++)f[][i]=;
for(int i=;i<=n;i++)
for(int j=;j<(<<n);j++)
for(int k=;k<(<<n);k++){
if((j>>(i-))==((k>>(i-))^))f[i][j]+=f[i-][j]*(f[i-][k]*beat[j][k]);
}
for(int i=;i<(<<n);i++)if(f[n][i]>ans)ans=f[n][i],ansnum=i;
printf("%d\n",ansnum+);
}
}
概率DP入门学习QAQ的更多相关文章
- HDU 3853 LOOPS 概率DP入门
LOOPS Time Limit: 15000/5000 MS (Java/Others) Memory Limit: 125536/65536 K (Java/Others)Total Sub ...
- HDU 4405:Aeroplane chess(概率DP入门)
http://acm.split.hdu.edu.cn/showproblem.php?pid=4405 Aeroplane chess Problem Description Hzz loves ...
- 概率dp入门
概率DP主要用于求解期望.概率等题目. 转移方程有时候比较灵活. 一般求概率是正推,求期望是逆推.通过题目可以体会到这点. poj2096:Collecting Bugs #include <i ...
- poj 2096 Collecting Bugs 概率dp 入门经典 难度:1
Collecting Bugs Time Limit: 10000MS Memory Limit: 64000K Total Submissions: 2745 Accepted: 1345 ...
- 洛谷P2719 搞笑世界杯 题解 概率DP入门
作者:zifeiy 标签:概率DP 题目链接:https://www.luogu.org/problem/P2719 我们设 f[n][m] 用于表示还剩下n张A类票m张B类票时最后两张票相同的概率, ...
- 树形DP入门学习
这里是学习韦神的6道入门树形dp进行入门,本来应放在day12&&13里,但感觉这个应该单独放出来好点. 这里大部分题目都是参考的韦神的思想. A - Anniversary part ...
- POJ 2096-Collecting Bugs(概率dp入门)
题意: 有n种bug和s种系统bug,每天发现一种bug(可能已经发现过了)所有种bug被发现的概率相同,求所有bug被发现的期望天数. 分析: dp[i][j]发现i种bug,j种系统bug期望天数 ...
- HDU 3853-loop(概率dp入门)
题意: r*c个方格,从(1,1)开始在每个方格可释放魔法(消耗能量2)以知,释放魔法后可能在原地.可能到达相邻的下面格子或右面格子,给出三者的概率 求要到达(R,C)格子,要消耗能量的期望值. 分析 ...
- hdu4405概率dp入门
Aeroplane chess Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) ...
随机推荐
- 解决爬虫浏览器中General显示 Status Code:304 NOT MODIFIED,而在requests请求时出现403被拦截的情况。
在此,非常感谢 “完美风暴4” 的无私共享经验的精神 在Python爬虫爬取网站时,莫名遇到 浏览器中General显示 Status Code: 304 NOT MODIFIED 而在req ...
- html5 download all in one
html5 download all in one HTML5 download & Fetch API & File API & Blob https://scarletsk ...
- RT-thread内核之互斥量
一.互斥量控制块:在include/rtdef.h中 #ifdef RT_USING_MUTEX /** * Mutual exclusion (mutex) structure */ struct ...
- 【bzoj1606】[Usaco2008 Dec]Hay For Sale 购买干草 背包dp
题目描述 约翰遭受了重大的损失:蟑螂吃掉了他所有的干草,留下一群饥饿的牛.他乘着容量为C(1≤C≤50000)个单位的马车,去顿因家买一些干草. 顿因有H(1≤H≤5000)包干草,每一包都有它的体 ...
- select模型的原理、优点、缺点
关于I/O多路复用: I/O多路复用(又被称为“事件驱动”),首先要理解的是,操作系统为你提供了一个功能,当你的某个socket可读或者可写的时候,它可以给你一 个通知.这样当配合非阻塞的socket ...
- 个人vim配置
YouCompletMe支持golang cd .vim/bundle/YouCompleteMe ./install.sh --clang-completer --go-completer clan ...
- [NOI2009]诗人小G 决策单调性优化DP
第一次写这种二分来优化决策单调性的问题.... 调了好久,,,各种细节问题 显然有DP方程: $f[i]=min(f[j] + qpow(abs(sum[i] - sum[j] - L - 1))); ...
- BZOJ3140:[HNOI2013]消毒——题解
http://www.lydsy.com/JudgeOnline/problem.php?id=3140 https://www.luogu.org/problemnew/show/P3231 最近在 ...
- 洛谷3763:[TJOI2017]DNA——题解
https://www.luogu.org/problemnew/show/P3763 加里敦大学的生物研究所,发现了决定人喜不喜欢吃藕的基因序列S,有这个序列的碱基序列就会表现出喜欢吃藕的性状,但是 ...
- 关于PDO取得结果集的数据类型为string的问题
很久没写些什么了, 正好今天工作中遇到了以前在意过的问题. 之前曾注意到过,php从数据库中取得的结果集后,其中的字段全都会变成string类型.今儿通过ajax调取数据, 有一个type字段是int ...