『Broken Robot 后效性dp 高斯消元』
<更新提示>
<正文>
Broken Robot
Description
你作为礼物收到一个非常聪明的机器人走在矩形板上。不幸的是,你明白它已经破碎并且行为相当奇怪(随机)。该板由N行和M列单元组成。机器人最初位于第i行和第j列的某个单元格中。然后在每一步,机器人都可以去另一个细胞。目的是走到最底层(N.排。机器人可以停留在当前单元格中,向左移动,向右移动或移动到当前单元格下方的单元格。如果机器人位于最左侧的列中,则它不能向左移动,如果它位于最右侧的列中,则它不能向右移动。在每一步中,所有可能的动作都是同样可能的。返回预期的步数以到达最下面一行。
Input Format
在第一行中你将被提供两个空间隔开的整数N和M(1≤N,M≤?1000)。在第二行中你将得到另外两个空间隔开的整数i和j(1≤i≤N,1≤j≤M) ——初始行的数目和初始列的数量。注意,(1,1)是板的左上角,(N, M)是右下角。
Output Format
在自身的一行上输出预期的步数,小数点后至少有4位数。
Sample Input
10 14
5 14
Sample Output
18.0038068653
解析
显然,这道题看起来很像一道期望\(dp\),那么我们就用期望\(dp\)的套路设一个状态试试:\(f[i][j]\)代表机器人从\((i,j)\)走到最后一行的步数期望值。
我们可以根据移动规则很容易列出\(dp\)方程:
\(1.\) 当机器人处于第一列时:\(f[i][1]=\frac{1}{3}(f[i][1]+f[i][2]+f[i+1][1])+1\)
\(2.\) 当机器人处于最后一列时:\(f[i][m]=\frac{1}{3}(f[i][m]+f[i][m-1]+f[i+1][m])+1\)
\(3.\) 当机器人处于中间列时:\(f[i][j]=\frac{1}{4}(f[i][j]+f[i][j-1]+f[i][j+1]+f[i+1][j])+1\)
我们发现,在行维度上,这个状态转移方程时没有问题的,可以倒序枚举每一行作为阶段,来进行转移。
但是,在同一行中,这个状态转移方程并不满足无后效性这一动态规划基本原则,于是我们决定使用高斯消元算法来解方程。
总体上,我们还是以行号为阶段,倒序进行转移。在第\(i\)行行内,我们将\(i+1\)行的状态看为常数,剩下的状态看做\(m\)个未知数,\(m\)个状态转移方程看做数学方程,尝试列出增广矩阵。
先看第一类方程:\(f[i][1]=\frac{1}{3}(f[i][1]+f[i][2]+f[i+1][1])+1\),简单做一下移项分类:
\]
同理,可以化简剩下两个方程:
\]
\]
那就可以写出系数矩阵了:
\begin{array}{ccccccc|c}
2 & -1 & 0 & \cdots & 0 & 0 & 0 & f[i+1][1]+3 \\
-1 & 3 & -1 & \cdots & 0 & 0 & 0 & f[i+1][2]+4 \\
\vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots & \vdots \\
0 & 0 & 0 & \cdots& -1 & 3 & -1 & f[i+1][m-1]+4 \\
0 & 0 & 0 & \cdots& 0 & -1 & 2 & f[i+1][m]+3 \\
\end{array}
\right]
\]
我们发现这个矩阵很特殊,总共只有三条斜列有系数,所以我们可以线性直接消元。具体的说,我们可以从上往下消一遍,将第一斜列的系数消去,同时正确地处理第二第三斜列。再从下往上消一遍,将第三斜列的系数消去,这样就可以直接计算答案了。
利用如上的\(dp\)以及高斯消元算法,时间复杂度为\(O(nm)\)。
值得注意的是,这三个方程在\(m=1\)是会出现边界问题,简单推导可知\(m-1\)时答案就是\((n-x)*2\)。
\(Code:\)
#include <bits/stdc++.h>
using namespace std;
const int N = 1020;
int n,m,x,y;
double f[N][N],a[N][N],b[N];
inline void input(void)
{
scanf("%d%d\n%d%d",&n,&m,&x,&y);
}
inline void init(void)
{
a[1][1] = 2.0 , a[1][2] = -1.0;
for (int i=2;i<m;i++)
a[i][i-1] = -1.0 , a[i][i] = 3.0 , a[i][i+1] = -1.0;
a[m][m-1] = -1.0 , a[m][m] = 2.0;
}
inline void gauss(void)
{
double rate = a[2][1] / a[1][1];
a[2][1] = 0.0;
a[2][2] -= a[1][2] * rate , b[2] -= b[1] * rate;
for (int i=2;i<m;i++)
{
rate = a[i+1][i] / a[i][i];
a[i+1][i] = 0.0;
a[i+1][i+1] -= a[i][i+1] * rate , b[i+1] -= b[i] * rate;
}
for (int i=m-1;i>=1;i--)
{
rate = a[i][i+1] / a[i+1][i+1];
a[i][i+1] = 0.0 , b[i] -= b[i+1] * rate;
}
}
inline void dp(void)
{
for (int i=1;i<=m;i++)
f[n][i] = 0;
for (int i=n-1;i>=1;i--)
{
init();
b[1] = f[i+1][1] + 3.0;
for (int j=2;j<m;j++)
b[j] = f[i+1][j] + 4.0;
b[m] = f[i+1][m] + 3.0;
gauss();
for (int j=1;j<=m;j++)
f[i][j] = b[j] / a[j][j];
}
}
int main(void)
{
freopen("in.in","r",stdin);
freopen("out.out","w",stdout);
input();
if ( m != 1 ) dp();
else f[x][y] = ( n - x ) * 2.0;
printf("%.10lf\n",f[x][y]);
return 0;
}
<后记>
『Broken Robot 后效性dp 高斯消元』的更多相关文章
- CF24D Broken robot 后效性DP
这题咕了好久..... 设$f[i][j]$表示从$(i,j)$到最后一行的期望步数: 则有 $ f[i][1]=\frac{1}{3}(f[i][1]+f[i][2]+f[i+1][1])+1$ $ ...
- BZOJ 3270: 博物馆 [概率DP 高斯消元]
http://www.lydsy.com/JudgeOnline/problem.php?id=3270 题意:一张无向图,一开始两人分别在$x$和$y$,每一分钟在点$i$不走的概率为$p[i]$, ...
- BZOJ_3143_[Hnoi2013]游走_期望DP+高斯消元
BZOJ_3143_[Hnoi2013]游走_期望DP+高斯消元 题意: 一个无向连通图,顶点从1编号到N,边从1编号到M. 小Z在该图上进行随机游走,初始时小Z在1号顶点,每一步小Z以相等的概率随机 ...
- BZOJ_1778_[Usaco2010 Hol]Dotp 驱逐猪猡_概率DP+高斯消元
BZOJ_1778_[Usaco2010 Hol]Dotp 驱逐猪猡_概率DP+高斯消元 题意: 奶牛们建立了一个随机化的臭气炸弹来驱逐猪猡.猪猡的文明包含1到N (2 <= N <= 3 ...
- LightOJ - 1151概率dp+高斯消元
概率dp+高斯消元 https://vjudge.net/problem/LightOJ-1151 题意:刚开始在1,要走到100,每次走的距离1-6,超过100重来,有一些点可能有传送点,可以传送到 ...
- 【BZOJ3640】JC的小苹果 概率DP+高斯消元
[BZOJ3640]JC的小苹果 Description 让我们继续JC和DZY的故事. “你是我的小丫小苹果,怎么爱你都不嫌多!” “点亮我生命的火,火火火火火!” 话说JC历经艰辛来到了城市B,但 ...
- 【bzoj1778】[Usaco2010 Hol]Dotp 驱逐猪猡 矩阵乘法+概率dp+高斯消元
题目描述 奶牛们建立了一个随机化的臭气炸弹来驱逐猪猡.猪猡的文明包含1到N (2 <= N <= 300)一共N个猪城.这些城市由M (1 <= M <= 44,850)条由两 ...
- BZOJ3270 博物館 概率DP 高斯消元
BZOJ3270 博物館 概率DP 高斯消元 @(XSY)[概率DP, 高斯消元] Description 有一天Petya和他的朋友Vasya在进行他们众多旅行中的一次旅行,他们决定去参观一座城堡博 ...
- 【CF24D】Broken Robot (DP+高斯消元)
题目链接 题意:给定一个\(n\times m\)的矩阵,每次可以向→↓←移动一格,也可以原地不动,求从\((x,y)\)到最后一行的期望步数. 此题标签\(DP\) 看到上面这个肯定会想到 方法一: ...
随机推荐
- 源码解析 || ArrayList源码解析
前言 这篇文章的ArrayList源码是基于jdk1.8版本的源码,如果与前后版本的实现细节出现不一致的地方请自己多加注意.先上一个它的结构图 ArrayList作为一个集合工具,对于我而言它值得我们 ...
- NiFi使用总结 一 hive到hive的PutHiveStreaming processor和SelectHiveQL
我说实话,NiFi的坑真的挺多的... 1.PutHiveStreaming processor的使用 具体配置可参考:https://community.hortonworks.com/articl ...
- React / Ant Design Pro 实现Canvas画布实时自适应
如何实现canvas根据父容器进行自适应? Ant Design的组件都提供了强大的自适应能力,为了对齐父组件,镶嵌在Ant Design组件里的canvas也需要能根据父级容器进行自适应的能力,页面 ...
- django_settings源码解析
目录 配置文件插拔式设计: 简单版: 复杂版 importlib 与`__import__的区别: 配置文件插拔式设计: 项目配置文件插拔式设计: 基于django settings源码实现自己项目配 ...
- Java代理(静态代理、JDK动态代理、CGLIB动态代理)
Java中代理有静态代理和动态代理.静态代理的代理关系在编译时就确定了,而动态代理的代理关系是在运行期确定的.静态代理实现简单,适合于代理类较少且确定的情况,而动态代理则给我们提供了更大的灵活性. J ...
- TensorFlow常用激活函数及其特点和用法(6种)详解
http://c.biancheng.net/view/1911.html 每个神经元都必须有激活函数.它们为神经元提供了模拟复杂非线性数据集所必需的非线性特性.该函数取所有输入的加权和,进而生成一个 ...
- python3 获取日期时间
#!/usr/bin/python3 import time # 格式化成2016-- ::39形式 print (time.strftime("%Y-%m-%d %H:%M:%S" ...
- Xcode一个project多个target
project添加target https://blog.csdn.net/vbirdbest/article/details/53466009 https://www.cnblogs.com/Bob ...
- 【Activiti学习之一】Activiti入门
环境 JDK1.7 MySQL5.6 Tomcat7 Eclipse-Luna activiti 6.0 一.概念1.工作流(Workflow):是一系列相互衔接.自动进行的业务活动或任务.采用工作流 ...
- Debug 路漫漫-08:Keras 版本升级函数变换导致的问题
在使用 CNN的时候,报错: TypeError: ('Keyword argument not understood:', 'padding') 将“padding”改为“border_mode”, ...