【BZOJ 1076】[SCOI2008]奖励关（期望）

Description

你正在玩你最喜欢的电子游戏，并且刚刚进入一个奖励关。在这个奖励关里，系统将依次随机抛出k次宝物，

每次你都可以选择吃或者不吃（必须在抛出下一个宝物之前做出选择，且现在决定不吃的宝物以后也不能再吃）。

宝物一共有n种，系统每次抛出这n种宝物的概率都相同且相互独立。也就是说，即使前k-1次系统都抛出宝物1（

这种情况是有可能出现的，尽管概率非常小），第k次抛出各个宝物的概率依然均为1/n。获取第i种宝物将得到Pi

分，但并不是每种宝物都是可以随意获取的。第i种宝物有一个前提宝物集合Si。只有当Si中所有宝物都至少吃过

一次，才能吃第i种宝物（如果系统抛出了一个目前不能吃的宝物，相当于白白的损失了一次机会）。注意，Pi可

以是负数，但如果它是很多高分宝物的前提，损失短期利益而吃掉这个负分宝物将获得更大的长期利益。假设你

采取最优策略，平均情况你一共能在奖励关得到多少分值？

Input

第一行为两个正整数k和n，即宝物的数量和种类。以下n行分别描述一种宝物，其中第一个整数代表分值，随

后的整数依次代表该宝物的各个前提宝物（各宝物编号为1到n），以0结尾。

Output

输出一个实数，保留六位小数，即在最优策略下平均情况的得分。

Sample Input

Sample Output

1.500000

HINT

【数据规模】

1<=k<=100,1<=n<=15，分值为[-10^6,106]内的整数。

题解

$dp[i][j]$第i轮操作，取物品操作为j的最优得分期望。期望倒推，最终答案为$dp[1][0]$，倒推方程为

\[\begin{cases}
dp[i][j]=max{(dp[i+1][j],dp[i+1][j|(1<<(k))]+a[k])}, &(s[t] and j)==s[t]\\
dp[i][j]+=d[i+1][j], & other
\end{cases}\]

参考代码

#include<queue>

#include<cmath>

#include<cstdio>

#include<cstring>

#include<cstdlib>

#include<iostream>

#include<algorithm>

#define ll long long

#define inf 1000000000

using namespace std;

ll read(){

    ll x=0,f=1;char ch=getchar();

    while(ch<'0'||ch>'9'){if(ch=='-') f=-1;ch=getchar();}

    while(ch>='0'&&ch<='9'){x=x*10+ch-'0';ch=getchar();}

    return x*f;

}

void Out(ll a){

    if(a<0) putchar('-'),a=-a;

    if(a>=10) Out(a/10);

    putchar(a%10+'0');

}

const int N=105;

double dp[N][1<<16];

int a[16],s[16],sta[16];

int main(){

    for(int i=1;i<=16;i++) sta[i]=1<<(i-1);

    int k=read(),n=read();

    for(int i=1;i<=n;i++){

        a[i]=read();

        int x=read();

        while(x){

            s[i]+=sta[x];   //第i个物品的前提宝物集合

            x=read();

        }

    }

    for(int i=k;i>=1;i--)  //k轮选择

        for(int j=0;j<=sta[n+1]-1;j++){  //前一轮各种操作

            for(int t=1;t<=n;t++)

                if((s[t]&j)==s[t])

                   dp[i][j]+=max(dp[i+1][j],dp[i+1][j|sta[t]]+a[t]);

                else dp[i][j]+=dp[i+1][j];

            dp[i][j]/=n;

        }

    printf("%.6f\n",dp[1][0]);

    return 0;

}

【BZOJ 1076】[SCOI2008]奖励关（期望）的更多相关文章

bzoj 1076: [SCOI2008]奖励关
Description 你正在玩你最喜欢的电子游戏,并且刚刚进入一个奖励关.在这个奖励关里,系统将依次随机抛出k次宝物,每次你都可以选择吃或者不吃(必须在抛出下一个宝物之前做出选择,且现在决定不吃的宝 ...
【BZOJ】1076 [SCOI2008]奖励关期望DP+状压DP
[题意]n种宝物,k关游戏,每关游戏给出一种宝物,可捡可不捡.每种宝物有一个价值(有负数).每个宝物有前提宝物列表,必须在前面的关卡取得列表宝物才能捡起这个宝物,求期望收益.k<=100,n&l ...
BZOJ 1076: [SCOI2008]奖励关 [DP 期望状压]
传送门题意:$n$种宝物,出现$k$次每次一种,每种宝物有价值和吃掉它之前必须要吃掉的宝物的集合,求采取最优策略的期望最大价值 1<=k<=100,1<=n<=15,分值为[ ...
●BZOJ 1076 [SCOI2008]奖励关
题链: http://www.lydsy.com/JudgeOnline/problem.php?id=1076题解: 期望dp. (模糊的题意,2333) 题中的:"现在决定不吃的宝物以后 ...
BZOJ.1076.[SCOI2008]奖励关(概率DP 倒推)
题目链接 BZOJ 洛谷真的题意不明啊.. $Description$ 你有k次选择的机会,每次将从n种物品中随机一件给你,你可以选择选或不选.选择它会获得这种物品的价值:选择一件物品前需要先选 ...
BZOJ 1076: [SCOI2008]奖励关(概率+dp)
首先嘛，看了这么久概率论真的不错啊。看到就知道怎么写（其实也挺容易的= =）直接数位dp就行了 CODE： #include<cstdio> #include<cstring> ...
bzoj 1076: [SCOI2008]奖励关【状压dp+概率dp】
设f[i][s]为前i步,选的礼物集合为s的方案数,然而并不会转移-- 看了hzwer的blog,发现要倒着转移,然后答案就是f[1][0] 妙啊 #include<iostream> # ...
1076: [SCOI2008]奖励关( dp )
期望状压dp.... ------------------------------------------------------------------ #include<cstdio> ...
1076: [SCOI2008]奖励关
1076: [SCOI2008]奖励关 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 2078 Solved: 1118[Submit][Statu ...
bzoj1076: [SCOI2008]奖励关(期望dp+状压dp)
1076: [SCOI2008]奖励关 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 2989 Solved: 1557[Submit][Statu ...

随机推荐

RobotFramework自动化测试框架（3）- RobotFramework扩展测试库、资源文件、变量文件
扩展测试库扩展测试库可使用python或java语言编写.后直接导入需要使用的测试用例文件即可. 具体的实现和操作,后续补充.请参考官网. 资源文件在资源文件中定义用户关键字,它提供了共享机制,即 ...
C# 多线程（转）
C#多线程一.基本概念 1.进程首先打开任务管理器,查看当前运行的进程: 从任务管理器里面可以看到当前所有正在运行的进程.那么究竟什么是进程呢? 进程(Process)是Windows系统中的 ...
Python标准库 datetime
>>> import datetime >>> now = datetime.datetime.now() >>> now datetime.da ...
【Tsinsen】A1280. 最长双回文串
Bryce1010模板 http://www.tsinsen.com/A1280### 题目分析:记录一个点向后和向前的最长回文串,然后就是max(Llen[i]+Rlen[i+1])了. #incl ...
转：从《The C Programming Language》中学到的那些编程风格和设计思想
这儿有一篇写的很好的读后感:http://www.cnblogs.com/xkfz007/articles/2566424.html 读书不是目的,关键在于思考. 很早就在水木上看到有人推荐& ...
awr 收集时间
windows 收集 awr 报告,一分钟一个.
FACVSPOW - Factorial vs Power 数学方法 +　二分
http://www.spoj.com/problems/FACVSPOW/ 求解n! > a^n最小的整数n 对于有n!和a^n的东西,一般是取ln 然后就是求解 (ln(1) + ln(2) ...
RHEL 7.2 源码安装Python 3.6.2报错
报错代码:zipimport.ZipImportError: can't decompress data; zlib not available 一条命令解决:yum install zlib-dev ...
AJPFX辨析Java中运算符 ++ 和 += 的区别
我们都知道Java中 ++ 和 +=1 都是把数字增加一后,把值赋给左边,那二者有什么区别呢? i+=1 运行的底层Heap申请一个区域存放i,在数据区域开劈一个区域存放1,2个内存段被数据被送入到 ...
AJPFX简述Java中this关键字的使用
Java中this关键字的使用主要有两处: 1.构造方法 this指的是调用构造方法进行初始化的对象. //有参构造public Human(String name, int age) { this( ...

【BZOJ 1076】[SCOI2008]奖励关（期望）

Description

Input

Output

Sample Input

Sample Output

HINT

题解

参考代码

【BZOJ 1076】[SCOI2008]奖励关（期望）的更多相关文章

随机推荐

热门专题