您的位置:首页 > 编程语言 > Go语言

【BZOJ-1419】Red is good 概率期望DP

2016-09-24 09:25 387 查看

1419: Red is good

Time Limit: 10 Sec Memory Limit: 64 MB
Submit: 660 Solved: 257
[Submit][Status][Discuss]

Description

桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。

Input

一行输入两个数R,B,其值在0到5000之间

Output

在最优策略下平均能得到多少钱。

Sample Input

5 1

Sample Output

4.166666

HINT

输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

Source

Solution

概率期望DP

$f[i][j]$表示选$i$张红和$j$张黑的答案

转移就是期望*概率

$f[i][j]=max(0,\frac{i}{i+j}*(f[i-1][j]+1)+\frac{j}{i+j}*(f[i][j-1]-1))$

卡内存需要滚动数组

Code

#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>
using namespace std;
int R,B,now;
double f[2][5001];
int main()
{
scanf("%d%d",&R,&B);
for (int i=0; i<=R; i++,now^=1,f[now][0]=i)
for (int j=1; j<=B; j++)
f[now][j]=max(0*1.0,1.0*i/(i+j)*(f[now^1][j]+1)+1.0*j/(i+j)*(f[now][j-1]-1));
long long ans=f[R&1][B]*1000000;
printf("%lf",(double)ans/1000000);
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: