您的位置:首页 > 其它

poj2096 Collecting Bugs(概率dp)

2015-05-27 00:09 309 查看
关键词:期望dp——剩余状态

题意:每次在n个程序中的某一个中找出s种bug中的一种。程序和bug种类的选择都是随机的。求至少每个程序中都找到一个bug且s种bug都找到的期望步数。

状态设计:状态维是当前状态,状态含义是到达末尾状态还需要的期望步数

dp[i][j]:已在i个程序中找到共j种bug,此时到达结尾还需要的期望步数

dp[i][j]可以转移到dp[i][j],dp[i+1][j],dp[i][j+1],dp[i+1][j+1]。而求期望步数则反过来由后者的期望步数可得到前者的期望步数。

dp[i][j]=(i/n)(j/s)*dp[i][j]+(1-i/n)(j/s)dp[i+1][j]+(i/n)(1-j/s)dp[i][j+1]+(1-i/n)*(1-j/s)*dp[i+1][j+1]+1

整理后可以得到dp[i][j]的递推公式

初始条件:dp
[s]=0

#include<stdio.h>
#include<string.h>
#include<iostream>
#include<algorithm>
#include<math.h>
#include<set>
#include<vector>
#include<map>
#define ll long long
using namespace std;

const int maxn = 1000+10;

int n,s;
double dp[maxn][maxn];

int main(){
while(scanf("%d%d",&n,&s)!=EOF){
memset(dp,0,sizeof(dp));
for(int i=n;i>=0;i--){
for(int j=s;j>=0;j--){
if(i==n&&j==s) continue;
dp[i][j]=(double)((n-i)*j*dp[i+1][j]+(n-i)*(s-j)*dp[i+1][j+1]+i*(s-j)*dp[i][j+1]+n*s)/(double)(n*s-i*j);
}
}
printf("%.4lf\n",dp[0][0]);
}
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: