您的位置：首页 > 其它

poj2096 Collecting Bugs（概率dp）

2015-05-27 00:09 309 查看

关键词：期望dp——剩余状态

题意：每次在n个程序中的某一个中找出s种bug中的一种。程序和bug种类的选择都是随机的。求至少每个程序中都找到一个bug且s种bug都找到的期望步数。

状态设计：状态维是当前状态，状态含义是到达末尾状态还需要的期望步数

dp[i][j]:已在i个程序中找到共j种bug，此时到达结尾还需要的期望步数

dp[i][j]可以转移到dp[i][j]，dp[i+1][j]，dp[i][j+1]，dp[i+1][j+1]。而求期望步数则反过来由后者的期望步数可得到前者的期望步数。

dp[i][j]=(i/n)(j/s)*dp[i][j]+(1-i/n)(j/s)dp[i+1][j]+(i/n)(1-j/s)dp[i][j+1]+(1-i/n)*(1-j/s)*dp[i+1][j+1]+1

整理后可以得到dp[i][j]的递推公式

初始条件：dp
[s]=0

#include<stdio.h>
#include<string.h>
#include<iostream>
#include<algorithm>
#include<math.h>
#include<set>
#include<vector>
#include<map>
#define ll long long
using namespace std;

const int maxn = 1000+10;

int n,s;
double dp[maxn][maxn];

int main(){
while(scanf("%d%d",&n,&s)!=EOF){
memset(dp,0,sizeof(dp));
for(int i=n;i>=0;i--){
for(int j=s;j>=0;j--){
if(i==n&&j==s) continue;
dp[i][j]=(double)((n-i)*j*dp[i+1][j]+(n-i)*(s-j)*dp[i+1][j+1]+i*(s-j)*dp[i][j+1]+n*s)/(double)(n*s-i*j);
}
}
printf("%.4lf\n",dp[0][0]);
}
}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航