当前位置: 代码迷 >> 综合 >> 【codeforces 148DBag of mice】【概率dp】【记忆化】
  详细解决方案

【codeforces 148DBag of mice】【概率dp】【记忆化】

热度:76   发布时间:2024-01-04 11:45:18.0

【链接】

http://codeforces.com/problemset/problem/148/D

【题意】

原来袋子里有w只白鼠和b只黑鼠 ,龙和王妃轮流从袋子里抓老鼠。

谁先抓到白色老鼠谁就赢。

王妃每次抓一只老鼠,龙每次抓完一只老鼠之后会有一只老鼠跑出来。

每次抓老鼠和跑出来的老鼠都是随机的。

如果两个人都没有抓到白色老鼠则龙赢。王妃先抓。 问王妃赢的概率

【思路】

dp[i][j]表示现在的状态为i只白鼠,j只黑鼠,王妃赢得可能性

赢的 状态来自于:

1.直接选到白色:i/(i+j)

2.王妃选到黑黑鼠,那么龙必须也要黑鼠。

   若逃跑一只黑鼠,(i,j)的获胜状态取决于dp[i,j-3]*j/(i+j)*(j-1)/(i+j-1)*(j-2)/(i+j-2)

   若逃跑一只白鼠,(i,j)的获胜概率取决于dp[i-1,j-2]*i/(i+j)*(j-1)/(i+j-1)*i/(i+j-2)

【dp代码】

#include<cstdio>
#include<cstring>
#include<map>
#include<iostream>
#include<iostream>
#include<vector>
#include<string>
#include<algorithm>
using namespace std;
using ll=long long;
const int maxn = 1e3+6;
const int inf = 0x3f3f3f3f;
const int mod = 1e9 + 7;
double dp[maxn][maxn];int main() {int w, b;scanf("%d%d", &w, &b);for(int i=1;i<=w;i++)dp[i][0] = 1;for (int i = 1; i <= b;i++)dp[0][i] = 0;for (int i = 1; i <= w; i++) {for (int j = 1; j <= b; j++) {dp[i][j] += i * 1.0 / (i + j);if(j>=3)dp[i][j] += 1.0*j / (i + j)*(j - 1) / (i + j - 1)*(j - 2) / (i + j - 2)*dp[i][j - 3];if(j>=2)dp[i][j] += 1.0*j / (i + j)*(j - 1) / (i + j - 1)*i / (i + j - 2)*dp[i - 1][j - 2];}}printf("%.10f\n", dp[w][b]);
}
const int maxn = 1000 + 10;
int T, n, m, vis[maxn][maxn][2], w, b;
double d[maxn][maxn][2];
double dp(int a, int b, int id) {double ans = 0;if (a == 0) return 0;if (a != 0 && b == 0) {if (id) return 0;else return 1;}if (vis[a][b][id] != -1) return d[a][b][id];vis[a][b][id] = 1;if (id) {if (b > 1) ans += dp(a, b - 2, id ^ 1) *b /(a + b) * (b - 1) / (a + b - 1);if (b > 0 && a > 0) ans += dp(a - 1, b - 1, id ^ 1) *b / (a + b) *a / (a + b - 1);}else {if (a > 0) ans += (double)(a) / (a + b);if (b > 0) ans += dp(a, b - 1, id ^ 1) * b / (a + b);}return d[a][b][id]=ans;
}
int main() {memset(vis, -1, sizeof(vis));scanf("%d%d", &w, &b);double ans = dp(w, b, 0);printf("%.10f\n", ans);return 0;
}