您的位置:首页 > Web前端 > JavaScript

bzoj1030 [JSOI2007]文本生成器(AC+dp)

2017-08-08 20:30 393 查看
推=>http://blog.csdn.net/popoqqq/article/details/41802417

Description

JSOI交给队员ZYX一个任务,编制一个称之为“文本生成器”的电脑软件:该软件的使用者是一些低幼人群,他们现在使用的是GW文本生成器v6版。该软件可以随机生成一些文章―――总是生成一篇长度固定且完全随机的文章—— 也就是说,生成的文章中每个字节都是完全随机的。如果一篇文章中至少包含使用者们了解的一个单词,那么我们说这篇文章是可读的(我们称文章a包含单词b,当且仅当单词b是文章a的子串)。但是,即使按照这样的标准,使用者现在使用的GW文本生成器v6版所生成的文章也是几乎完全不可读的?。ZYX需要指出GW文本生成器 v6生成的所有文本中可读文本的数量,以便能够成功获得v7更新版。你能帮助他吗?

Input

  输入文件的第一行包含两个正整数,分别是使用者了解的单词总数N (<= 60),GW文本生成器 v6生成的文本固定长度M;以下N行,每一行包含一个使用者了解的单词。这里所有单词及文本的长度不会超过100,并且只可能包含英文大写字母A..Z

Output

  一个整数,表示可能的文章总数。只需要知道结果模10007的值。

Sample Input

2 2

A

B

Sample Output

100

分析:

AC自动机上的dp

计算有多少字符串不含有任何一个给出的字符串

考虑把所有给出串的AC自动机构建出来,

那么任何一个串的终止结点及其在fail树上的儿子是不能被访问的

记录f[i][j]表示考虑到了第i个字符,

当前在AC自动机上第j个结点的方案数,

转移只需依次枚举下一个字符,

然后到了AC自动机上第k个结点,

若第k个结点是可以被访问的,

则对f[i+1][k]贡献了f[i][j]

方程:

f[i+1][k]+=f[i][j] (k是j的儿子且!ed[j])

最后用总方案数减去不合法方案数,时间复杂度 O(nml)

tip

在构建fail指针的时候同时维护ed

这时的ed已经不是单纯的标记单词结尾了,

ed==1代表这个点不能到达,

ed[ch[r][i]]|=ed[fail[ch[r][i]]]; //儿子的ed | 儿子fail的ed

(1|1=1,1|0=1,0|0=0,如果儿子的fail不能到达,儿子也不能到达)

f[0][0]=0

循环AC自动机节点的时候从0开始

时刻判断ed

1stWA ed数组开小

2ndWA 读入模式串的时候循环写成1~m

这里写代码片
#include<cstdio>
#include<cstring>
#include<iostream>
#include<queue>

using namespace std;

const int mod=10007;
int n,m,tot=0;
int fail[6010],ch[6010][30],f[200][6010];
char w[105];
bool ed[6010];

int KSM(int a,int p)
{
int t=1;
while (p)
{
if (p&1)
t=(t*a)%mod;
a=(a*a)%mod;
p>>=1;
}
return t%mod;
}

void build()
{
int now=0;
int len=strlen(w);
for (int i=0;i<len;i++)
{
int x=w[i]-'A';
if (!ch[now][x]) ch[now][x]=++tot;
now=ch[now][x];
}
ed[now]=1;
}

void make()
{
queue<int> q;
for (int i=0;i<26;i++)
if (ch[0][i])
q.push(ch[0][i]);
while (!q.empty())
{
int r=q.front();
q.pop();
for (int i=0;i<26;i++)
{
if (!ch[r][i])
{
ch[r][i]=ch[fail[r]][i];
continue;
}
fail[ch[r][i]]=ch[fail[r]][i];
ed[ch[r][i]]|=ed[fail[ch[r][i]]];  //儿子的ed  儿子fail的ed
q.push(ch[r][i]);
}
}
}

void doit()
{
int ans;
int i,j,k;
ans=KSM(26,m);  //总数
f[0][0]=1;  //
for (i=0;i<m;i++)  //构造m长度的字符串
for (j=0;j<=tot;j++)  //AC自动机上的点
if (!ed[j])  //不是结束字符
for (k=0;k<26;k++)  //枚举下一个点
{
int x=ch[j][k];  //节点编号
if (ed[x]) continue;
f[i+1][x]+=f[i][j];
f[i+1][x]%=mod;
}
for (i=0;i<=tot;i++)
if (!ed[i])  //
ans+=mod-f[m][i],ans%=mod;
printf("%d",ans);
return;
}

int main()
{
memset(ed,0,sizeof(ed));
scanf("%d%d",&n,&m);
for (int i=1;i<=n;i++)
{
scanf("%s",&w);
build();
}
make();
doit();
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: