您的位置:首页 > 其它

poj 3294 后缀数组求至少在k个串中出现的公共子串

2014-07-28 17:18 417 查看
做这道题伤心了,思路是对的,后缀数组的经典用法嘛。可是就是一直OLT,后来认真的思考了一下程序的逻辑,发现二分的时候,L应该从1开始,否则会有bug。

每次二分都写不好,真的伤心了 T_T。本以为这就ok了,结果还是WA。真的崩溃,后来没办法了,看了discuss,发现说G++肯能过,我就抱着试试的态度,提交上去结果RE。

我就发现是我有一个数组开小了。瞬间想哭,debug这么久,C++为什么就不提示RE呢。表示无语。

说了这么多废话,是因为真的想吐槽一下。

这个题的思路应该都知道,就是后缀数组把各个串连接起来,求height数组,然后二分分组,求公共前缀大于k的后缀有多少个,并且看它们是否分别在原来不同的串中。

关键就是实现细节了。其实认真的话,这道题是可以1A的。由于有一百多个串,中间加特殊字符就比较尴尬了,所以可以考虑把字符转化成整形来做,这样就可以很方便的加分隔符了。注意二分的时候,L=1,否则可能有bug ,反正我每次写二分都会出问题,表示很伤心也很郁闷。然后就是标记每个字符是在原来的那个串中,belong[j]=i;

大于等于k,进行分组的时候,要看各个后缀所在的串是否已经被标记,这样的话,要用到好多次memset,可能会很耗时。建议用不同的数来标记,这样应该会省点时间吧。具体的看代码,judge()里的appear,来进行不同标记。如果不懂,看一眼代码就知道什么意思了~

代码如下:

#include<iostream>
#include<cstring>
#include<cstdio>
#include<cmath>
#include<algorithm>
#define MAXD 110010
#define MAXL 2111
using namespace std;
int r[MAXD], Rank[MAXD], height[MAXD];
int sa[MAXD], wa[MAXD], wb[MAXD], WS[MAXD], wv[MAXD];
int cmp(int *p, int x, int y, int l)
{
return p[x] == p[y] && p[x + l] == p[y + l];
}
void da(int n, int m)      //n为字符串长度,m为字符的最大值
{
int i, j, p, *x = wa, *y = wb, *t;
for(i = 0; i < m; i ++)
WS[i] = 0;
for(i = 0; i < n; i ++)
++ WS[x[i] = r[i]];
for(i = 1; i < m; i ++)
WS[i] += WS[i - 1];
for(i = n - 1; i >= 0; i --)
sa[-- WS[x[i]]] = i;
for(p = 1, j = 1; p < n; j *= 2, m = p)
{
for(p = 0, i = n - j; i < n; i ++)
y[p ++] = i;
for(i = 0; i < n; i ++)
if(sa[i] >= j)
y[p ++] = sa[i] - j;
for(i = 0; i < n; i ++)
wv[i] = x[y[i]];
for(i = 0; i < m; i ++)
WS[i] = 0;
for(i = 0; i < n; i ++)
++ WS[wv[i]];
for(i = 1; i < m; i ++)
WS[i] += WS[i - 1];
for(i = n - 1; i >= 0; i --)
sa[-- WS[wv[i]]] = y[i];
for(t = x, x = y, y = t, x[sa[0]] = 0, p = 1, i = 1; i < n; i ++)
x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1: p ++;
}
}
void calheight(int n)  //n为串的长度减一
{
int i, j, k = 0;
for(i = 1; i <= n; i ++)
Rank[sa[i]] = i;
for(i = 0; i < n; height[Rank[i ++]] = k)
for(k ? -- k : 0, j = sa[Rank[i] - 1]; r[i + k] == r[j + k]; k ++);
}
char str[1111];
int n,half,totlen,L,R;
int belong[MAXD],used[111];
int start[1110];
int length;
void input()
{
int i,j=0,k=0,len;
for(i=1;i<=n;i++)
{
gets(str);
len=strlen(str);
for(j=0;j<len;j++)
{
r[k]=str[j];
belong[k]=i;
k++;
}
r[k]=300+i;
belong[k++]=i;
}
r[k]=0;
totlen=k;
}
int judge(int k)
{
int i,j,num=0,t=0;
int appear=1;
memset(used,0,sizeof(used));
for(i=1;i<=totlen;i++)
{
if(height[i]>=k)
{
int th=belong[sa[i]];
if(used!=appear)
{
used=appear;
num++;
if(num==half-1)
{
start[t++]=sa[i];
length=k;
}
}
}
else
{
num=0;
appear++;
used[belong[sa[i]]]=appear;
}
}
return t;
}
int main()
{
int i,j;
while(scanf("%d",&n)!=EOF)
{
getchar();
if(n==0) break;
input();
memset(height,0,sizeof(height));
da(totlen+1,2000);
calheight(totlen);
half=n/2+1;
L=1;R=1005;
int T=0,t;
length=0;
while(L<=R)
{
int mid=(L+R)/2;
t=judge(mid);
if(t) {L=mid+1;T=t;}
else R=mid-1;
}
if(T==0) { printf("\?\n\n"); continue; }
for(i=0;i<T;i++)
{
for(j=start[i];j<start[i]+length;j++)
printf("%c",char(r[j]));
printf("\n");
}
printf("\n");
}
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐