您的位置:首页 > 其它

POJ 2774 Long Long Message+Hdu 1403 Longest Common Substring (后缀数组 最长公共子串)

2013-08-05 21:01 549 查看
两题虽然描述不同,但模型完全一样,代码也一样……

题意:求给出的两个字符串的最长公共子串,注意和用DP做的LCS(最长公共子序列)不同,子串要求连续

思路:将两串拼接起来,中间连接处插入特殊字符,然后问题就转换成了求最长的LCP,其满足两个后缀分属不同的串。两串的最长LCP必定相邻,枚举height[i]求最大值,然后判断对应的两个sa[i-1]和ssa[i]是否属于不同的两个串即可。

#include <cstdio>
#include <cstring>
#define max(a,b) ((a)>(b)?(a):(b))
#define min(a,b) ((a)<(b)?(a):(b))

const int N = int(2e5)+10; //两个串的总长

#define F(x) ((x)/3+((x)%3==1?0:tb))
#define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2)

int wa
,wb
,wv
,ws
;
int c0 (int *r,int a,int b){
	return r[a]==r[b] && r[a+1]==r[b+1] && r[a+2]==r[b+2];
}
int c12 (int k,int *r,int a,int b){
	if (k==2) return r[a]<r[b] || r[a]==r[b] && c12(1,r,a+1,b+1);
	else return r[a]<r[b] || r[a]==r[b] && wv[a+1]<wv[b+1];
}
void sort (int *r,int *a,int *b,int n,int m){
	int i;
	for(i=0;i<n;i++) wv[i]=r[a[i]];
	for(i=0;i<m;i++) ws[i]=0;
	for(i=0;i<n;i++) ws[wv[i]]++;
	for(i=1;i<m;i++) ws[i]+=ws[i-1];
	for(i=n-1;i>=0;i--) b[--ws[wv[i]]]=a[i];
}
void DC3 (int *r,int *sa,int n,int m){
	int i,j,*rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p;
	r
=r[n+1]=0;
	for(i=0;i<n;i++) if(i%3!=0) wa[tbc++]=i;
	sort(r+2,wa,wb,tbc,m);
	sort(r+1,wb,wa,tbc,m);
	sort(r,wa,wb,tbc,m);
	for(p=1,rn[F(wb[0])]=0,i=1;i<tbc;i++)
		rn[F(wb[i])]=c0(r,wb[i-1],wb[i])?p-1:p++;
	if(p<tbc) DC3(rn,san,tbc,p);
	else for(i=0;i<tbc;i++) san[rn[i]]=i;
	for(i=0;i<tbc;i++) if(san[i]<tb) wb[ta++]=san[i]*3;
	if(n%3==1) wb[ta++]=n-1;
	sort(r,wb,wa,ta,m);
	for(i=0;i<tbc;i++) wv[wb[i]=G(san[i])]=i;
	for(i=0,j=0,p=0;i<ta && j<tbc;p++)
		sa[p]=c12(wb[j]%3,r,wa[i],wb[j])?wa[i++]:wb[j++];
	for(;i<ta;p++) sa[p]=wa[i++];
	for(;j<tbc;p++) sa[p]=wb[j++];
}  
int rank
,height
,sa[3*N],data[3*N];

void calheight(int *r,int *sa,int n){
//	memset(height,0,sizeof(height));
//	memset(rank,0,sizeof(rank));
	int i,j,k=0;
	for(i=1;i<=n;i++) rank[sa[i]]=i;
	for(i=0;i<n; height[rank[i++]] = k )
	for(k?k--:0,j=sa[rank[i]-1]; r[i+k]==r[j+k]; k++);
}

int n1,n2;
char str[N<<1];

bool Judge (__int64 a,__int64 b)  //居然要用__int64........
{
	if ((a-n1)*(b-n1)<0)
		return true;
	return false;
}

int Deal ()
{
	int maxn=-1;
	DC3(data,sa,n1+n2+2,'z'+1);
	calheight(data,sa,n1+n2+1);  
	for (int i=2;i<=n1+n2+1;i++)
		if (Judge(sa[i-1],sa[i]))
			maxn=max(maxn,height[i]);
	return maxn;
}

int main ()
{
	while (~scanf("%s",str))
	{
		int i;
		n1=strlen(str);
		for (i=0;i<n1;i++)
			data[i]=(int)str[i];
		data[i]=1;   //不同于串中字符的分隔符
		scanf("%s",str);
		n2=strlen(str);
		for (i=0;i<n2;i++)
			data[n1+1+i]=(int)str[i];
		data[n1+1+i]=0;
		printf("%d\n",Deal());
	}
	return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: