HDU1403(后缀数组--最长公共子串)
2013-02-16 22:45
337 查看
题目:Longest Common Substring
看代码注释请戳这里
题意:判断给定的两个串中,最长的公共串。
思路:将它们合并为一个串,然后利用后缀数组求解。
首先是二倍增算法:时间复杂度为O(n*log(n))
[b]DC3算法的时间复杂度为:O(n)
看代码注释请戳这里
题意:判断给定的两个串中,最长的公共串。
思路:将它们合并为一个串,然后利用后缀数组求解。
首先是二倍增算法:时间复杂度为O(n*log(n))
#include <stdio.h> #include <string.h> #define max 1000010 int wa[max],wb[max],wv[max],ws[max]; int rank[max],height[max]; int sa[max],r[max]; char str[max*2]; int cmp(int *r,int a,int b,int l) { return r[a]==r&&r[a+l]==r[b+l]; } void da(int *r,int *sa,int n,int m) { int i,j,p,*x=wa,*y=wb,*t; for(i=0; i<m; i++) ws[i]=0; for(i=0; i<n; i++) ws[x[i]=r[i]]++; for(i=1; i<m; i++) ws[i]+=ws[i-1]; for(i=n-1; i>=0; i--) sa[--ws[x[i]]]=i; for(p=1,j=1; p<n; j*=2,m=p) { for(p=0,i=n-j; i<n; i++) y[p++]=i; for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j; for(i=0; i<n; i++) wv[i]=x[y[i]]; for(i=0; i<m; i++) ws[i]=0; for(i=0; i<n; i++) ws[wv[i]]++; for(i=1; i<m; i++) ws[i]+=ws[i-1]; for(i=n-1; i>=0; i--) sa[--ws[wv[i]]]=y[i]; for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++ ) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; } } void calheight(int *r,int *sa,int n) { int i,j,k=0; for(i=1; i<=n; i++) rank[sa[i]]=i; for(i=0; i<n; height[rank[i++]]=k) for(k?k--:0,j=sa[rank[i]-1]; r[i+k]==r[j+k]; k++); } int main() { while(scanf("%s",str)!=EOF) { int len=strlen(str); int len1=len; str[len]='9'; scanf("%s",str+len1+1); len=strlen(str); for(int i=0;i<len;i++) r[i]=str[i]; r[len]=0; da(r,sa,len,300); calheight(r,sa,len); int maxint=0; for(int i=2; i<len; i++) { if(maxint<height[i]) { if((sa[i]>len1&&sa[i-1]<len1)||(sa[i]<len1&&sa[i-1]>len1)) maxint=height[i]; } } printf("%d\n",maxint); } return 0; }
[b]DC3算法的时间复杂度为:O(n)
#include <stdio.h> #include <string.h> #define N 4000010 #define F(x) x/3+(x%3==1? 0:tb) #define G(x) x<tb? x*3+1:(x-tb)*3+2 int wa ,wb ,wv ,ws ,sa ,r ; int height ,rank ; char str[N*2]; int c0(int *r,int a,int b) { return r[a]==r[b]&&r[a+1]==r[b+1]&&r[a+2]==r[b+2]; } int c12(int k,int *r,int a,int b) { if(k==2) return r[a]<r[b]||r[a]==r[b]&&c12(1,r,a+1,b+1); else return r[a]<r[b]||r[a]==r[b]&&wv[a+1]<wv[b+1]; } void sort(int *r,int *a,int *b,int n,int m) { int i; for(i=0;i<n;i++) wv[i]=r[a[i]]; for(i=0;i<m;i++) ws[i]=0; for(i=0;i<n;i++) ws[wv[i]]++; for(i=1;i<m;i++) ws[i]+=ws[i-1]; for(i=n-1;i>=0;i--) b[--ws[wv[i]]]=a[i]; } void dc3(int *r,int *sa,int n,int m) { int i,j,*rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p; r =r[n+1]=0; for(i=0;i<n;i++) if(i%3!=0) wa[tbc++]=i; sort(r+2,wa,wb,tbc,m); sort(r+1,wb,wa,tbc,m); sort(r,wa,wb,tbc,m); for(p=1,rn[F(wb[0])]=0,i=1;i<tbc;i++) rn[F(wb[i])]=c0(r,wb[i-1],wb[i])? p-1:p++; if(p<tbc) dc3(rn,san,tbc,p); else for(i=0;i<tbc;i++) san[rn[i]]=i; for(i=0;i<tbc;i++) if(san[i]<tb) wb[ta++]=san[i]*3; if(n%3==1) wb[ta++]=n-1; sort(r,wb,wa,ta,m); for(i=0;i<tbc;i++) wv[wb[i]=G(san[i])]=i; for(i=0,j=0,p=0;i<ta&&j<tbc;p++) sa[p]=c12(wb[j]%3,r,wa[i],wb[j])? wa[i++]:wb[j++]; for(;i<ta;p++) sa[p]=wa[i++]; for(;j<tbc;p++) sa[p]=wb[j++]; } void calheight(int *r,int *sa,int n) { int i,j,k=0; for(i=1; i<=n; i++) rank[sa[i]]=i; for(i=0; i<n; height[rank[i++]]=k) for(k?k--:0,j=sa[rank[i]-1]; r[i+k]==r[j+k]; k++); } int main() { while(scanf("%s",str)!=EOF) { int len=strlen(str); int len1=len; str[len]='9'; scanf("%s",str+len1+1); len=strlen(str); for(int i=0;i<len;i++) r[i]=str[i]; r[len]=0; //注意最后一个元素尽量小,所以为0合适 dc3(r,sa,len,300); calheight(r,sa,len); int maxint=0; for(int i=2; i<len; i++) { if(maxint<height[i]) { if((sa[i]>len1&&sa[i-1]<len1)||(sa[i]<len1&&sa[i-1]>len1)) maxint=height[i]; } } printf("%d\n",maxint); } return 0; }
相关文章推荐
- hdu 1403 Longest Common Substring 后缀数组求最长公共子串
- HDU 1403 Longest Common Substring(后缀数组,最长公共子串)
- hdu 1403 Longest Common Substring 后缀数组求最长公共子串
- POJ 2774 Long Long Message+Hdu 1403 Longest Common Substring (后缀数组 最长公共子串)
- hdu1403 后缀数组求最长公共子串
- HDU 1403 Longest Common Substring(后缀数组 最长公共子串)
- hdu1403---Longest Common Substring(后缀数组求2个字符串的最长公共子串)
- hdu1403 && poj 2774 最长公共子串 后缀数组
- Poj 3080 Blue Jeans + Hdu 2328 Corporate Identity (后缀数组 字典序最小的最长公共子串)
- 两个字符串的最长公共子串-后缀数组
- POJ2774---Long Long Message(后缀数组,求最长公共子串)
- POJ 1226 Substrings (后缀数组 n个串的最长公共子串)
- 实用算法实现-第 8 篇 后缀树和后缀数组 [3 两个字符串的最长公共子串]
- POJ 2774 后缀数组:求最长公共子串
- POJ 2774 Long Long Message(后缀数组[最长公共子串])
- Long Long Message+POJ+后缀数组之求最长公共子串
- 最长公共子串(后缀数组+LCP)
- POJ_P2774 Long Long Message/Codevs_P3160 最长公共子串(后缀数组)
- POJ 2774 Long Long Message (后缀数组求最长公共子串)
- 最长公共子串(后缀数组)