poj 3294 后缀数组求至少在k个串中出现的公共子串
2014-07-28 17:18
417 查看
做这道题伤心了,思路是对的,后缀数组的经典用法嘛。可是就是一直OLT,后来认真的思考了一下程序的逻辑,发现二分的时候,L应该从1开始,否则会有bug。
每次二分都写不好,真的伤心了 T_T。本以为这就ok了,结果还是WA。真的崩溃,后来没办法了,看了discuss,发现说G++肯能过,我就抱着试试的态度,提交上去结果RE。
我就发现是我有一个数组开小了。瞬间想哭,debug这么久,C++为什么就不提示RE呢。表示无语。
说了这么多废话,是因为真的想吐槽一下。
这个题的思路应该都知道,就是后缀数组把各个串连接起来,求height数组,然后二分分组,求公共前缀大于k的后缀有多少个,并且看它们是否分别在原来不同的串中。
关键就是实现细节了。其实认真的话,这道题是可以1A的。由于有一百多个串,中间加特殊字符就比较尴尬了,所以可以考虑把字符转化成整形来做,这样就可以很方便的加分隔符了。注意二分的时候,L=1,否则可能有bug ,反正我每次写二分都会出问题,表示很伤心也很郁闷。然后就是标记每个字符是在原来的那个串中,belong[j]=i;
大于等于k,进行分组的时候,要看各个后缀所在的串是否已经被标记,这样的话,要用到好多次memset,可能会很耗时。建议用不同的数来标记,这样应该会省点时间吧。具体的看代码,judge()里的appear,来进行不同标记。如果不懂,看一眼代码就知道什么意思了~
代码如下:
每次二分都写不好,真的伤心了 T_T。本以为这就ok了,结果还是WA。真的崩溃,后来没办法了,看了discuss,发现说G++肯能过,我就抱着试试的态度,提交上去结果RE。
我就发现是我有一个数组开小了。瞬间想哭,debug这么久,C++为什么就不提示RE呢。表示无语。
说了这么多废话,是因为真的想吐槽一下。
这个题的思路应该都知道,就是后缀数组把各个串连接起来,求height数组,然后二分分组,求公共前缀大于k的后缀有多少个,并且看它们是否分别在原来不同的串中。
关键就是实现细节了。其实认真的话,这道题是可以1A的。由于有一百多个串,中间加特殊字符就比较尴尬了,所以可以考虑把字符转化成整形来做,这样就可以很方便的加分隔符了。注意二分的时候,L=1,否则可能有bug ,反正我每次写二分都会出问题,表示很伤心也很郁闷。然后就是标记每个字符是在原来的那个串中,belong[j]=i;
大于等于k,进行分组的时候,要看各个后缀所在的串是否已经被标记,这样的话,要用到好多次memset,可能会很耗时。建议用不同的数来标记,这样应该会省点时间吧。具体的看代码,judge()里的appear,来进行不同标记。如果不懂,看一眼代码就知道什么意思了~
代码如下:
#include<iostream> #include<cstring> #include<cstdio> #include<cmath> #include<algorithm> #define MAXD 110010 #define MAXL 2111 using namespace std; int r[MAXD], Rank[MAXD], height[MAXD]; int sa[MAXD], wa[MAXD], wb[MAXD], WS[MAXD], wv[MAXD]; int cmp(int *p, int x, int y, int l) { return p[x] == p[y] && p[x + l] == p[y + l]; } void da(int n, int m) //n为字符串长度,m为字符的最大值 { int i, j, p, *x = wa, *y = wb, *t; for(i = 0; i < m; i ++) WS[i] = 0; for(i = 0; i < n; i ++) ++ WS[x[i] = r[i]]; for(i = 1; i < m; i ++) WS[i] += WS[i - 1]; for(i = n - 1; i >= 0; i --) sa[-- WS[x[i]]] = i; for(p = 1, j = 1; p < n; j *= 2, m = p) { for(p = 0, i = n - j; i < n; i ++) y[p ++] = i; for(i = 0; i < n; i ++) if(sa[i] >= j) y[p ++] = sa[i] - j; for(i = 0; i < n; i ++) wv[i] = x[y[i]]; for(i = 0; i < m; i ++) WS[i] = 0; for(i = 0; i < n; i ++) ++ WS[wv[i]]; for(i = 1; i < m; i ++) WS[i] += WS[i - 1]; for(i = n - 1; i >= 0; i --) sa[-- WS[wv[i]]] = y[i]; for(t = x, x = y, y = t, x[sa[0]] = 0, p = 1, i = 1; i < n; i ++) x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1: p ++; } } void calheight(int n) //n为串的长度减一 { int i, j, k = 0; for(i = 1; i <= n; i ++) Rank[sa[i]] = i; for(i = 0; i < n; height[Rank[i ++]] = k) for(k ? -- k : 0, j = sa[Rank[i] - 1]; r[i + k] == r[j + k]; k ++); } char str[1111]; int n,half,totlen,L,R; int belong[MAXD],used[111]; int start[1110]; int length; void input() { int i,j=0,k=0,len; for(i=1;i<=n;i++) { gets(str); len=strlen(str); for(j=0;j<len;j++) { r[k]=str[j]; belong[k]=i; k++; } r[k]=300+i; belong[k++]=i; } r[k]=0; totlen=k; } int judge(int k) { int i,j,num=0,t=0; int appear=1; memset(used,0,sizeof(used)); for(i=1;i<=totlen;i++) { if(height[i]>=k) { int th=belong[sa[i]]; if(used!=appear) { used =appear; num++; if(num==half-1) { start[t++]=sa[i]; length=k; } } } else { num=0; appear++; used[belong[sa[i]]]=appear; } } return t; } int main() { int i,j; while(scanf("%d",&n)!=EOF) { getchar(); if(n==0) break; input(); memset(height,0,sizeof(height)); da(totlen+1,2000); calheight(totlen); half=n/2+1; L=1;R=1005; int T=0,t; length=0; while(L<=R) { int mid=(L+R)/2; t=judge(mid); if(t) {L=mid+1;T=t;} else R=mid-1; } if(T==0) { printf("\?\n\n"); continue; } for(i=0;i<T;i++) { for(j=start[i];j<start[i]+length;j++) printf("%c",char(r[j])); printf("\n"); } printf("\n"); } return 0; } 相关文章推荐
- POJ 题目3294Life Forms(后缀数组求超过k个的串的最长公共子串)
- POJ 3294 Life Forms (后缀数组,求出现在不少于k个字符串的最长子串)
- poj 3294 求多于k个字符串的最长公共子串的个数-------后缀数组+二分答案
- POJ 3294 Life Forms (后缀数组,求出现在不少于k个字符串的最长子串)
- Poj 3294 Life Forms (后缀数组 在n个串中出现k次的最长公共子串并输出)
- poj 3294 Life Forms(n个字符串中 求公共子串长度超过k得最大子串 后缀数组)
- POJ 3294 出现在至少K个字符串中的子串
- POJ 3294 Life Forms(后缀数组求k个串的最长子串)
- poj 3261 Milk Patterns (后缀数组 至少出现k次的可重叠最长重复子串)
- poj 3294 在K个字符串中出现最长公共子串
- POJ 3294 Life Forms(不小于k个字符串中的最长子串 后缀数组)
- POJ 3294 后缀数组:求不小于k个字符串中的最长子串
- poj 3882 后缀数组 求一个串至少出现k次的最长重复子串的长度
- POJ 1226 Substrings (后缀数组 n个串的最长公共子串)
- (Relax 后缀数组1.4)POJ 2774 Long Long Message(求两个字符串公共子串的最大长度)
- POJ 2774 Long Long Message 求两个串最长公共子串(后缀数组)
- poj 3261 Milk Patterns(最长至少k次重复子串,后缀数组基础题)
- poj 3450/poj 3080 多串最长公共子串 后缀数组
- POJ-Common Substrings(后缀数组-长度不小于 k 的公共子串的个数)
- POJ 2774 Long Long Message(后缀数组求最长公共子串,4级)