您的位置:首页 > 其它

POJ 1743 Musical Theme (不可重叠最长重复子串)

2015-09-07 10:52 393 查看
后缀数组+二分答案

题目:找到一个字符串内长度不小于五的最长不重复字串,字串的所有数字同时加上或减去一同一个数也算重复出现。

解析:首先最所有数字作差,原数据为a[i]新数据为a[i]=a[i+1]-a[i],这样一来及时原先的字串是进行过加或减那他们的差值也会相同,所以转换为求现有a[]中大与5的最长重复字串,用后缀数组。首先由二分答案的方法将问题变成判定性的:长度大于k的重复字串有没有?然后将height数组分组,每组内的后缀之间的height都要大于k,如果每组内的后缀之间的最长公共前缀有大于k的而且这两个后缀的sa[]之差大于k就说明存在长度至少为k的不重复子串。求最长公共前缀就要用到height数组,因为这组中任意两个后缀的公共前缀必定是某些height值中的最小值,而这个值如果最大则一定是这组中height中的最大值。

//#pragma commmpnt(linkmpr, "/STACK:102400000,102400000")
#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
#include <cmath>
using namespace std;
typedef long long LL;
const int M = 10055;

/* *suffix array *倍增算法  O(n*logn)
*待排序数组长度为n,放在0~n-1中,在最后面补一个0
*da(str ,n+1,sa,Rank,height,  ,   );//注意是n+1;
*例如: *n   = 8;
*num[]   = { 1, 1, 2, 1, 1, 1, 1, 2, $ };注意num最后一位为0,其他大于0
*Rank[]  = { 4, 6, 8, 1, 2, 3, 5, 7, 0 };Rank[0~n-1]为有效值,Rank
必定为0无效 值
*sa[]    = { 8, 3, 4, 5, 0, 6, 1, 7, 2 };sa[1~n]为有效值,sa[0]必定为n是无效值
*height[]= { 0, 0, 3, 2, 3, 1, 2, 0, 1 };height[2~n]为有效值 * */

const int MAXN=20010;
int t1[MAXN],t2[MAXN],c[MAXN];
//求SA数组需要的中间变量,不需要赋值
//待排序的字符串放在s数组中,从s[0]到s[n-1],长度为n,且最大值小于m,
//除s[n-1]外的所有s[i]都大于0,r[n-1]=0
//函数结束以后结果放在sa数组中

bool cmp(int *r,int a,int b,int l)
{
return r[a] == r[b] && r[a+l] == r[b+l];
}

void da(int *str,int *sa,int *Rank,int *height,int n,int m)
{
n++;
int i, j, p, *x = t1, *y = t2;     //第一轮基数排序,如果s的最大值很大,可改为快速排序
for(i = 0; i < m; i++)c[i] = 0;
for(i = 0; i < n; i++)c[x[i] = str[i]]++;
for(i = 1; i < m; i++)c[i] += c[i-1];
for(i = n-1; i >= 0; i--)sa[--c[x[i]]] = i;
for(j = 1; j <= n; j <<= 1)
{
p = 0;         //直接利用sa数组排序第二关键字
for(i = n-j; i < n; i++)y[p++] = i;//后面的j个数第二关键字为空的最小
for(i = 0; i < n; i++)if(sa[i] >= j)y[p++] = sa[i] - j;         //这样数组y保存的就是按照第二关键字排序的结果
//基数排序第一关键字
for(i = 0; i < m; i++)c[i] = 0;
for(i = 0; i < n; i++)c[x[y[i]]]++;
for(i = 1; i < m; i++)c[i] += c[i-1];
for(i = n-1; i >= 0; i--)sa[--c[x[y[i]]]] = y[i];        //根据sa和x数组计算新的x数组
swap(x,y);
p = 1;
x[sa[0]] = 0;
for(i = 1; i < n; i++)
x[sa[i]] = cmp(y,sa[i-1],sa[i],j)?p-1:p++;
if(p >= n)
break;
m = p;//下次基数排序的最大值
}
int k = 0;
n--;
for(i = 0; i <= n; i++)
Rank[sa[i]] = i;
for(i = 0; i < n; i++)
{
if(k)
k--;
j = sa[Rank[i]-1];
while(str[i+k] == str[j+k])
k++;
height[Rank[i]] = k;
}
}

int Rank[MAXN],height[MAXN];

int a[MAXN];
int r[MAXN];
int sa[MAXN];
int num,n,ans;

int is_ok(int len)
{
int i = 2, ma, mi;
while(1)
{
while(i <= n && height[i] < len)
i++;
if(i > n) break;
ma = sa[i-1];
mi = sa[i-1];
while(i <= n && height[i] >= len)
{
ma = max(ma, sa[i]);
mi = min(mi, sa[i]);
i ++;
}
if(ma - mi >= len)
return 1;
}

return 0;

}

int find_ans()
{
int l=4,r=n/2,mid;
ans=-1;
while(l<=r)
{
mid=(l+r)>>1;
if(is_ok(mid))
{
l=mid+1;
ans=max(ans,mid);
}
else
r=mid-1;
}
if(ans>=4)
printf("%d\n",ans+1);
else
printf("0\n");
return 0;
}

int main()
{
while(~scanf("%d",&n) ,n)
{
for(int i=0; i<n; ++i)
{
scanf("%d",&a[i]);
}
for(int i=0;i<n-1;++i)
{
a[i]=a[i+1]-a[i]+89;

}

a
=0;

da(a,sa,Rank,height,n,200);

find_ans();

}
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: