您的位置:首页 > 其它

poj 1743 Musical Theme 后缀数组

2016-08-16 21:45 357 查看
题意:有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:

    1.长度至少为5个音符。

    2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)

    3.重复出现的同一主题不能有公共部分。

首先构造差分序列,二分+height分段。至于不能重叠维护每一段最大值最小值。判断是否重叠即可

#include <iostream>
#include <algorithm>
#include <cstdio>
#include <cstring>
#include <cmath>
#include <queue>
#define INF 0x3f3f3f3f
using namespace std;
#define F(x) ((x) / 3 + ((x) % 3 == 1 ? 0 : tb))
#define G(x) ((x) < tb ? (x) * 3 + 1 :((x) - tb) * 3 + 2)
const int MAXN = 70010;
int wa[MAXN],wb[MAXN],ws[MAXN],wv[MAXN],wsd[MAXN],r[MAXN],sa[MAXN];
int c0(int *r,int a,int b)
{return r[a] == r[b] && r[a + 1] == r[b + 1] && r[a + 2] == r[b + 2];}
int c12(int k,int *r,int a,int b)
{if(k == 2) return r[a] < r[b] || r[a] == r[b] && c12(1,r,a + 1,b + 1);
else return r[a] < r[b] || r[a] == r[b] && wv[a + 1]< wv[b + 1];}
void sort(int *r,int *a,int *b,int n,int m)
{
int i;
for(i = 0 ; i < n ; i++) wv[i] = r[a[i]];
for(i = 0 ; i < m ; i++) wsd[i] = 0;
for(i = 0 ; i < n ; i++) wsd[wv[i]]++;
for(i = 1 ; i < m ; i++) wsd[i] += wsd[i - 1];
for(i = n - 1 ; i >= 0 ; i--) b[--wsd[wv[i]]] = a[i];
}

void dc3(int *r,int *sa,int n,int m)
{
int i,j,*rn = r + n ,*san = sa + n,ta = 0,tb = (n + 1) / 3,tbc = 0,p;
r
= r[n + 1] = 0;
for(i = 0 ; i < n ; i++) if(i % 3 != 0) wa[tbc++] = i;
sort(r + 2,wa,wb,tbc,m);
sort(r + 1,wb,wa,tbc,m);
sort(r,wa,wb,tbc,m);
for(p = 1,rn[F(wb[0])] = 0,i = 1 ; i < tbc ; i++)
rn[F(wb[i])] = c0(r,wb[i - 1],wb[i])?p - 1 : p++;
if(p < tbc) dc3(rn,san,tbc,p);
else for(i = 0 ; i < tbc ; i++) san[rn[i]] = i;
for(i = 0 ;i < tbc ; i++) if(san[i] < tb) wb[ta++] = san[i] * 3;
if(n % 3 == 1) wb[ta++] = n - 1;
sort(r,wb,wa,ta,m);
for(i = 0 ; i < tbc ; i++) wv[wb[i] = G(san[i])] = i;
for(i = 0,j = 0,p = 0 ; i < ta && j < tbc ; p++)
sa[p]=c12(wb[j] % 3,r,wa[i],wb[j]) ? wa[i++] : wb[j++];
for(;i < ta ; p++) sa[p] = wa[i++];
for(;j < tbc ; p++) sa[p] = wb[j++];
}
int Rank[MAXN],height[MAXN];
void calheight(int *r,int *sa,int n)
{
int i,j,k = 0;
for(i = 1 ; i <= n ; i++) Rank[sa[i]] = i;
for(i = 0 ; i < n ; height[Rank[i++]] = k)
for(k ? k--:0,j = sa[Rank[i] - 1] ;r[i + k]==r[j + k];k++);
}
int a[MAXN];
bool judge(int mid,int n){
int cas = 2;
while(true){
while(cas<=n && height[cas] < mid) cas++;
if(cas > n) return false;
int mn = sa[cas-1];
int mx = sa[cas-1];
while(cas<=n && height[cas] >= mid){
mn = min(mn,sa[cas]);
mx = max(mx,sa[cas]);
cas++;
if(mx-mn >= mid) return true;
}
}
return false;
}
int main(){
int n;
while(scanf("%d",&n),n){
for(int i = 0; i < n; ++i){
scanf("%d",&a[i]);
}
if(n < 10){
puts("0");
continue;
}
n--;
for(int i = 0; i < n; ++i){
a[i] = a[i+1]-a[i]+88;
}
a
= 0;//设定最后一个为最小
//176 为基数排序 在a[i]中出现最大的数加1
//n为字符串长度,m为字符的取值范围
dc3(a,sa,n+1,176);
//height数组的值应该是从height[1]开始的,而且height[1]应该是等于0的。
//原因是,因为我们在字符串后面添加了一个0号字符,
//所以它必然是最小的一个后缀。而字符串中的其他字符都应该是大于0的
//所以排名第二的字符串和0号字符的公共前缀(即height[1])应当为0.
//在调用calheight函数时,要注意height数组的范围应该是[1..n]。
//所以调用时应该是calheight(r,sa,n)而不是calheight(r,sa,n+1)。
calheight(a,sa,n);
int l = 4,r = n/2;
int ans = -1;
while(l <= r){
int mid = (l+r)>>1;
if(judge(mid,n)){
ans = mid;
l = mid+1;
}
else{
r = mid-1;
}
}
ans++;
printf("%d\n",ans);
}
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: