您的位置:首页 > 其它

【后缀数组学习中】

2015-07-20 04:21 295 查看
小白书 219 页入门

大概懂得后缀数组原理 即后缀排序后的下标所形成的数组

裸的算法是 n*n*logn:直接利用定义 对所有后缀快排........

稍微好点. nlogn的倍增算法 原理懂了

更好点 线性时间的...只是简单涉及了没有

逛逛博客 学习前人优秀代码风格

http://dongxicheng.org/structure/suffix-array/

很好的将几篇国家队论文整合了,题目,介绍都有。好好研究

http://blog.csdn.net/xymscau/article/details/8798046



提供了代码和几个练习题

http://www.cnblogs.com/kuangbin/archive/2013/05/20/3089189.html



kuangbing写的

const int MAXN=300000;
char s[MAXN];
int sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],n;
void build_sa(int m){
int *x=t, *y=t2;
for(int i = 0 ; i < m ;i++) c[i] = 0;
for(int i = 0 ; i < n ;i++) c[x[i]=s[i]]++;
for(int i = 1 ; i < m ;i++) c[i] += c[i-1];
for(int i=n-1 ; i >= 0;i--) sa[--c[x[i]]] = i;
for(int k = 1 ; k <= n; k <<=1) {
int p=0;
//直接利用sa数组排序第二关键字
for(int i = n-k ;i < n ;i++) y[p++]=i;
for(int i = 0; i < n; i++)   if(sa[i] >= k) y[p++] = sa[i]-k;
//基数排序第一关键字
for(int i = 0; i < m; i++)   c[i]=0;
for(int i = 0; i < n; i++)   c[x[y[i]]]++;
for(int i = 0; i < m; i++)   c[i] += c[i-1];
for(int i = n-1;i >= 0; i--) sa[--c[x[y[i]]]]=y[i];
//根据sa和y数组重新计算新的y数组
swap(x,y);
p = 1; x[sa[0]] = 0;
for(int i = 1;i < n; i++)
x[sa[i]] = y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k] ? p-1: p++;
if(p >=n ) break;
m=p;
}
}

以上代码还需好好研究.

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

罗穗骞

后缀数组——处理字符串的有力工具

仔细研读后缀数组基本能全懂了

一.后缀数组代码

1.为什么要在最后加一个很小的在最后呢?(在第九页解释了)

这里可以看到规定s
=0 的好处,如果s[a]=s[b] 说明以s[a]或s[b]开头的长度为l的字符串肯定不包括字符s

所以调用s[a+l] 和s[b+l] 不会导致数组下标越界,这样就不需要做特殊判断。

二.后缀数组的应用

2.1 最长公共前缀

height 数组:定义 height[i]= suffix(sa[i-1]) 和 suffix(sa[i]) 的最长公共前缀,也就是排名相邻的两个后缀的最长公共前缀。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: