您的位置:首页 > 理论基础 > 数据结构算法

【瞎搞】回文自动机

2016-12-31 23:13 155 查看
眼看着本省神犇刷完了各种SAM套LCT的题,表示到现在连板子都没打过,还在做本校老师的专项……

“打好基础。”

然后后缀数组那里碰到了一个《高级数据结构》上的练习题,求本质不同回文字串个数。

后缀数组半天没想出来,想到回文自动机就去学了一下。

回文自动机是战斗民族2014年夏天发明的,原文可以去cf看。更具体的博客可以百度一下,虽然大部分都是抄来抄去一样的。

回文自动机跟后缀自动机原理差不多,每个节点表示一个回文串。节点维护len和cnt。有两个根节点,分别表示长度为偶数和奇数的回文串,令其分别为0号节点和1号节点。0号节点的len为0,1号节点的len为-1。为什么是-1?有好处的。

同样需要维护ch指针,表示在当前节点两端加一个字符所能到达的节点。另外,需要像AC自动机一样维护一个fail指针,表示当前串的最长回文后缀。全局的话要像SAM一样维护一个lst指针,表示上一个字符达到的节点。

说到这这个自动机就应该知道大概长什么样了。构建的话,首先,1号节点的fail指向0号节点,0号节点的指针指向1号节点,lst指向0号节点。对于新建的节点,一开始所有ch指针都指向0号节点。然后对于新来的字符,lst要先沿着fail走知道加上这个字符可以匹配,如果lst有这个字符的ch,直接走,否则需要新建节点。新节点的长度为lst->len+2(这时候看出来1号节点长度为-1的好处了),它的fail就是像AC自动机一样沿着lst的fail一直走,直到走到一个添加这个字符能匹配的节点,即str[i-p->len-1]==str[i](i是当前编号,p是走的节点)(这时候也看出来1号节点长度为-1的好处)。最后把lst更新即可。

在这个过程中如果同时维护cnt是不准的,需要在最后按照拓扑序重新累加一下。

时空复杂度我都当线性了,据说与字符集有关,还有好几个版本。我不会证,请百度一下。

于是APIO2014那道题就成了裸题,这道题也成了裸题,只要统计一下节点个数就好了。

看一下代码。(并没有cnt的维护)

#include <iostream>
#include <cstdio>
using namespace std;
struct node{
int len;
node *ch[26], *suf;//上面说的fail这里叫suf
node(int l):len(l){}
}*root0, *root1, *lst, *now;
int ans;
char s[100010];
//设置所有的ch指针
void st(node *p){
for(int i=0;i<26;i++)
p->ch[i]=root0;
}
//找到匹配的fail
node* fail(int i, node *p){
while(s[i-p->len-1]!=s[i])
p=p->suf;
return p;
}
//扩展
void extend(){
for(int i=1;s[i];i++){
lst=fail(i, lst);
//新建节点
if(lst->ch[s[i]-'a']==root0){
now=new node(lst->len+2), ans++; st(now);
now->suf=fail(i, lst->suf)->ch[s[i]-'a'];
lst->ch[s[i]-'a']=now;
}
lst=lst->ch[s[i]-'a'];
}
}
int main(){
scanf("%s", s+1); s[0]='$';
root0=new node(0), root1=new node(-1);
st(root0), st(root1);
root1->suf=root0, root0->suf=root1;
lst=root0;
extend();
printf("%d\n", ans);
return 0;
}


平时写东西只会写指针版的,这回可好,要让所有ch指向0号节点得全设一遍了,否则默认就是0啊。但是我还是坚持指针,指针是一门艺术。

学习了一下后缀数组的做法,就是后缀数组求回文串和求本质不同字串的结合,还是反串拼在后面,每个节点对应最长回文串长度就是回文串个数,有重复的还是减去lcp即可。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息