【瞎搞】回文自动机
2016-12-31 23:13
155 查看
眼看着本省神犇刷完了各种SAM套LCT的题,表示到现在连板子都没打过,还在做本校老师的专项……
“打好基础。”
然后后缀数组那里碰到了一个《高级数据结构》上的练习题,求本质不同回文字串个数。
后缀数组半天没想出来,想到回文自动机就去学了一下。
回文自动机是战斗民族2014年夏天发明的,原文可以去cf看。更具体的博客可以百度一下,虽然大部分都是抄来抄去一样的。
回文自动机跟后缀自动机原理差不多,每个节点表示一个回文串。节点维护len和cnt。有两个根节点,分别表示长度为偶数和奇数的回文串,令其分别为0号节点和1号节点。0号节点的len为0,1号节点的len为-1。为什么是-1?有好处的。
同样需要维护ch指针,表示在当前节点两端加一个字符所能到达的节点。另外,需要像AC自动机一样维护一个fail指针,表示当前串的最长回文后缀。全局的话要像SAM一样维护一个lst指针,表示上一个字符达到的节点。
说到这这个自动机就应该知道大概长什么样了。构建的话,首先,1号节点的fail指向0号节点,0号节点的指针指向1号节点,lst指向0号节点。对于新建的节点,一开始所有ch指针都指向0号节点。然后对于新来的字符,lst要先沿着fail走知道加上这个字符可以匹配,如果lst有这个字符的ch,直接走,否则需要新建节点。新节点的长度为lst->len+2(这时候看出来1号节点长度为-1的好处了),它的fail就是像AC自动机一样沿着lst的fail一直走,直到走到一个添加这个字符能匹配的节点,即str[i-p->len-1]==str[i](i是当前编号,p是走的节点)(这时候也看出来1号节点长度为-1的好处)。最后把lst更新即可。
在这个过程中如果同时维护cnt是不准的,需要在最后按照拓扑序重新累加一下。
时空复杂度我都当线性了,据说与字符集有关,还有好几个版本。我不会证,请百度一下。
于是APIO2014那道题就成了裸题,这道题也成了裸题,只要统计一下节点个数就好了。
看一下代码。(并没有cnt的维护)
平时写东西只会写指针版的,这回可好,要让所有ch指向0号节点得全设一遍了,否则默认就是0啊。但是我还是坚持指针,指针是一门艺术。
学习了一下后缀数组的做法,就是后缀数组求回文串和求本质不同字串的结合,还是反串拼在后面,每个节点对应最长回文串长度就是回文串个数,有重复的还是减去lcp即可。
“打好基础。”
然后后缀数组那里碰到了一个《高级数据结构》上的练习题,求本质不同回文字串个数。
后缀数组半天没想出来,想到回文自动机就去学了一下。
回文自动机是战斗民族2014年夏天发明的,原文可以去cf看。更具体的博客可以百度一下,虽然大部分都是抄来抄去一样的。
回文自动机跟后缀自动机原理差不多,每个节点表示一个回文串。节点维护len和cnt。有两个根节点,分别表示长度为偶数和奇数的回文串,令其分别为0号节点和1号节点。0号节点的len为0,1号节点的len为-1。为什么是-1?有好处的。
同样需要维护ch指针,表示在当前节点两端加一个字符所能到达的节点。另外,需要像AC自动机一样维护一个fail指针,表示当前串的最长回文后缀。全局的话要像SAM一样维护一个lst指针,表示上一个字符达到的节点。
说到这这个自动机就应该知道大概长什么样了。构建的话,首先,1号节点的fail指向0号节点,0号节点的指针指向1号节点,lst指向0号节点。对于新建的节点,一开始所有ch指针都指向0号节点。然后对于新来的字符,lst要先沿着fail走知道加上这个字符可以匹配,如果lst有这个字符的ch,直接走,否则需要新建节点。新节点的长度为lst->len+2(这时候看出来1号节点长度为-1的好处了),它的fail就是像AC自动机一样沿着lst的fail一直走,直到走到一个添加这个字符能匹配的节点,即str[i-p->len-1]==str[i](i是当前编号,p是走的节点)(这时候也看出来1号节点长度为-1的好处)。最后把lst更新即可。
在这个过程中如果同时维护cnt是不准的,需要在最后按照拓扑序重新累加一下。
时空复杂度我都当线性了,据说与字符集有关,还有好几个版本。我不会证,请百度一下。
于是APIO2014那道题就成了裸题,这道题也成了裸题,只要统计一下节点个数就好了。
看一下代码。(并没有cnt的维护)
#include <iostream> #include <cstdio> using namespace std; struct node{ int len; node *ch[26], *suf;//上面说的fail这里叫suf node(int l):len(l){} }*root0, *root1, *lst, *now; int ans; char s[100010]; //设置所有的ch指针 void st(node *p){ for(int i=0;i<26;i++) p->ch[i]=root0; } //找到匹配的fail node* fail(int i, node *p){ while(s[i-p->len-1]!=s[i]) p=p->suf; return p; } //扩展 void extend(){ for(int i=1;s[i];i++){ lst=fail(i, lst); //新建节点 if(lst->ch[s[i]-'a']==root0){ now=new node(lst->len+2), ans++; st(now); now->suf=fail(i, lst->suf)->ch[s[i]-'a']; lst->ch[s[i]-'a']=now; } lst=lst->ch[s[i]-'a']; } } int main(){ scanf("%s", s+1); s[0]='$'; root0=new node(0), root1=new node(-1); st(root0), st(root1); root1->suf=root0, root0->suf=root1; lst=root0; extend(); printf("%d\n", ans); return 0; }
平时写东西只会写指针版的,这回可好,要让所有ch指向0号节点得全设一遍了,否则默认就是0啊。但是我还是坚持指针,指针是一门艺术。
学习了一下后缀数组的做法,就是后缀数组求回文串和求本质不同字串的结合,还是反串拼在后面,每个节点对应最长回文串长度就是回文串个数,有重复的还是减去lcp即可。
相关文章推荐
- 回文树(回文自动机) - URAL 1960 Palindromes and Super Abilities
- 回文树(回文自动机)学习小结
- bzoj 3676: [Apio2014]回文串 回文自动机
- 回文(后缀)自动机模板
- BZOJ2342:双倍回文(回文自动机+树上差分)
- 【JZOJ3962】【NOI2015模拟12.27】str(回文自动机)
- bzoj 3676: [Apio2014]回文串 (回文自动机)
- 回文自动机 + DFS --- The 2014 ACM-ICPC Asia Xi’an Regional Contest Problem G.The Problem to Slow Down You
- BZOJ3676【回文自动机】
- BZOJ 2565 最长双回文串(回文自动机)
- 回文树(回文自动机) - BZOJ 3676 回文串
- 回文自动机 + DFS --- The 2014 ACM-ICPC Asia Xi’an Regional Contest Problem G.The Problem to Slow Down You
- [BZOJ]3676 [APIO2014] 回文串 回文自动机
- 【BZOJ3676】[Apio2014]回文串 【回文自动机】
- 回文自动机 资料
- bzoj 3676 记一下回文自动机的板
- 论如何优雅的处理回文串 - 回文自动机详解.
- 回文树/回文自动机 引入
- BZOJ2565【回文自动机】
- 论如何优雅的处理回文串 - 回文自动机详解