后缀数组经典题---不可重叠最长重复子串 poj1743
2015-08-26 22:15
302 查看
内容也是别处看来的,就不写原创了
题意:有N(1
<= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:
1.长度至少为5个音符。
2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)
3.重复出现的同一主题不能有公共部分。
思路:后缀数组。求出任意相邻音符的差值,然后把问题转化为 不可重叠最长重复子串,用后缀数组来做。先二分答案,把题目变成判定性问题:判断是否存在两个长度为k的子串是相同的,且不重叠。解决这个问题的关键还是利用 height数组。把排序后的后缀分成若干组,其中每组的后缀之间的height值都不小于k。例如,字符串为“aabaaaab”,当k=2时,后缀分成了4组,如下图所示(摘自罗穗骞的国家集训队论文):
ps:在每个分组里面找不重叠的子串
然后,易知最长公共前缀不小于k的两个后缀一定在同一组里,也就是说不重复的最长重复子串肯定在同一组了,但是有没有呢还要看同一组里的后缀的sa[]的最大值跟最小值之差是否不小于k,sa[]是排在第几的后缀是谁,即该后缀的起始坐标,你要保证最大值的后缀与最小值的后缀起始坐标之间相差k才行,保证两个后缀的公共前缀不重合才行。
关键是要明确height[]与sa[]数组是干啥的,各代表什么意义才行。
题意:有N(1
<= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:
1.长度至少为5个音符。
2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)
3.重复出现的同一主题不能有公共部分。
思路:后缀数组。求出任意相邻音符的差值,然后把问题转化为 不可重叠最长重复子串,用后缀数组来做。先二分答案,把题目变成判定性问题:判断是否存在两个长度为k的子串是相同的,且不重叠。解决这个问题的关键还是利用 height数组。把排序后的后缀分成若干组,其中每组的后缀之间的height值都不小于k。例如,字符串为“aabaaaab”,当k=2时,后缀分成了4组,如下图所示(摘自罗穗骞的国家集训队论文):
ps:在每个分组里面找不重叠的子串
然后,易知最长公共前缀不小于k的两个后缀一定在同一组里,也就是说不重复的最长重复子串肯定在同一组了,但是有没有呢还要看同一组里的后缀的sa[]的最大值跟最小值之差是否不小于k,sa[]是排在第几的后缀是谁,即该后缀的起始坐标,你要保证最大值的后缀与最小值的后缀起始坐标之间相差k才行,保证两个后缀的公共前缀不重合才行。
关键是要明确height[]与sa[]数组是干啥的,各代表什么意义才行。
相关文章推荐
- 深入理解”引用被初始化后,不能再指向其他对象“这句话?
- JS学习之prototype属性
- 几道python笔试题
- Word Loadder II (***) -- BFS DFS
- 慕课学习C++笔记02-封装(上)
- Functional MRI (second edition) -- 10. Statistical Analysis:Basic Analyses
- QT---qtextedit中的光标问题
- QT---设置textedit文本框中某个字符格式
- 【转】vxworks的default boot line说明
- FFMPEG基于内存的转码实例——输入输出视频均在内存
- 华为OJ(笔画)
- 九度oj 1152
- Note For Linux By Jes(12)-认识系统服务(daemons)
- java导出word文档
- 关于单链表中环的问题
- 基础总结篇之四:Service完全解析
- 终于创建了我的第一篇文章
- HttpClient4.3教程
- 【JavaSE】day05_List集合_List排序_队列和栈
- Java IO流->处理流->数据流:DataOutputStream&DataInputStream