您的位置:首页 > 其它

后缀数组经典题---不可重叠最长重复子串 poj1743

2015-08-26 22:15 302 查看
内容也是别处看来的,就不写原创了

题意:有N(1
<= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:

1.长度至少为5个音符。

2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)

3.重复出现的同一主题不能有公共部分。

思路:后缀数组。求出任意相邻音符的差值,然后把问题转化为 不可重叠最长重复子串,用后缀数组来做。先二分答案,把题目变成判定性问题:判断是否存在两个长度为k的子串是相同的,且不重叠。解决这个问题的关键还是利用 height数组。把排序后的后缀分成若干组,其中每组的后缀之间的height值都不小于k。例如,字符串为“aabaaaab”,当k=2时,后缀分成了4组,如下图所示(摘自罗穗骞的国家集训队论文):

ps:在每个分组里面找不重叠的子串



然后,易知最长公共前缀不小于k的两个后缀一定在同一组里,也就是说不重复的最长重复子串肯定在同一组了,但是有没有呢还要看同一组里的后缀的sa[]的最大值跟最小值之差是否不小于k,sa[]是排在第几的后缀是谁,即该后缀的起始坐标,你要保证最大值的后缀与最小值的后缀起始坐标之间相差k才行,保证两个后缀的公共前缀不重合才行。

关键是要明确height[]与sa[]数组是干啥的,各代表什么意义才行。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: