您的位置：首页 > 其它

月球美容计划之那些天我们学过的KMP

2014-03-30 17:42 225 查看

问题描述

给两个字符串A,Ｂ，如A=“aaaaaaaaaaaaaaaaaaab”,

B = “aaaaaaaab”，现在要求B是否是A的字串。

普通方法（O(nm)），对两个字符串进行双重枚举进行匹配知道找到A字符串中的B字符串。

for(i = 0;i < n;i++)

{

int tf = 0;

for (k = 0;k < m;k++)

{

if (A[i] != B[k])

{

tf = 0;

break;

}

}

if (tf)

break;

}

KMP小忆

KMP算法是通过分析模式字符串，预先计算每个位置发生不匹配的时候，所需跳转到的下一个比较位置，整理出来一个next数组，然后在上面的算法中使用。

其达到的最终效果是，避免记录字符串A的指针i回溯，从而节省一个循环，也就是把O（mn），降为O（m）。

因此，也就可以说，KMP就是对O（nm）算法的改良，因此，其改良的地方，就是其关键。也就是说next就是KMP的精华所在。

犹抱琵琶的next函数

寒假时总结的模板

void kmp (char *T,int next[])

{

int j = 0,k = -1;

next[0] = -1;

while (T[j] != '\0')

{

if (k == -1 || T[j] == T[k])

{

j++;

k++;

next[j] = k;

}else

k = next[k];   //相当于在求next的时候利用已求出的next

}

}

这个是非改进版的求next的函数。其next数组记录的数据x代表这个元素的位置，代表与整个字符串T的前x个字符相同。

不能小看next

next的使用不仅仅是其储存的内容的或用上，甚至不能小瞧在求next数组的时候其产的中间值。

记得有一个题，就是让求字符串中循环节的长度，记得以前做类似的题目的时候是用的双重枚举，如果用KMP的话，也是可以省掉的一层循环。

做这题求next的代码如下：

int fnext (char *T,int next[])

{

int j = 0,k = -1;

next[0] = -1;

while (T[j] != '\0')

{

if (k == -1 || T[j] == T[k])

{

j++;

k++;

next[j] = k;

}

else

k = next[k];

}

if (k == 0)

return -1;

return j - k;

}

其中j指针指的是主字符串（不回溯的指针），k字符串指的是辅字符串（可以回溯），当next数组构建完成的一瞬间，想象一下j和k的样子，现在j指向了主字符串的最末尾，而k不一定指向哪，但可以肯定的是，如果T[j] != T[k]，k一定不等于0，否则，k指向的位置x,一定会让字符串后x位与前x位相等。

也就是说，如果存在循环节，其循环节的长度就是j - k。

KMP带来的反思

KMP使用一个next数组让一种O(nm)的算法变为了O(n)，有点用空间换时间的味道，像这种用空间换时间还有什么可以举一反三的吗？

KMP是利用空间，避免了在双重枚举的时候，一个指针的反复回溯，减少了一层循环。

那么，在做模拟题，尤其涉及到枚举的模拟题的时候，是不是在时间吃紧的情况下可以考虑通过存储某些东西，来去掉一层循环呢？

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航