KMP算法的思考
2016-07-20 16:41
302 查看
KMP为什么它就能跳跃n步再开始匹配呢?原因肯定是跳跃的如果小于n步一定是没有意义的,一定是匹配不上的。为什么?
你想啊。
P与T匹配的那部分可以看做是P的子串,我们早就得到了P的子串与P的前缀的最大匹配,你如果要移动的话,肯定要移动到下一个能匹配上P的前缀的位置,这个位置就是P子串中的第一个1的位置,因为P的子串的第一个1的位置,对应的就是T的刚刚匹配的那段文字中的第一个1的位置(P[0]=0),所以这样移动很巧妙,避免了一些无用的比较。
这是一开始的理解,然而并不是完全正确。因为,如果只找P的第一个1出现的位置,那太笨拙了,后面的1都没用了。实际上这个怀疑是正确的,实际上人家用的是已经匹配的P的子串的最后一个1,而不是第一个1。而且巧妙在,与最后一个1对准之后,直接从没匹配的T下一个字符开始匹配,不用从P[1]开始。
这个才是最好的说明,主要是第7、8行是理解这个算法的关键。
看上面的图,假设T的5.6.7.8已经和P的前缀match了,但是T[9]没能和P[5]match,这样一来,经过6判断就会执行7,q=pai[4],
q=2, 下一次再执行就是,p[3]==T[9]?
P[3]==T[9]?不就相当于,用P[1],P[2]和T[7].T[8]match了,为什么能这样呢?废话,因为是它的前缀啊,第一次比完,与P匹配的最后一段的前缀直接从下一个开始比。
意思就是,P[3,4]是与T匹配的最后一段前缀,注意是最后一段不是第一段。如果P的前面有很多段前缀也都不管,只管最后一段。找到P[3,4]后,直接取P[4+1]与T的8+1进行比较
你想啊。
P与T匹配的那部分可以看做是P的子串,我们早就得到了P的子串与P的前缀的最大匹配,你如果要移动的话,肯定要移动到下一个能匹配上P的前缀的位置,这个位置就是P子串中的第一个1的位置,因为P的子串的第一个1的位置,对应的就是T的刚刚匹配的那段文字中的第一个1的位置(P[0]=0),所以这样移动很巧妙,避免了一些无用的比较。
这是一开始的理解,然而并不是完全正确。因为,如果只找P的第一个1出现的位置,那太笨拙了,后面的1都没用了。实际上这个怀疑是正确的,实际上人家用的是已经匹配的P的子串的最后一个1,而不是第一个1。而且巧妙在,与最后一个1对准之后,直接从没匹配的T下一个字符开始匹配,不用从P[1]开始。
这个才是最好的说明,主要是第7、8行是理解这个算法的关键。
看上面的图,假设T的5.6.7.8已经和P的前缀match了,但是T[9]没能和P[5]match,这样一来,经过6判断就会执行7,q=pai[4],
q=2, 下一次再执行就是,p[3]==T[9]?
P[3]==T[9]?不就相当于,用P[1],P[2]和T[7].T[8]match了,为什么能这样呢?废话,因为是它的前缀啊,第一次比完,与P匹配的最后一段的前缀直接从下一个开始比。
意思就是,P[3,4]是与T匹配的最后一段前缀,注意是最后一段不是第一段。如果P的前面有很多段前缀也都不管,只管最后一段。找到P[3,4]后,直接取P[4+1]与T的8+1进行比较
相关文章推荐
- Javascript SHA-1:Secure Hash Algorithm
- 浏览器运行java插件报错:Algorithm constraints check failed: MD5withRSA
- Ubuntu SSH Algorithm negotiation failed
- [转]可视化的数据结构和算法
- 统计文件中不小于某一长度的单词的个数(泛型算法实现)
- 使用他人的MD5编码类,修改形成密码串
- Extracting Structured Data from Web Pages
- (译)Cocos2d_for_iPhone_1_Game_Development_Cookbook:1.13使用CCTexture2DMutable调换调色盘
- Java中3DES加密
- Refactoring Notes-Refactoring Methods(3)
- 图书馆管理程序~~不过貌似功能!!有空再修修
- trainging contest#2(2011成都现场赛)I BY Hyoga
- C/C++头文件包含内容概览
- 堆栈的应用(1) 平衡符号 C++实现
- 程序员编程艺术第一章、左旋转字符串
- 程序员编程艺术:第三章续、Top K算法问题的实现
- 程序员编程艺术:第四章、现场编写类似strstr/strcpy/strpbrk的函数
- 十四、第三章再续:快速选择SELECT算法的深入分析与实现
- 程序员编程艺术:第七章、求连续子数组的最大和
- 程序员编程艺术:第八章、从头至尾漫谈虚函数