您的位置:首页 > 编程语言 > Go语言

KMP算法的思考

2016-07-20 16:41 302 查看
KMP为什么它就能跳跃n步再开始匹配呢?原因肯定是跳跃的如果小于n步一定是没有意义的,一定是匹配不上的。为什么?

你想啊。

P与T匹配的那部分可以看做是P的子串,我们早就得到了P的子串与P的前缀的最大匹配,你如果要移动的话,肯定要移动到下一个能匹配上P的前缀的位置,这个位置就是P子串中的第一个1的位置,因为P的子串的第一个1的位置,对应的就是T的刚刚匹配的那段文字中的第一个1的位置(P[0]=0),所以这样移动很巧妙,避免了一些无用的比较。

这是一开始的理解,然而并不是完全正确。因为,如果只找P的第一个1出现的位置,那太笨拙了,后面的1都没用了。实际上这个怀疑是正确的,实际上人家用的是已经匹配的P的子串的最后一个1,而不是第一个1。而且巧妙在,与最后一个1对准之后,直接从没匹配的T下一个字符开始匹配,不用从P[1]开始。

这个才是最好的说明,主要是第7、8行是理解这个算法的关键。

看上面的图,假设T的5.6.7.8已经和P的前缀match了,但是T[9]没能和P[5]match,这样一来,经过6判断就会执行7,q=pai[4],
q=2, 下一次再执行就是,p[3]==T[9]?

P[3]==T[9]?不就相当于,用P[1],P[2]和T[7].T[8]match了,为什么能这样呢?废话,因为是它的前缀啊,第一次比完,与P匹配的最后一段的前缀直接从下一个开始比。

意思就是,P[3,4]是与T匹配的最后一段前缀,注意是最后一段不是第一段。如果P的前面有很多段前缀也都不管,只管最后一段。找到P[3,4]后,直接取P[4+1]与T的8+1进行比较
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  algorithm