您的位置:首页 > 其它

KMP算法next数组通俗理解,适合考研及基础学习者

2016-11-20 00:38 253 查看
KMP算法是主要用来做字符串的匹配,有一个文本次T和一个模式串P,就是拿模式串P去匹配文本串T。

匹配的步骤分为两步,先做模式串自身匹配,即求出next数组;然后在进行T与P的匹配。

那么可能会问,为什么要做模式串自身匹配,这么做的优点体现在哪里?

                            next数组到底是干啥的?它的含义是什么?

                            怎么求next数组?

                            T与P的匹配过程具体是怎么操作的?

       这些应该都是初学者期盼搞懂的问题,但是在看了花花绿绿的资料和代码过后忽略了的问题,感觉似懂非懂,好像也还能做题,就算做不出来,看了题解好像也能明白,然而过段时间,当别人再问你KMP是什么的时候,却又讲不出关键。。。我自己学习这个东西的心路历程好像就是这样的。大一暑假拉着某学长给我讲了KMP,听完后感觉一脸懵逼,虽然后来刷了一些题目,但很快就又不会写。最近 考研的室友复习到KMP,折腾了几天不是很懂后,让我给讲一讲,先跟她交流了下哪里不懂,然后专门去探究了一下,发现在给室友讲解的过程中,她一次次提问,也算是自己一步步加深理解的过程吧(这种大家一起探究问题的感觉挺欢乐的=。=)

 先举一个栗子吧下面。

               0 1 2 3 4 5 6 7 8 9 10 11

文本串T   b a b a b a b c a b  a  b

模式串P   a b a b c a b a b 

模式串自匹配过程:

void Next()
{
int i=0;
int j=-1;
next[0]=-1;
int len=s.length();
while(i<len)
{
if(j==-1||s[i]==s[j])
{
i++;
j++;
next[i]=j;
}
else
j=next[j];
}
}
i=0  j=-1 n[0]=-1

i=1 j=0 n[1]=0

i=1 j=n[j]=-1

i=2 j=0 n[2]=0

i=3 j=1 n[3]=1

i=4 j=2 n[4]=2

i=4 j=n[2]=0

i=4 j=n[0]=-1

i=5 j=0 n[5]=0

i=6 j=1 n[6]=1

i=7 j=2 n[7]=2

i=8 j=3 n[8]=3

i=9 j=4 n[9]=4

起初i=0,j=-1,在判断时,当j=-1或p[i]=p[j]时,i ,j的值共同前进,记录next数组的值。当出现不匹配的时候,j值就后退,而后退方法只有一个 j=next[j]

那么,next数组记录的是什么?从例子里面来看,n[8]=3,代表的含义有三个。此时i=8 ,j=3,1.当前比较的位置到了8,2.当前最大匹配长度为3,3.0~2和5~7这两段的字符串相同。可以总结一下,对于next[i]=j 同样也是一个道理,1.当前比较的位置到了i,2.当前最大匹配长度为j,3.0~(j-1)
和 (i-j)~(i-1) 这两段的字符串相同。

int fun () //匹配过程
{
int i=0;
int j=0;
int len1=p.length(); //模式串
int len2=s.length(); //文本串
while(i<len2 && j<len1)
{
if(j==-1||s[i]==p[j])
{
i++;
j++;
}
else
{
j=next[j];
}
}
if(j==len1)
return i-len1;
else
return -1;
}
               0 1 2 3 4 5 6 7 8 9 10 11

文本串T   b a b a b a b c a b  a  b

模式串P   a b a b c a b a b 

匹配过程和求next数组过程几乎一模一样,但是含义却不同
i=0  j=0

i=0 j=n[0]=-1

i=1 j=0

i=2 j=1

i=3 j=2

i=4 j=3

i=5 j=4 //此时T[5]和P[4]不匹配 ,j开始回退 j=next[j]

i=5 j=n[4]=2  //此时T[5]和P[2]匹配上了,含义是什么?那就是,(i-j~i-1)段字符串和(0~j-1)段字符串是匹配的 ,开始比较T[i]和P[j]位置是否相等

//如果不相等那么j将继续回退,一直退到 j=-1就是到了尽头为止,此时 i 和 j 会同时加一,即当前对于i位置来说,已经没有可以匹配的前缀的,那就i前进一位再开始比较看看吧

i=6 j=3

i=7 j=4 

i=8 j=5

i=9 j=6

i=10 j=7

i=11 j=8

KMP最重要的就是弄懂next数组的含义,理解了其中的丰富内涵,就能应对变化的题目了。记下一些自己的心得,感觉也还算通俗易懂的吧。

   

                             
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: