您的位置:首页 > 其它

模式串的快速匹配算法,kmp算法,尊重前人成果,创造新未来

2015-09-30 09:28 239 查看
我们知道很多时候会用到一些匹配的算法,比如串的查找什么的,我不太擅长对数学公式进行推导,所以看到数据结构树上的一些抽象的函数表达式就头疼

所以数据结构老是学不好,所以对于KMP快速模式匹配串的算法给出一种通俗的理解,希望对大家有所帮助,或者一种参考,有什么不对的希望不吝批评

举个例子:一个查找串 Mstr = a b c a b c a c a b来说吧,当然可以更加复杂

最常见的一种算法就是采用两个for循环,若全部匹配那么就打印出位置,否则重头Mstr来进行匹配,总的最坏的时间就是O((m-n)*n)(就是匹配最后的一个失效)

那么能否将其减小到O(n)的线性维度呢,分析一下Mstr

                                                                                                0  1  2  3  4  5  6

 a  b  c 
a  b  c  a  c  a  b

                                                                            ........ ........ ..a  b  c  a   x..........

通过比较发现如果在位置4失配,我们无需从Mstr开始就进行比较,因为我们注意到3位置和0位置是一致的,因此可以将失配的位置和1位置进行比较,因为3位置和0位置一致

由此得出的结论是能否观察mstr的规律获得一种较优算法,因此对于书本上的内容我概括如下:从Mstr开始我们找到这么一种串,例如拿位置3的a来说,依次比较与0处的a的

最大的错位相等串,比如a[0] = a[3] k= 0 ; a[0]b[1]!=c[2]a[3];a[0]b[1]c[2]!=b[1]c[2]a[3];不得等于0-3因为没有意义,由此得出一个规律,从某一个字符找到往前k个字符等于从0开始的往后k个字符,相等则得出基于MStr的回溯信息令生成该函数为f则当前字符串索引index 有回溯信息f[index] = k-1;如图6位置往前4个和0开始往后4个得到f[6] = 4-1;

得到所有的f函数的值之后进行匹配就好办了

失配的时候只需将失配字符与Mstr的最后匹配的串的f值加一,例如7位置失配,那么只需回溯到Mstr的4位置 = f[6]+1 = 3+1;

下面是实现

f函数获取

void StringMatch::fGeneration(int *a,const char *str,int length)

{

    int j = -1;

    a[0] = -1;

//0的f值都是-1,这是为了便于后面的计算,属于一个小的手法

    for(int i=1;i<length;i++)

    {

        j=a[i-1];

//获取上一个f值

        while(str[i]!=str[j+1]&&j>=0) j=a[j];//主要是多个相同之后若存在不同的,那么就是回溯到之前的值

//从第一个开始比较,相同就加一,如果j>=0表示多个相同,那么就是累加效果

        if(str[i] == str[j+1])

            a[i] = ++j;

        else

            a[i] = -1;

//不等那么就是-1

    }    

}

int StringMatch::KMPStringFind(StringMatch &str)

{

    int pos = 0;

    int posm = 0;

    while(pos<str.record.length()&&posm<str.modString.length())

    {

        if(str.record[pos] == str.modString[posm])

        {

            pos++;

            posm++;

        }

        else

        {   

            if(posm == 0)

            {

                pos++;

            }

            else

               posm = str.f[posm-1]+1;//基于f函数的回溯

        }

    }

    if(posm<str.modString.length()) return -1;

    else

        return pos-posm;

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息