您的位置:首页 > 其它

KMP字符串模式匹配算法实现

2016-10-18 22:02 639 查看
题目描述

KMP算法是字符串模式匹配算法中较为高效的算法之一,其在某次子串匹配母串失败时并未回溯母串的指针而是将子串的指针移动到相应的位置。严蔚敏老师的书中详细描述了KMP算法,同时前面的例子中也描述了子串移动位置的数组实现的算法。前面你已经实现了子串移动的数组,现在就来利用该数组来实现KMP模式匹配。

下面是相应的算法:



图:KMP算法

【输入】

3组字符串,每组字符串占一行。每行包含由空格分隔的两个字符串,字符串仅由英文小写字母组成且长度不大于100。

【输出】

每组数据输出1行,输出后一个字符串在前一个字符串中的位置,如果不匹配,则输出0。

【样例输入】

string str

thisisalongstring isa

nosubstring subt

【样例输出】

1

5

0

提示:

表示字符串的数据结构依然是字符数组。

总结:

KMP算法调用很简单,但难的是理解算法的思想。掌握算法的思想才能说是掌握算法。

对比普通暴力算法

#include <stdio.h>
#include <string.h>
#define K 101
char S[K], T[K];
int comstr(char T[K],char S[K]) {
int i = 0, j = 0;
while( S[i] != '\0' && T[j] != '\0') {
if(S[i] == T[j]) { //比较后续字符
i++;
j++;
} else {
i = i-j+1;
j = 0;
}
}
if(T[j] == '\0') {
return i-j+1;//匹配成功
} else {
return 0;
}
}
int main(int argc,char* argv[]) {
scanf("%s", S);
scanf("%s", T);
int p = comstr(T, S);
printf("%d\n",p);
return 0;
}


KMP算法(在处理第二个字符串有规律且较长的时候优势更加明显)

【难点】构建get_next函数的思路,按照对比母串和子串的思路将子串自己排序

【参考】http://www.cnblogs.com/c-cloud/p/3224788.html

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#define K 101
char s[K], T[K];
int  next[K];
void get_next(char T, int next) {
int i = 0, j = -1;
next[0] = -1;
while(T[i] != '\0') {
if(-1 == j||T[i] == T[j]) {
i++;
j++;
if(T[i] != T[j]) {
next[i] = j;
} else {
next[i] = next[j];
}
} else {
j = next[j];
}
}
}
int KMP(char S,char T) {
int i = 1;
int j = 1;
get_next (T, next);
while (i <= S[0] && j <= T[0]) {
if(0 == j||S[j] == T[j]) { //比较后续字符
i++;
j++;
} else {
j = next[j];//字符串后移
}
}
if(j > T[0]) {
return i - T[0];
} else {
return 0;
}
}
int main(int argc,char* argv[]) {
scanf("%s %s", S, T);
printf("%d", KMP(S, T));
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  kmp