您的位置:首页 > 职场人生

KMP算法

2015-10-03 13:11 405 查看
应用问题描述:

【题目】

给定两个字符串str和match,长度分别为N和M。实现一个算法,如果字符串str中含有字串match,则返回match在str中的开始位置,不含有则返回-1。

【举例】

str=“acbc”,match=“bc”。返回2。

str=“acbc”,match=“bcc”。返回-1。

【要求】

如果match的长度大于str长度(M>N),str必然不会含有match,可直接返回-1。但如果N>=M,要求算法复杂度O(N)。

解决思路:

- 介绍变量:next是一个整数数组,该数组的第i个位置记录的是match数组中i位置之前的所有元素的一个指标,该指标反映的是前缀和后缀相等的最大长度(前缀不包含最后一个元素,后缀不包含第一个元素)。

- next数组的构造方法:

初始化next[0]=-1; next[1]=0;如果我们已知next的i-1及之前位置的元素,计算next[i]的方法如下图:(时间复杂度为O(m),m为match字符串的长度)



-匹配过程:

匹配思路如下:



a,b为str和match第一个不匹配的字符位置,根据next数组可以找到c位置的字符,将match右推,判断a位置和c位置的字符是否相等。如果相等,继续向下匹配,如果不等,用上述方法继续右推match。

-code如下

public int getIndexOf(String s, String m) {
if (s == null || m == null || m.length() < 1 || s.length() < m.length()) {
return -1;
}
char[] ss = s.toCharArray();
char[] ms = m.toCharArray();
int si = 0;
int mi = 0;
int[] next = getNextArray(ms);
while (si < ss.length && mi < ms.length) {
if (ss[si] == ms[mi]) {
si++;
mi++;
} else if (next[mi] == -1) {
si++;
} else {
mi = next[mi];
}
}
return mi == ms.length ? si - mi : -1;
}

public int[] getNextArray(char[] ms) {
if (ms.length == 1) {
return new int[] { -1 };
}
int[] next = new int[ms.length];
next[0] = -1;
next[1] = 0;
int pos = 2;
int cn = 0;
while (pos < next.length) {
if (ms[pos - 1] == ms[cn]) {
next[pos++] = ++cn;
} else if (cn > 0) {
cn = next[cn];
} else {
next[pos++] = 0;
}
}
return next;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  kmp 面试代码