hiho一下 第三周 "KMP"算法
2014-07-22 19:54
260 查看
之前写过KMP算法,在多益机试题目--字符串匹配的变形中,这次稍微有点改动,不是查找存不存在子串,而是找存在子串的数目。这个数目还有点怪,就是重复的也算在内。就像模式串ADA,原串ADADADA,存在三次,明显有重叠,因此next函数就要多算一位。模式串长度为L,那么next函数不是计算到next[L-1],而是计算到Next[L]。
题目如下:
小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。
这一天,他们遇到了一只河蟹,于是河蟹就向小Hi和小Ho提出了那个经典的问题:“小Hi和小Ho,你们能不能够判断一段文字(原串)里面是不是存在那么一些……特殊……的文字(模式串)?”
小Hi和小Ho仔细思考了一下,觉得只能想到很简单的做法,但是又觉得既然河蟹先生这么说了,就肯定不会这么容易的让他们回答了,于是他们只能说道:“抱歉,河蟹先生,我们只能想到时间复杂度为(文本长度 * 特殊文字总长度)的方法,即对于每个模式串分开判断,然后依次枚举起始位置并检查是否能够匹配,但是这不是您想要的方法是吧?”
河蟹点了点头,说道:”看来你们的水平还有待提高,这样吧,如果我说只有一个特殊文字,你能不能做到呢?“
小Ho这时候还有点晕晕乎乎的,但是小Hi很快开口道:”我知道!这就是一个很经典的模式匹配问题!可以使用KMP算法进行求解!“
河蟹满意的点了点头,对小Hi说道:”既然你知道就好办了,你去把小Ho教会,下周我有重要的任务交给你们!“
”保证完成任务!”小Hi点头道。
提示一:KMP的思路
提示二:NEXT数组的使用
提示三:如何求解NEXT数组
第一行一个整数N,表示测试数据组数。
接下来的N*2行,每两行表示一个测试数据。在每一个测试数据中,第一行为模式串,由不超过10^4个大写字母组成,第二行为原串,由不超过10^6个大写字母组成。
其中N<=20
对于每一个测试数据,按照它们在输入中出现的顺序输出一行Ans,表示模式串在原串中出现的次数。
样例输入
样例输出
源代码:
题目如下:
小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。
这一天,他们遇到了一只河蟹,于是河蟹就向小Hi和小Ho提出了那个经典的问题:“小Hi和小Ho,你们能不能够判断一段文字(原串)里面是不是存在那么一些……特殊……的文字(模式串)?”
小Hi和小Ho仔细思考了一下,觉得只能想到很简单的做法,但是又觉得既然河蟹先生这么说了,就肯定不会这么容易的让他们回答了,于是他们只能说道:“抱歉,河蟹先生,我们只能想到时间复杂度为(文本长度 * 特殊文字总长度)的方法,即对于每个模式串分开判断,然后依次枚举起始位置并检查是否能够匹配,但是这不是您想要的方法是吧?”
河蟹点了点头,说道:”看来你们的水平还有待提高,这样吧,如果我说只有一个特殊文字,你能不能做到呢?“
小Ho这时候还有点晕晕乎乎的,但是小Hi很快开口道:”我知道!这就是一个很经典的模式匹配问题!可以使用KMP算法进行求解!“
河蟹满意的点了点头,对小Hi说道:”既然你知道就好办了,你去把小Ho教会,下周我有重要的任务交给你们!“
”保证完成任务!”小Hi点头道。
提示一:KMP的思路
提示二:NEXT数组的使用
提示三:如何求解NEXT数组
输入
第一行一个整数N,表示测试数据组数。接下来的N*2行,每两行表示一个测试数据。在每一个测试数据中,第一行为模式串,由不超过10^4个大写字母组成,第二行为原串,由不超过10^6个大写字母组成。
其中N<=20
输出
对于每一个测试数据,按照它们在输入中出现的顺序输出一行Ans,表示模式串在原串中出现的次数。样例输入
5 HA HAHAHA WQN WQN ADA ADADADA BABABB BABABABABABABABABB DAD ADDAADAADDAAADAAD
样例输出
3 1 3 1 0
源代码:
#include<iostream> #include<cstring> #include<string> using namespace std; int Next[10001]; //求KMP的Next数组 void GetNext(const string& p) { int len=p.size(); int i=0; int j=-1; Next[i]=j; while(i<len) { if(j==-1||p.at(i)==p.at(j)) { i++; j++; if(i==len||p.at(i)!=p.at(j))//不允许出现P[i]==P[next[i]] Next[i]=j; else Next[i]=Next[j]; } else { j=Next[j]; } } } //S为母串,p为匹配子串,如果匹配返回匹配位置,否则返回-1 int KMPSearch(const string& s,const string& p) { unsigned int Slen=s.size(); unsigned int Plen=p.size(); //int *Next=new int[Plen];//Next数组存储位置 GetNext(p);//求得Next数组 unsigned int i=0;//在S串中的下标 unsigned int j=0;//在P串中的下标 unsigned int count=0;//匹配串出现的次数 while(i<Slen) { if(j==-1||s.at(i)==p.at(j)) { i++; j++; } else if(j<Plen) j=Next[j]; if(j==Plen) { count++; j=Next[Plen]; } } return count; } int main() { string str1; string str2; int n; cin>>n; for(int i=0;i<n;i++) { cin>>str2; cin>>str1; int pos=KMPSearch(str1,str2); cout<<pos<<endl; } return 0; }
相关文章推荐
- "每个Y的最新X"算法,not exists妙用
- 不要在DEBUG模式下使用STL实现"复杂的"算法
- hiho一下 KMP 算法
- 【hiho一下第三周】KMP计算模式串在原串出现次数
- 用Matlab实现MDSC中的"Fourier Deconvolution"的算法
- 我来介绍一下"反向传播学习算法"和"梯度下降法"
- C语言 算法"KMP" 查找字符串 ”模式匹配“
- "BOF或EOF中有一个是真,或者当前的记录已被删除,所需的操作要求一个当前的记录"问题解决
- "陷阱"技术探秘 ──动态汉化Windows技术的分析
- "游泳和CMM" "swimming & CMM"
- 两个数据库间的"复制"
- "我和它相处并不快乐"
- "struts中文问题","struts国际化问题"的终极解决方案
- .Net Remoting 实现简易的"命令行控制台"聊天室
- 屏幕的"拍照"
- 维护个人技术站点的"七种武器"
- 关于icewm的"运行命令"
- Net Remoting 实现简易的"命令行控制台"聊天室 选择自 playyuer 的 Blog
- 上海浦东软件园打造中国的"班加罗尔"
- vs.net2003的"VC软件包不可用或未注册"的提示