您的位置:首页 > 其它

字符串---求一个字符串中连续出现次数最多的子串

2015-11-04 23:10 267 查看
基本概念:

字符串的前缀是指字符串的任意首部。字符串“abbc”的前缀有“a”,“ab”,“abb”,“abbc”。

字符串的后缀是指字符串的任意尾部。字符串“abbc”的后缀有“c”,“bc”,“bbc”,“abbc”。

基本算法描述: 例如给出一个字符串abababa 求连续出现次数最多的子串。

1、穷举出所有的后缀子串

substrs[0] = abababa;
substrs[1] = bababa;
substrs[2] = ababa;
substrs[3] = baba;
substrs[4] = aba;
substrs[5] = ba;
substrs[6] = a;


2、然后进行比较

substrs[0]比substrs[1]多了一个字母,如果说存在连续匹配的字符,那么
substrs[0]的第1个字母要跟substrs[1]首字母匹配,同理
substrs[0]的前2个字母要跟substrs[2]的前2个字母匹配(否则不能叫连续匹配)
substrs[0]的前n个字母要跟substrs
的前n个字母匹配.


如果匹配的记下匹配次数。如此可以求得最长连续匹配子串。

实现代码:

#include <iostream>
#include <string>
#include <vector>
using namespace std;

pair<int, string> MaxSubStr(const string &str)
{
vector<string> substrs;//向量存储后缀子串
int maxcount = 1, count = 1;
string substr;
int i, len = str.length();//字符串长度

//建立所有后缀子串并打印
for(i=0; i<len; ++i)
//substr函数复制子字符串:从指定位置i开始,并具有指定的len-i长度
substrs.push_back(str.substr(i, len-i));
for(i=0; i<len; ++i)
cout<<"substrs["<<i<<"] = "<<substrs[i] << endl;

for(i=0; i<len; ++i)
{
for(int j=i+1; j<len; ++j)
{
count = 1;
if(substrs[i].substr(0, j-i) == substrs[j].substr(0,j-i))
{//如果匹配
++count;
for(int k=j+(j-i); k<len; k+=j-i)
{
if (substrs[i].substr(0,j-i) == substrs[k].substr(0, j-i))
++count;
else
break;
}
if(count > maxcount)
{
maxcount = count;
substr=substrs[i].substr(0, j-i);
}
}
}
}
return make_pair(maxcount, substr);
}

int main()
{
pair<int, string> rs;
string str="abababababaccccc";
rs = MaxSubStr(str);
cout << rs.second<<':'<<rs.first<<'\n';

return 0;
}


结果:

substrs[0] = abababababaccccc
substrs[1] = bababababaccccc
substrs[2] = ababababaccccc
substrs[3] = babababaccccc
substrs[4] = abababaccccc
substrs[5] = bababaccccc
substrs[6] = ababaccccc
substrs[7] = babaccccc
substrs[8] = abaccccc
substrs[9] = baccccc
substrs[10] = accccc
substrs[11] = ccccc
substrs[12] = cccc
substrs[13] = ccc
substrs[14] = cc
substrs[15] = c
ab:5

Process returned 0 (0x0)   execution time : 0.259 s
Press any key to continue.
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  字符串