您的位置:首页 > 其它

求一个字符串中连续出现次数最多的子串

2012-08-28 16:41 288 查看
确实没有正经研究过算法,今天看到这个问题,想了很久没有想到怎么解决,最原始的方法谁都能够想到,但是这种原始方法显然效率非常低下,尤其是在字符串非常长的时候。因此,查阅网络,看到这两篇文章:
1、求一个字符串中连续出现次数最多的子串 imcdragon的专栏

2、找出字符串中连续出现次数最多的子串

读过之后,才发现,原来这字符串可以这样处理。

但是,代码在程序上是有点问题的,就是加入存在相同数量的连续子字符串,不能够都输出。于是,想到把结果存入map中,代码如下:

/*
基本算法描述:
给出一个字符串abababa
1.穷举出所有的后缀子串
substrs[0] = abababa;
substrs[1] = bababa;
substrs[2] = ababa;
substrs[3] = baba;
substrs[4] = aba;
substrs[5] = ba;
substrs[6] = a;
2.然后进行比较
substrs[0]比substrs[1]多了一个字母,如果说存在连续匹配的字符,那么
substrs[0]的第1个字母要跟substrs[1]首字母匹配,同理
substrs[0]的前2个字母要跟substrs[2]的前2个字母匹配(否则不能叫连续匹配)
substrs[0]的前n个字母要跟substrs
的前n个字母匹配.
如果匹配的并记下匹配次数.如此可以求得最长连续匹配子串.
*/

#include <iostream>
#include <string>
#include <vector>
#include <map>
using namespace std;

map<string, int> fun(const string &str)
{
vector<string> substrs;
int maxcount = 1, count = 1;
string substr;
int i, len = str.length();
map<string, int> map_SubCount;
// 把str字符串中的子串按每次把头部减少一个的方式插入到vector向量中
// 即,获取原字符串的后缀数组,并保持原来的顺序不变
for(i=0; i<len; ++i)
{
substrs.push_back(str.substr(i, len-i));
}
// 打印出后缀数组,substrs[]
cout<<"#############################################"<<endl;
for(i=0; i<len; ++i)
{
cout << substrs[i] << endl;
}
cout<<"#############################################"<<endl;

// 从后缀数组的第一个元素,开始遍历,依次进行比较
for(i=0; i<len; ++i)
{
// 后缀数组中substrs[i]之后的元素依次与substrs[i]比较
for(int j=i+1; j<len; ++j)
{
count = 1;
// 如果前j-i个元素相同
// 如果有连续一个子串出现就继续遍历vector的下一个子串中的和现在出现相同子串的地方的下一个或几个字符
if(substrs[i].substr(0, j-i) == substrs[j].substr(0,j-i))
{
++count;
// 子串中前j-i个元素相同
for(int k=j+(j-i); k<len; k+=j-i)
{
if (substrs[i].substr(0,j-i) == substrs[k].substr(0, j-i))
++count;
else
break;
}
// 记录所有遍历中的最大连续子串出现的次数
if(count >= maxcount)
{
maxcount = count;
substr = substrs[i].substr(0, j-i);
map_SubCount.insert(make_pair(substr, maxcount));
}
}
}
}
return map_SubCount;
}
int _tmain(int argc, _TCHAR* argv[])
{
map<string, int> rs;
string str="abababababaccccc";
rs = fun(str);
map<string,int>::iterator iter = rs.begin();
for ( ;iter != rs.end(); iter++)
{
cout << iter->first <<':'<< iter->second <<'\n';
}
system("pause");
return 0;
}


                                            
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: