您的位置:首页 > 其它

leetcode—word ladder II

2013-08-08 23:13 387 查看
1.题目描述

[code]Given two words (start and end), and a dictionary, find all shortest transformation sequence(s) from start to end, such that:


 


Only one letter can be changed at a time


Each intermediate word must exist in the dictionary


For example,


 


Given:


start = "hit"


end = "cog"


dict = ["hot","dot","dog","lot","log"]


 


Return


 


[


  ["hit","hot","dot","dog","cog"],


  ["hit","hot","lot","log","cog"]


]

[/code]



2.解题思路


我一看到这个题目就觉得类似于最小生成树,应该用贪心算法来做,贪心算法的思路如下:

       从start串出发,找出一次变换可以得到的string串的集合S1,如果集合S1中包含有end串,那么搜索结束,否则,搜索两步之内能到达的串的集合S2,同样判断两步之内能到达的串集合中是否有end串,以此类推,最终找到最短路径。另外,路径保存需要单独设置一个数据结构,

最终算法描述如下(类最小生成树):

将字典dict中的所有字符串分为左右两侧,一侧为leftside=start(实际编码不需存储),一侧为rightside=(dict-start),当前距start最远的节点,比如说从start i 步之内可达的节点集合curStep = start (因为初始是0步可达)。

计算nextStep,也就是 i+1 步可达的字符串集合,最简单的思路就是下面的思路,遍历curStep 遍历rightside,逐个比较,必然能找到nextStep,找到nextStep之后curStep 变成了nextStep,将nextStep 中的字符串从rightside里面抹去,nextStep清空继续寻找直至找到的nextStep或rightside为空(表示没有路径到end),或者end被发现。

于是有了下面的这份代码:

[code]class Solution {


public:


vector<vector<string> > findLadders(string start, string end, unordered_set<string> &dict) {


// end typing your C/C++ solution below


// DO NOT write int main() function


//areslipan@163.com


 


map<string,vector<string> > path;


 


unordered_set<string>leftside;


unordered_set<string>rightside=dict;


rightside.insert(start);


rightside.insert(end);


 


leftside.insert(start);


rightside.erase(start);


 


unordered_set<string>curStep;


unordered_set<string>nextStep;


curStep.insert(start);


while(curStep.find(end)==curStep.end()&&!rightside.empty())


{




unordered_set<string>::iterator iter_us_cur;


unordered_set<string>::iterator iter_us_right;


 


for(iter_us_cur=curStep.begin();iter_us_cur!=curStep.end();++iter_us_cur)


{




 


for(iter_us_right=rightside.begin();iter_us_right!=rightside.end();++iter_us_right)


{




if(isCvtable(*iter_us_cur,*iter_us_right))


{


if(path.find(*iter_us_cur)!=path.end())


{


path[*iter_us_cur].push_back(*iter_us_right);


}


else


{


vector<string> emptyV;


path[*iter_us_cur]=emptyV;


path[*iter_us_cur].push_back(*iter_us_right);


}


 


nextStep.insert(*iter_us_right);


}


}


 


}


 


if(nextStep.empty())break;


for(iter_us_right=nextStep.begin();iter_us_right!=nextStep.end();++iter_us_right)


{


rightside.erase(*iter_us_right);


}


curStep = nextStep;


nextStep.clear();


}


 


vector<vector<string> > result;


vector<string> temp;


 


if(curStep.find(end)!=curStep.end())


{


output(path,start,end,result,temp);


}


 


return result;


 


}


bool isCvtable(string str1,string str2)


{


//cout<<"isCvtable: "<<str1<<str2<<endl;


if(str1.length()!=str2.length()){return false;}




int count=0;


for(int i = 0;i<str1.length();++i)


{


if(str1[i]!=str2[i])count++;


if(count>1)return false;


}




return count==1;


}


 


 


void output(map<string,vector<string> >&path,string start,string end,vector<vector<string> >&result,vector<string> & temp)


{


temp.push_back(start);


 


if(start==end)


{


result.push_back(temp);return;


}


 


vector<string>::iterator iter_v;




for(iter_v=path[start].begin();iter_v!=path[start].end();++iter_v)


{


output(path,*iter_v,end,result,temp);temp.pop_back();


}


}


};

[/code]

 




提交online judge之后,小数据集没问题,大数据集却TLE了,分析了一下,主要是从curStep求nextStep的过程太耗时,我这个是O(N2)的时间复杂度,结果如下:





挂掉的这个案例大概有3000个词,很大,分析了一下,题目给的参数是unordered_set是有用意的,unordered_set实际底层是个hash表,所以能够常数时间索引一个字符串,基于这个思路,在已知curStep、rightside求nextStep的过程中:

        对每一个curStep中的字符串,假设长度为M,那么它的每位有25种变化,也就是每个单词有25*M中变化,那么时间复杂度就变成了O(MN),单词长度一般不会太大,所以这个是个线性的算法,分析完毕,我开始着手写算法:

[code]class Solution {


public:


vector<vector<string> > findLadders(string start, string end, unordered_set<string> &dict) {


// end typing your C/C++ solution below


// DO NOT write int main() function


//areslipan@163.com


 


map<string,vector<string> > path;


 


unordered_set<string>rightside=dict;


 


rightside.erase(start);




unordered_set<string>curStep;


unordered_set<string>nextStep;


curStep.insert(start);


while(curStep.find(end)==curStep.end()&&!rightside.empty())


{


unordered_set<string>::iterator iter_us_cur;


for(iter_us_cur=curStep.begin();iter_us_cur!=curStep.end();++iter_us_cur)


{


string temp;


for(int i=0;i<(*iter_us_cur).length();++i)


{


for(int j = 0;j<26;j++)


{


temp = *iter_us_cur;


if(temp[i]!=('a'+j))


{


temp[i] = ('a'+j);


}




if(rightside.count(temp)==1)


{


nextStep.insert(temp);


if(path.find(*iter_us_cur)==path.end())


{


vector<string> emptyV;


path.insert(make_pair(*iter_us_cur,emptyV));


}




path[*iter_us_cur].push_back(temp);


}


}


}


}




if(nextStep.empty())break;


unordered_set<string>::iterator iter_set;


for(iter_set=nextStep.begin();iter_set!=nextStep.end();++iter_set)


{


rightside.erase(*iter_set);


}


curStep = nextStep;


nextStep.clear();


}




vector<vector<string> > result;


vector<string> temp;




if(curStep.find(end)!=curStep.end())


{


output(path,start,end,result,temp);


}


 


return result;


 


}




void output(map<string,vector<string> >&path,string start,string end,vector<vector<string> >&result,vector<string> & temp)


{


temp.push_back(start);


 


if(start==end)


{


result.push_back(temp);return;


}


 


vector<string>::iterator iter_v;




for(iter_v=path[start].begin();iter_v!=path[start].end();++iter_v)


{


output(path,*iter_v,end,result,temp);temp.pop_back();


}


}


};

[/code]

 

结果出来的一瞬间很美妙:












另外,输出结果的方式也有改进的余地,如图所示,程序中的path实际是这么一张图,实际就是一张邻接表。










我的算法是从start开始深度搜索,直至找到end,当搜索到的最后一个节点不是end的时候其实都是无效搜索(而且比重很大),所以可以把上述这幅图反过来,然后从end开始反向搜索,以空间换时间。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: