数据结构与算法——提供一个单词,在字典中找到它的兄弟
2015-12-26 14:07
399 查看
题目:
一个单词单词字母交换,可得另一个单词,如 army->mary,成为兄弟单词。提供一个单词,在字典中找到它的兄弟。描述数据结构和查询过程。(百度2012年实习生面试题)解题思路:
http://superonion.iteye.com/blog/1522199思路一:使用trie树
在字典树的前缀中再存储一个vector结构的容器:Cpp代码
struct word
{
vector<string> brother; // 用于保存每个单词的兄弟单词
word *next[26]; // 字典树中每个节点代表一个字符,并指向下一个字符
};
如上述数据结构所示,字典树的建立是在预处理阶段完成的,首先根据字典中的单词来建立字典树,建立的时候,需要稍微特殊处理一下,就是比如pots、stop和tops互为兄弟单词,那么在字典中按照首字母顺序的话,应该先遇到pots单词,那么我首先对其进行排序,结果是opts,那么字典树中就分别建立4个节点,分别为o->p->t->s,当然这个是不同层次的,在节点s处的vector容器brother中添加单词pots,遇到stop的时候,同样的方法,排序是opts,此时发现这4个节点已经建立了,那么只需要在第四个节点s处的vector容器brother中添加单词stop,tops单词的处理方法是同样的。
这样建立完字典树后,查询兄弟单词的效率就会很高了,比哈希的效率还要高;查到tops的兄弟的单词的时候,首先排序,那么就是opts,然后在字典树中查找opts,在s处将其vector容器brother中的的单词输出就是tops的所有兄弟单词。
思路二:使用hash_map和链表
首先定义一个key,使得兄弟单词有相同的key,不是兄弟的单词有不同的key。例如,将单词按字母从小到大重新排序后作为其key,比如bad的key为abd,good的key为dgoo。使用链表将所有兄弟单词串在一起,hash_map的key为单词的key,value为链表的起始地址。
开始时,先遍历字典,将每个单词都按照key加入到对应的链表当中。当需要找兄弟单词时,只需求取这个单词的key,然后到hash_map中找到对应的链表即可。
这样创建hash_map时时间复杂度为O(n),查找兄弟单词时时间复杂度是O(1)。
思路三:同样使用hash_map和链表
将每一个字母对应一个质数,然后让对应的质数相乘,将得到的值进行hash,这样兄弟单词的值就是一样的了,并且不同单词的质数相乘积肯定不同。使用链表将所有兄弟单词串在一起,hash_map的key为单词的质数相乘积,value为链表的起始地址。
对于用户输入的单词进行计算,然后查找hash,将链表遍历输出就得到所有兄弟单词。
这样创建hash_map时时间复杂度为O(n),查找兄弟单词时时间复杂度是O(1)。
要掌握的知识:
字典树:又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。
典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。
它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
参考链接:
http://baike.baidu.com/link?url=fFhIr3z5eY9Qor37DOB8IwlMJZ65PVoyq29k7WY5bvI7g3dIyma2q7n0SuzRA2VK_-67p869_r7cUYKjMXCCYa http://blog.csdn.net/hguisu/article/details/8131559
相关题目:
如果两个字符串的字符一样,但是顺序不一样,被认为是兄弟字符串,问如何在迅速匹配兄弟字符串(如,bad和adb就是兄弟字符串)。思路:判断各自素数乘积是否相等。更多方法请参考http://blog.csdn.net/v_JULY_v/article/details/6347454
相关文章推荐
- 2015年大二上-数据结构-树和二叉树-2-(2)二叉树的非递归遍历
- 数据结构算法】--【排序】:归并排序实现源码
- 数据结构课程设计---学生成绩管理系统
- 小猪的数据结构辅助教程——2.7 线性表中的双向循环链表
- 笔试题目总结之二——常用数据结构与算法
- Linux VFS 虚拟文件系统数据结构
- 【“BattenSnakexjp4.1”数据结构课程设计作品】
- 数据结构课程设计——通讯录管理系统
- 【数据结构与算法分析】基本理论概念总结
- 链表、堆栈、队列的区别
- 数据结构(一)
- 数据结构学习笔记——绪论
- 数据结构——二叉树的实现
- 《算法竞赛入门经典2ndEdition 》例题5-1 大理石在哪儿(Where is the marble?, Uva10474)
- 数据结构实验之排序五:归并求逆序数 【OJ--3402】【归并排序】
- 数据结构实验之排序四:寻找大富翁 【OJ--3401】【堆排序】
- 公交线路管理 数据结构课程设计
- 数据结构--Chapter7(内排序)
- 数据结构——算法之(032)(求两个串中的第一个最长子串)
- 数据结构课程设计 学生成绩管理