您的位置:首页 > 职场人生

从一次谷歌面试趣事中想到问题的更好的解决办法

2016-04-16 10:52 323 查看
事情是这样的,我之前在微博转载过一个谷歌面试趣事,里面讲到一个很有趣的算法,没想昨天被转发了好多次,微博一直提示有人@我。我又进去看了下这篇文章,想到了其实里面的问题还有几个更好的解决办法。谷歌面试趣事传送门:一次谷歌面试趣事



题目的描述是这样的:

假设这有一个各种字母组成的字符串,假设这还有另外一个字符串,而且这个字符串里的字母数相对少一些。从算法是讲,什么方法能最快的查出所有小字符串里的字母在大字符串里都有?

比如,如果是下面两个字符串:

String 1: ABCDEFGHLMNOPQRS

String 2: DCGSRQPOM

答案是true,所有在string2里的字母string1也都有。如果是下面两个字符串:

String 1: ABCDEFGHLMNOPQRS

String 2: DCGSRQPOZ

答案是false,因为第二个字符串里的Z字母不在第一个字符串里。

作者自己给出的算法是用哈希表:

最终,我告诉了他一个最佳的算法,只需要O(n+m)次操作。方法就是,对第一个字串进行轮询,把其中的每个字母都放入一个Hashtable里(成本是O(n)或16次操作)。然后轮询第二个字串,在Hashtable里查询每个字母,看能否找到。如果找不到,说明没有匹配成功。这将消耗掉8次操作 —— 这样两项操作加起来一共只有24次。不错吧,比前面两种方案都要好。

当然上面给出的连接里面讲到那个算法真的很妙:

他走到白板前,”如果这样呢 —— 假设我们有一个一定个数的字母组成字串 —— 我给每个字母分配一个素数,从2开始,往后类推。这样A将会是2,B将会是3,C将会是5,等等。现在我遍历第一个字串,把每个字母代表的素数相乘。你最终会得到一个很大的整数,对吧?然后 —— 轮询第二个字符串,用每个字母除它。如果除的结果有余数,这说明有不匹配的字母。如果整个过程中没有余数,你应该知道它是第一个字串恰好的子集了。这样不行吗?“

除了上面两个解决办法,我还想到了两个比作者哈希表好的算法,存储空间会比哈希表少一些:

一是用布尔值的数组

另外一个是使用位向量

这两种方法的存储空间都会比作者提出的哈希表小一些。具体如下:

用布尔值的数组

因为题目给出的是字母,字母只有26个,算上大小写只有52个,我们可以构建一个52维的布尔值的数组,把大字符串里面的字母如果出现的话,就存在布尔值的数组里面,布尔值的数组的索引值
i
对应的标记指示该字符串是否含有字母表的第
i
个字母,有的话就设置为true,否则为false。这样轮询第二个字符串的时候看布尔值数组里面对应的值是否为true,这样就可以知道第二个字符串里面的字母是否都在第一个字符串里面了。用布尔值的数组代替哈希表存储空间是不是小了一些?

用位向量

使用位向量可以再将使用空间再减少。我们只需要使用一个int型的变量。比如:

int checker = 0; //定义一个int型的变量存储第一个字符串里面的字母是否出现过
int val1 = String1.charAt(i) - ‘a’; // 取出第一个字符串的第i个字母,- ‘a’ 得出它在字母表的第几个位置

//通过将1左移val位再与checker与,这样就把checker的二进制的第val位置为1了,就代表第一个字符串里面存在这个字母
checker | (1 << val1);

//第二个字符串利用同样的方式
int val2 = String2.charAt(i) - ‘a’;
//只不过判断是否存在是用和checker进行与的方式,看结果是否大于0,大于0表示存在,否则不存在
if((checker & (1 << val2)) > 0 )


这两种方法都的存储空间会比用哈希表的方法小,不过从一次谷歌面试趣事真的学到了不少东西~
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: