您的位置:首页 > 职场人生

白话经典算法系列之十 一道有趣的GOOGLE面试题

2014-07-01 06:21 543 查看


文字版:

一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,找到至少一个重复元素,要求O(1)空间和O(n)时间。

 

    这个题目要求用O(n)的时间复杂度,这意味着只能遍历数组一次。同时还要寻找重复元素,很容易想到建立哈希表来完成,遍历数组时将每个元素映射到哈希表中,如果哈希表中已经存在这个元素则说明这就是个重复元素。因此直接使用C++ STL中的hash_set(参见《STL系列之六 set与hash_set》)可以方便的在O(n)时间内完成对重复元素的查找。

    但是题目却在空间复杂度上有限制——要求为O(1)的空间。因此采用哈希表这种解法肯定在空间复杂度上是不符合要求的。但可以沿着哈希法的思路继续思考,题目中数组中所以数字都在范围[0, n-1],因此哈希表的大小为n即可。因此我们实际要做的就是对n个范围为0到n-1的数进行哈希,而哈希表的大小刚好为n。对排序算法比较熟悉的同学不难发现这与一种经典的排序算法——基数排序非常类似。而基数排序的时间空间复杂度刚好符合题目要求!因此尝试使用基数排序来解这道面试题。

 

    下面以2,4,1,5,7,6,1,9,0,2这十个数为例,展示下如何用基数排序来查找重复元素。
下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  2
  4
  1
  5
  7
  6
  1
  9
  0
  2
(1)由于第0个元素a[0] 等于2不为0,故交换a[0]与a[a[0]]即交换a[0]与a[2]得:
下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  1
  4
  2
  5
  7
  6
  1
  9
  0
  2
(2)由于第0个元素a[0] 等于1不为0,故交换a[0]与a[a[0]]即交换a[0]与a[1]得:
下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  4
  1
  2
  5
  7
  6
  1
  9
  0
  2
(3)由于第0个元素a[0] 等于4不为0,故交换a[0]与a[a[0]]即交换a[0]与a[4]得:

下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  7
  1
  2
  5
  4
  6
  1
  9
  0
  2
(4)由于第0个元素a[0] 等于7不为0,故交换a[0]与a[a[0]]即交换a[0]与a[7]得:

下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  9
  1
  2
  5
  4
  6
  1
  7
  0
  2
(5)由于第0个元素a[0] 等于9不为0,故交换a[0]与a[a[0]]即交换a[0]与a[9]得:

下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  2
  1
  2
  5
  4
  6
  1
  7
  0
  9
(6)由于第0个元素a[0] 等于2不为0,故交换a[0]与a[a[0]]即交换a[0]与a[2],但a[2]也为2与a[0]相等,因此我们就找到了一个重复的元素——2。

下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  2
  1
  2
  5
  4
  6
  1
  7
  0
  9
 

 

    有了上面的分析,代码不难写出:

[cpp] view
plaincopy

//GOOGLE面试题  

//一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,找到至少一个重复元素,要求O(1)空间和O(n)时间。  

//By MoreWindows (http://blog.csdn.net/MoreWindows)  

#include <stdio.h>  

const int NO_REPEAT_FLAG = -1;  

void Swap(int &x, int &y)  

{  

    int t = x;  

    x = y;  

    y = t;  

}  

//类似于基数排序,找出数组中第一个重复元素。  

int RadixSort(int a[], int n)  

{  

    int i;  

    for (i = 0; i < n; i++)  

    {  

        while (i != a[i])  

        {  

            if (a[i] == a[a[i]])  

                return a[i];  

            Swap(a[i], a[a[i]]);  

        }  

    }  

    return NO_REPEAT_FLAG;  

}  

void PrintfArray(int a[], int n)  

{  

    for (int i = 0; i < n; i++)  

        printf("%d ", a[i]);  

    putchar('\n');  

}  

int main()  

{  

    printf("    白话经典算法系列之十 一道有趣的GOOGLE面试题 \n");        

    printf(" -- by MoreWindows( http://blog.csdn.net/MoreWindows ) --\n\n");   

  

    const int MAXN = 10;  

    int a[MAXN] = {2, 4, 1, 5, 7,  6, 1, 9, 0, 2};  

    //int a[MAXN] = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9};  

  

    printf("数组为: \n");  

    PrintfArray(a, MAXN);  

  

    int nRepeatNumber = RadixSort(a, MAXN);  

    if (nRepeatNumber != NO_REPEAT_FLAG)  

        printf("该数组有重复元素,此元素为%d\n", nRepeatNumber);  

    else  

        printf("该数组没有重复元素\n");  

    return 0;  

}  

    运行结果如下图所示:



    整个程序的核心代码只有短短5行左右,虽然有二重循环语句,但每个元素只会被访问一次,完成符合题目对时间复杂度的要求。

 



文字版:

一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,找到至少一个重复元素,要求O(1)空间和O(n)时间。

 

    这个题目要求用O(n)的时间复杂度,这意味着只能遍历数组一次。同时还要寻找重复元素,很容易想到建立哈希表来完成,遍历数组时将每个元素映射到哈希表中,如果哈希表中已经存在这个元素则说明这就是个重复元素。因此直接使用C++ STL中的hash_set(参见《STL系列之六 set与hash_set》)可以方便的在O(n)时间内完成对重复元素的查找。

    但是题目却在空间复杂度上有限制——要求为O(1)的空间。因此采用哈希表这种解法肯定在空间复杂度上是不符合要求的。但可以沿着哈希法的思路继续思考,题目中数组中所以数字都在范围[0, n-1],因此哈希表的大小为n即可。因此我们实际要做的就是对n个范围为0到n-1的数进行哈希,而哈希表的大小刚好为n。对排序算法比较熟悉的同学不难发现这与一种经典的排序算法——基数排序非常类似。而基数排序的时间空间复杂度刚好符合题目要求!因此尝试使用基数排序来解这道面试题。

 

    下面以2,4,1,5,7,6,1,9,0,2这十个数为例,展示下如何用基数排序来查找重复元素。
下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  2
  4
  1
  5
  7
  6
  1
  9
  0
  2
(1)由于第0个元素a[0] 等于2不为0,故交换a[0]与a[a[0]]即交换a[0]与a[2]得:
下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  1
  4
  2
  5
  7
  6
  1
  9
  0
  2
(2)由于第0个元素a[0] 等于1不为0,故交换a[0]与a[a[0]]即交换a[0]与a[1]得:
下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  4
  1
  2
  5
  7
  6
  1
  9
  0
  2
(3)由于第0个元素a[0] 等于4不为0,故交换a[0]与a[a[0]]即交换a[0]与a[4]得:

下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  7
  1
  2
  5
  4
  6
  1
  9
  0
  2
(4)由于第0个元素a[0] 等于7不为0,故交换a[0]与a[a[0]]即交换a[0]与a[7]得:

下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  9
  1
  2
  5
  4
  6
  1
  7
  0
  2
(5)由于第0个元素a[0] 等于9不为0,故交换a[0]与a[a[0]]即交换a[0]与a[9]得:

下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  2
  1
  2
  5
  4
  6
  1
  7
  0
  9
(6)由于第0个元素a[0] 等于2不为0,故交换a[0]与a[a[0]]即交换a[0]与a[2],但a[2]也为2与a[0]相等,因此我们就找到了一个重复的元素——2。

下标
  0
  1
  2
  3
  4
  5
  6
  7
  8
  9
数据
  2
  1
  2
  5
  4
  6
  1
  7
  0
  9
 

 

    有了上面的分析,代码不难写出:

[cpp] view
plaincopy

//GOOGLE面试题  

//一个大小为n的数组,里面的数都属于范围[0, n-1],有不确定的重复元素,找到至少一个重复元素,要求O(1)空间和O(n)时间。  

//By MoreWindows (http://blog.csdn.net/MoreWindows)  

#include <stdio.h>  

const int NO_REPEAT_FLAG = -1;  

void Swap(int &x, int &y)  

{  

    int t = x;  

    x = y;  

    y = t;  

}  

//类似于基数排序,找出数组中第一个重复元素。  

int RadixSort(int a[], int n)  

{  

    int i;  

    for (i = 0; i < n; i++)  

    {  

        while (i != a[i])  

        {  

            if (a[i] == a[a[i]])  

                return a[i];  

            Swap(a[i], a[a[i]]);  

        }  

    }  

    return NO_REPEAT_FLAG;  

}  

void PrintfArray(int a[], int n)  

{  

    for (int i = 0; i < n; i++)  

        printf("%d ", a[i]);  

    putchar('\n');  

}  

int main()  

{  

    printf("    白话经典算法系列之十 一道有趣的GOOGLE面试题 \n");        

    printf(" -- by MoreWindows( http://blog.csdn.net/MoreWindows ) --\n\n");   

  

    const int MAXN = 10;  

    int a[MAXN] = {2, 4, 1, 5, 7,  6, 1, 9, 0, 2};  

    //int a[MAXN] = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9};  

  

    printf("数组为: \n");  

    PrintfArray(a, MAXN);  

  

    int nRepeatNumber = RadixSort(a, MAXN);  

    if (nRepeatNumber != NO_REPEAT_FLAG)  

        printf("该数组有重复元素,此元素为%d\n", nRepeatNumber);  

    else  

        printf("该数组没有重复元素\n");  

    return 0;  

}  

    运行结果如下图所示:



    整个程序的核心代码只有短短5行左右,虽然有二重循环语句,但每个元素只会被访问一次,完成符合题目对时间复杂度的要求。

 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: