您的位置：首页 > 职场人生

【剑指offer】面试题3：二维数组中的查找

2014-06-10 15:38 411 查看

题目描述：

在一个二维数组中，每一行都按照从左到右递增的顺序排序，每一列都按照从上到下递增的顺序排序。请完成一个函数，输入这样的一个二维数组和一个整数，判断数组中是否含有该整数。

输入：

输入可能包含多个测试样例，对于每个测试案例，

输入的第一行为两个整数m和n(1<=m,n<=1000)：代表将要输入的矩阵的行数和列数。

输入的第二行包括一个整数t(1<=t<=1000000)：代表要查找的数字。

接下来的m行，每行有n个数，代表题目所给出的m行n列的矩阵(矩阵如题目描述所示，每一行都按照从左到右递增的顺序排序，每一列都按照从上到下递增的顺序排序。

输出：

对应每个测试案例，

输出”Yes”代表在二维数组中找到了数字t。

输出”No”代表在二维数组中没有找到数字t。

比如书中给的数组

1 2 8 9

2 4 9 12

4 7 10 13

6 8 11 15

方案一：

我自己的思路，如何才能找的快？一层一层遍历的话，肯定是最麻烦的。那好，通过对角线的递增沿主对角线走的话，增大最快。先考虑普通情况在考虑边缘情况。

普通情况：我们找到第一个大于关键字key的位置，arr[i,i]>key。那么k的范围可定不在arr[0...i-1,0...i-1]之间（太小了），也不在（i，i）点的右下角（更大了）。这时，要向左遍历和向上遍历。这时是很麻烦的，一看就无从下手了。其实不然，当我们拿到一个很复杂的问题的时候，最好画一下图，然后一步一步走，这样很多细节就有了，也会为我们解题打开思路。比如向左遍历的时候，我们在i行（从第0行开始计数），那么小于i-1的行已经都比key小了，我们只看第i行向左遍历就好了，如果依然比key大就继续向左，因为向下的就更大了。当不巧遍历到某一点比key小了，证明该行中没有key，那么我们向下遍历，与刚才讲的同样的理论。直到找到或者数组越界查找失败为止。对于向上向右查找同样的道理。

特殊情况：

（1）我们需要考虑二维数组是否等宽，如果不等宽，当沿主对角线(i,i)走的时候，已经到达某一行或某一列的边界，如果依然比key小，就应该向又走或者向下走。

（2）如果二维数组为空，或者传递的参数行列都不符合要求，要返回错误。

按照这个思路写出如下的代码

#include <stdio.h>

#define COL 4
#define TRUE 1
#define FALSE 0

int find_key(int arr[][COL],int row,int key);
int find_up_right(int arr[][COL],int row,int nrow,int ncol,int key);
int find_left_down(int arr[][COL],int row,int nrow,int ncol,int key);

int main(void)
{
int arr[][COL] = {
{1,2,8,9},
{2,4,9,12},
{4,7,10,13},
{6,8,11,15},
};  //数组结尾要加分号
int key;

printf("please input your key:");
while(scanf("%d",&key)){
int n = find_key(arr,4,key);
printf("n=%d\n",n);

printf("please input your key:");

}

return 0;
}

int find_key(int arr[][COL],int row,int key)
{
int i=0;    //必须初始化！！！

while(i<row && i<COL && arr[i][i]<key){  //找到大于key的第一个主对角结点
++i;
}
if(arr[i][i] == key)
return TRUE;

//下面两种情况处理，当row和col不相等时，并且arr[i][i]依然小于key的情况
if(i==row){
while(i<COL && arr[row-1][i]<key){  //row<col时，向右找到第一个大于key的点
++i;
}
if(arr[row-1][i] == key)
return TRUE;

if(i == COL)        //搜索到头，证明查找失败
return FALSE;
else
return find_up_right(arr,row,row-1,i,key);
}
if(i==COL){
while(i<row && arr[i][COL-1] < key)
++i;
if(arr[i][COL-1] == key)
return TRUE;
if(i==row)
return FALSE;
else
return find_left_down(arr,row,i,COL-1,key);
}

//下面处理在数组内部找到比key大的点
int n1 = find_up_right(arr,row,i,i,key);
int n2 = find_left_down(arr,row,i,i,key);
return n1||n2;
}

//由于是一个单元格一个单元格走的，当key小于arr[i][j]时，先向上查找，找到小于关键字的时候，就要向右查找，交替进行
int find_up_right(int arr[][COL],int row,int nrow,int ncol,int key)
{
int i = nrow;
int j = ncol;
/*      方法1,从《数据结构》算法6.5中获得启发，循环一趟中处理不同情况的差异，最后再下一趟循环
while(j<COL && arr[i][j]>key){
while(--i && i>=0 && arr[i][j]>key)
;
if(i<0) //要判断边界条件！！！
return FALSE;
if(arr[i][j] == key)
return TRUE;

while(++j && j<COL && arr[i][j]<key)
;
if(j==COL)
return FALSE;
if(arr[i][j] == key)
return TRUE;
}
*/
while(i>=0 && j<COL){
if(arr[i][j] > key)
--i;
else if(arr[i][j] < key)
++j;
else
return TRUE;
}
return FALSE;

}

//当key小于arr[i][j]时，先向左查找，找到小于关键字的时候，就要向下查找，交替进行
int find_left_down(int arr[][COL],int row,int nrow,int ncol,int key)
{
int i = nrow;
int j = ncol;

/*

while(i<row && arr[i][j]>key){
while(--j && j>=0 && arr[i][j]>key)
;
if(j<0)
return FALSE;
if(arr[i][j] == key)
return TRUE;
while(++i && i<row && arr[i][j]<key)
;
if(i==row)
return FALSE;
if(arr[i][j] == key)
return TRUE;
}

*/
//方法二
while (i<row && j>=0){
if(arr[i][j] > key)
--j;
else if(arr[i][j] < key)
++i;
else
return TRUE;
}
return FALSE;
}

注释：

（1）要对变量初始化！在find_key()函数中，用到i但没初始化就直接比较，引起内存越界访问。在c++中很强调这一点，在c中也应该保持这种习惯。

（2）find_up_right()和find_left_down()两个函数中用了两种方法，第一种方法比较繁琐，在遍历第一遍的时候会产生分支先向左再向下，为了到第二趟遍历入口一致，就在循环体中引入了两次循环来处理这种差异。第二种方法，是《剑指offer》上用到的方法，很简单，只是在循环中通过if...else...语句，根据不同情况，选择不同处理即可。主要原因是，while循环的入口设置的不合理。

方案二

其实在方案一中，向左向下遍历已经可以使我们得到启发：我们先比较第一行最后一个元素，如果比key大，就向左遍历，因为向下的元素肯定也比key大，这时就相当于排除了这一列。当遇到比key小的时候，就应该向下遍历。思想跟我上面用到的思想一致。

精炼的构思：1、将value值同二维数组右上角元素比较，分三种情况考虑；

　　　　　　2、==，则找到； <value，则‘删掉’行； >value，则‘删掉’列；

　　　　　　3、直到二维矩阵‘空’。

代码如下：

int find_key_book(int arr[][COL],int row,int key)
{
int i=0;
int j=COL-1;

while(i<row && j>=0){
if(arr[i][j] > key)
--j;
else if(arr[i][j] < key)
++i;
else
return TRUE;
}
return FALSE;
}

代码很简洁啊！比我用的方法好多了。当碰到一个题目时应该深入研究，如果可以找到一个好方法的话，可以很方便的写出代码，并且不易出错。

方案三：

分治法，分为四个矩形，配以二分查找，如果要找的数是6介于对角线上相邻的两个数4、10，可以排除掉左上和右下的两个矩形，而递归在左下和右上的两个矩形继续找，如下图所示：

另外还有一种方法，可以看看：剑指offer面试题3

扩展题目：有序矩阵的中位数算法

给定 n×n 的实数矩阵，每行和每列都是递增的，求这 n2 个数的中位数。

使用类似Tarjan的线性中位数的方法，每次找每列中位数，然后找中位数的中位数，之后可以删除前一半列的上半部分或者后一半列的下半部分，这样可以实现复杂性 O(nlog2n) 。

但是这个问题是有 O(n) 的算法的，在Top
Language Google Group的Obtuse
Sword的指点下，找到了这个问题的原始论文：Generalized
Selection and Ranking: Sorted Matrices。事实上这篇论文证明了更强的结论：

对于一个 n×m ( n≤m )的矩阵，若每行和每列都是递增的，则可以在 O(nlog2m/n) 找到第 k 大的数。

算法的基本思路是将矩阵依次对半划分成更小的子矩阵，然后删除不可能包含所求中位数的子矩阵。通过对每次划分后子矩阵个数的估计，发现此算法时间复杂度为 O(nlog2m/n) 。

使用同样的技巧，可以证明更更强的结论(这个算法具体过程就没细看了):
一堆 ni×mi ( ni≤mi )的矩阵，若每个矩阵的每行和每列都是递增的，则selection
problem（即找第 k 大的数）的时间复杂度为 O(∑nilog2mi/ni) 。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航