您的位置：首页 > 其它

【LeetCode】第四题：寻找两个有序数组的中位数

2019-01-12 23:54 681 查看

题目

给定两个大小为 m 和 n 的有序数组

nums1

和

nums2

。

请你找出这两个有序数组的中位数，并且要求算法的时间复杂度为 O(log(m + n))。

你可以假设

nums1

和

nums2

不会同时为空。

示例 1:

nums1 = [1, 3]
nums2 = [2]

则中位数是 2.0

示例 2:

nums1 = [1, 2]
nums2 = [3, 4]

则中位数是 (2 + 3)/2 = 2.5

个人提交结果

[code]class Solution:
def findMedianSortedArrays(self, nums1, nums2):
"""
:type nums1: List[int]
:type nums2: List[int]
:rtype: float
"""
nums = nums1 + nums2
nums = sorted(nums)
n = int(len(nums))
if n == 1 :
median = nums[n-1]
if n % 2 == 0:
median = (nums[int(n/2)] + nums[int(n/2) - 1]) / 2
else:
median = nums[int(n/2)]
return median

官方题解

[code]def median(A, B):
m, n = len(A), len(B)
if m > n:
A, B, m, n = B, A, n, m
if n == 0:
raise ValueError

imin, imax, half_len = 0, m, (m + n + 1) / 2
while imin <= imax:
i = (imin + imax) / 2
j = half_len - i
if i < m and B[j-1] > A[i]:
# i is too small, must increase it
imin = i + 1
elif i > 0 and A[i-1] > B[j]:
# i is too big, must decrease it
imax = i - 1
else:
# i is perfect

if i == 0: max_of_left = B[j-1]
elif j == 0: max_of_left = A[i-1]
else: max_of_left = max(A[i-1], B[j-1])

if (m + n) % 2 == 1:
return max_of_left

if i == m: min_of_right = B[j]
elif j == n: min_of_right = A[i]
else: min_of_right = min(A[i], B[j])
return (max_of_left + min_of_right) / 2.0

方法：递归法

为了解决这个问题，我们需要理解“中位数的作用是什么”。在统计中，中位数被用来：

将一个集合划分为两个长度相等的子集，其中一个子集中的元素总是大于另一个子集中的元素。

如果理解了中位数的划分作用，我们就很接近答案了。

首先，让我们在任一位置 ii 将 \text{A}A 划分成两个部分：

[code]          left_A             |        right_A
A[0], A[1], ..., A[i-1]  |  A[i], A[i+1], ..., A[m-1]

由于 A 中有 m 个元素，所以我们有 m+1 种划分的方法（i = 0∼m）。

我们知道：

len(left_A)=i, len(right_A)=m−i.

注意：当 i = 0时，left_A 为空集，而当 i = m 时, right_A 为空集。

采用同样的方式，我们在任一位置 j 将 B 划分成两个部分：

[code]          left_B             |        right_B
B[0], B[1], ..., B[j-1]  |  B[j], B[j+1], ..., B[n-1]

将 left_A 和 left_B 放入一个集合，并将 right_A 和 right_B 放入另一个集合。再把这两个新的集合分别命名为 left_part 和 right_part：

[code]          left_part          |        right_part
A[0], A[1], ..., A[i-1]  |  A[i], A[i+1], ..., A[m-1]
B[0], B[1], ..., B[j-1]  |  B[j], B[j+1], ..., B[n-1]

如果我们可以确认：

len(left_part) = len(right_part)

max(left_part) ≤ min(right_part)

那么，我们已经将 {A,B} 中的所有元素划分为相同长度的两个部分，且其中一部分中的元素总是大于另一部分中的元素。那么：

$median= \frac{max(left part)+min(right part)}{2}$

要确保这两个条件，我们只需要保证：

i+j=m−i+n−j（或：m - i + n - j + 1）如果 n ≥ m，只需要使 i = 0∼m , $j = \frac{m + n + 1}{2} - i$

B[j−1] ≤ A[i] 以及 A[i−1] ≤ B[j]

ps.1 为了简化分析，我假设 A[i−1], B[j−1], A[i], B[j] 总是存在，哪怕出现 i=0，i=m，j=0，或是 j=n 这样的临界条件。我将在最后讨论如何处理这些临界值。

ps.2 为什么 n ≥ m？由于0≤i≤m 且 $j = \frac{m + n + 1}{2} - i$ ，我必须确保 j 不是负数。如果 n < m，那么 j 将可能是负数，而这会造成错误的答案。

所以，我们需要做的是：

在 [0，m] 中搜索并找到目标对象 i，以使：

B[j−1] ≤ A[i] 且 A[i−1] ≤ B[j], 其中 $j = \frac{m + n + 1}{2} - i$

接着，我们可以按照以下步骤来进行二叉树搜索：

设 imin=0，imax=m，然后开始在 [imin,imax] 中进行搜索。
令 $i = \frac{\text{imin} + \text{imax}}{2}$ ， $j = \frac{m + n + 1}{2} - i$
现在我们有len(left_part) = len(right_part)。而且我们只会遇到三种情况：

B[j−1] ≤ A[i] 且 A[i−1] ≤ B[j]：
这意味着我们找到了目标对象 i，所以可以停止搜索。
B[j−1] > A[i]：
这意味着 A[i] 太小，我们必须调整 i 以使 B[j−1] ≤ A[i]。
我们可以增大 i 吗？
      是的，因为当 i 被增大的时候，j 就会被减小。
      因此 B[j−1] 会减小，而 A[i] 会增大，那么 B[j−1] ≤ A[i] 就可能被满足。
我们可以减小 i 吗？
      不行，因为当 i 被减小的时候，j 就会被增大。
      因此 B[j−1] 会增大，而 A[i] 会减小，那么 B[j−1] ≤ A[i] 就可能不满足。
所以我们必须增大 i。也就是说，我们必须将搜索范围调整为 [i+1,imax]。因此，设 imin=i+1，并转到步骤 2。
A[i−1] > B[j]：这意味着 A[i−1] 太大，我们必须减小 i 以使 A[i−1] ≤ B[j]。也就是说，我们必须将搜索范围调整为 [imin,i−1]。
因此，设 imax=i−1，并转到步骤 2。

当找到目标对象 i 时，中位数为：

max(A[i−1],B[j−1]), 当 m+n 为奇数时

$\frac{\max(\text{A}[i-1], \text{B}[j-1]) + \min(\text{A}[i], \text{B}[j])}{2}$ ，当 m+n 为偶数时

现在，让我们来考虑这些临界值 i=0,i=m,j=0,j=n，此时 A[i−1],B[j−1],A[i],B[j]可能不存在。其实这种情况比你想象的要容易得多。

我们需要做的是确保 max(left_part) ≤ min(right_part)。因此，如果 i 和 j 不是临界值（这意味着 A[i−1], B[j−1], A[i], B[j] 全部存在）, 那么我们必须同时检查 B[j−1] ≤ A[i] 以及 A[i−1] ≤ B[j] 是否成立。但是如果 A[i−1], B[j−1], A[i], B[j] 中部分不存在，那么我们只需要检查这两个条件中的一个（或不需要检查）。举个例子，如果 i=0，那么 A[i−1] 不存在，我们就不需要检查 A[i−1]≤B[j] 是否成立。所以，我们需要做的是：

在 [0，m] 中搜索并找到目标对象 i，以使：

(j = 0 or i = m or B[j−1]≤A[i]) 或是 (i = 0 or j = n or A[i−1] ≤ B[j]), 其中 $j = \frac{m + n + 1}{2} - i$

在循环搜索中，我们只会遇到三种情况：

(j=0 or i=m or B[j−1] ≤ A[i]) 或是
(i = 0 or j = n or A[i−1] ≤ B[j])
这意味着 i 是完美的，我们可以停止搜索。

j > 0and i < m and B[j−1] > A[i]
这意味着 i 太小，我们必须增大它。

i > 0 and j < n and A[i−1] > B[j]
这意味着 i 太大，我们必须减小它。

i < m ⟹ j > 0 以及 i > 0 ⟹ j < n 始终成立，这是因为：

m ≤ n, i < m ⟹ $j = \frac{m+n+1}{2} - i$ > $\frac{m+n+1}{2} - m$ ≥ $\frac{2m+1}{2} - m$ ≥ 0

m ≤ n, i > 0 ⟹ $j = \frac{m+n+1}{2} - i$ < $\frac{m+n+1}{2}$ ≤ $\frac{2n+1}{2}$ ≤ n

所以，在情况 2 和 3中，我们不需要检查 j > 0 或是 j < n 是否成立。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航