如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
2017-12-15 11:54
776 查看
问题:如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
分析:
数据时从一个数据流中读出来的,数据的数目随着时间的变化而增加。如果用一个数据容器来保存从流中读出来的数据,当有新的数据从流中读出来时,这些数据就插入到数据容器中。用什么样的数据结构比较合适呢?我们可以先分析下:
一是没有排序的数组。很容易想到的是用Partition函数找到数组中的中位数。这样一来的话,插入一个数字和找出中位数的时间复杂度是O(1)和O(n)。
二是排序的数组。但是插入操作的时间复杂度是O(n),由于是排好序的数组,所以找到中位数是一个简单的操作,只需要时间复杂度为O(1)。
三是排序的链表。需要O(n)时间才能在链表中找到合适的位置插入新的数据。之前我们讨论过采用两个指针指向链表中间结点,那么可以在O(1)时间找到中位数。这样一来,时间效率与基于排序的数组的时间效率是一样的。
四是二叉搜索树。可以将把插入新数据的平均时间降到O(nlogn),但是问题是当二叉搜索树极度不平衡的时候看起来像一个排序的链表,插入新数据的时间将是O(n)。为了得到中位数,可以在二叉树结点中添加一个表示子树结点数目的字段。凭借这个字段,可以在平均时间O(nlogn)时间得到中位数,但最坏的情况仍然需要O(n)时间。
五是利用平衡的二叉树,即AVL树。AVL树的平衡因子定义是左右子树的高度差,为找到中位数,我们可以把AVL树的平衡因子定义为左右子树结点数目之差。这样一来可以在O(nlogn)时间内往AVL树添加一个新结点,同时用O(1)时间得到我们需要的中位数。可以说AVL树的效率是最高的,但在短时间内编写其代码不是件容易的事。
六是最大堆和最小堆结合。如果数据在容器中已经排序,那么中位数可以由P1和P2指向的数得到,如果容器中数据的数目是奇数,那么P1和P2指向同一个数据。如下图所示:
如图整个数据容器分隔成两个部分,位于容器左边部分的数据比右边的数据小,P1指向的数据是左边部分最大的数,P2指向的数据是右边部分最小的数。如果我们能够保证数据容器左边的数据都小于右边的数据,这样即使左右两边内部的数据没有排序,也可以根据左边最大数和右边最小数得到中位数。所以自然想到的是用一个最大堆实现左边的数据容器,用最小堆实现右边的数据容器。这样一来,可以在O(nlogn)时间内添加一个新结点,同时用O(1)时间得到我们需要的中位数。在分析上我们必须起码满足两个基本保证:一是保证数据平均分配到两个堆中,因此两个堆中数据的数目之差不能超过1,所以在数据总数目是偶数时把新数据插入到最小堆中或最大堆中;二是保证最大堆里的所有数据都小于最小堆中所有的数据。编写代码时,要仔细考虑。
不同数据结构的比较如下:
综上,采用最大堆和最小堆相结合的方案是性价比最高。
import java.util.*;
public class Solution{
int count;
PriorityQueue minHeap = new PriorityQueue();
@SuppressWarnings("unchecked")
PriorityQueue maxHeap = new PriorityQueue(11, new Comparator() {
@Override
public int compare(Object o1, Object o2) {
// TODO Auto-generated method stub
// PriorityQueue默认是小顶堆,实现大顶堆,需要反转默认排序器
return ((Integer) o2).compareTo((Integer) o1);
}
});
public void Insert(Integer num) {
count++;
if ((count & (0x1)) == 0) { // 判断偶数的高效写法
if (!maxHeap.isEmpty() && num < (Integer) maxHeap.peek()) {
maxHeap.offer(num);
num = (Integer) maxHeap.poll();
}
minHeap.offer(num);
} else {
if (!minHeap.isEmpty() && num > (Integer) minHeap.peek()) {
minHeap.offer(num);
num = (Integer) minHeap.poll();
}
maxHeap.offer(num);
}
}
public Doub
b41a
le GetMedian() {
if (count == 0) {
throw new RuntimeException("no available number!");
}
// 总数为奇数时,大顶堆堆顶就是中位数
double result;
if ((count & (0x1)) == 1) {
result = Double.parseDouble(maxHeap.peek() + "");
}
else {
result = (Double.parseDouble(minHeap.peek() + "") + Double
.parseDouble(maxHeap.peek() + "")) / 2.0;
}
return result;
}
}
分析:
数据时从一个数据流中读出来的,数据的数目随着时间的变化而增加。如果用一个数据容器来保存从流中读出来的数据,当有新的数据从流中读出来时,这些数据就插入到数据容器中。用什么样的数据结构比较合适呢?我们可以先分析下:
一是没有排序的数组。很容易想到的是用Partition函数找到数组中的中位数。这样一来的话,插入一个数字和找出中位数的时间复杂度是O(1)和O(n)。
二是排序的数组。但是插入操作的时间复杂度是O(n),由于是排好序的数组,所以找到中位数是一个简单的操作,只需要时间复杂度为O(1)。
三是排序的链表。需要O(n)时间才能在链表中找到合适的位置插入新的数据。之前我们讨论过采用两个指针指向链表中间结点,那么可以在O(1)时间找到中位数。这样一来,时间效率与基于排序的数组的时间效率是一样的。
四是二叉搜索树。可以将把插入新数据的平均时间降到O(nlogn),但是问题是当二叉搜索树极度不平衡的时候看起来像一个排序的链表,插入新数据的时间将是O(n)。为了得到中位数,可以在二叉树结点中添加一个表示子树结点数目的字段。凭借这个字段,可以在平均时间O(nlogn)时间得到中位数,但最坏的情况仍然需要O(n)时间。
五是利用平衡的二叉树,即AVL树。AVL树的平衡因子定义是左右子树的高度差,为找到中位数,我们可以把AVL树的平衡因子定义为左右子树结点数目之差。这样一来可以在O(nlogn)时间内往AVL树添加一个新结点,同时用O(1)时间得到我们需要的中位数。可以说AVL树的效率是最高的,但在短时间内编写其代码不是件容易的事。
六是最大堆和最小堆结合。如果数据在容器中已经排序,那么中位数可以由P1和P2指向的数得到,如果容器中数据的数目是奇数,那么P1和P2指向同一个数据。如下图所示:
如图整个数据容器分隔成两个部分,位于容器左边部分的数据比右边的数据小,P1指向的数据是左边部分最大的数,P2指向的数据是右边部分最小的数。如果我们能够保证数据容器左边的数据都小于右边的数据,这样即使左右两边内部的数据没有排序,也可以根据左边最大数和右边最小数得到中位数。所以自然想到的是用一个最大堆实现左边的数据容器,用最小堆实现右边的数据容器。这样一来,可以在O(nlogn)时间内添加一个新结点,同时用O(1)时间得到我们需要的中位数。在分析上我们必须起码满足两个基本保证:一是保证数据平均分配到两个堆中,因此两个堆中数据的数目之差不能超过1,所以在数据总数目是偶数时把新数据插入到最小堆中或最大堆中;二是保证最大堆里的所有数据都小于最小堆中所有的数据。编写代码时,要仔细考虑。
不同数据结构的比较如下:
综上,采用最大堆和最小堆相结合的方案是性价比最高。
import java.util.*;
public class Solution{
int count;
PriorityQueue minHeap = new PriorityQueue();
@SuppressWarnings("unchecked")
PriorityQueue maxHeap = new PriorityQueue(11, new Comparator() {
@Override
public int compare(Object o1, Object o2) {
// TODO Auto-generated method stub
// PriorityQueue默认是小顶堆,实现大顶堆,需要反转默认排序器
return ((Integer) o2).compareTo((Integer) o1);
}
});
public void Insert(Integer num) {
count++;
if ((count & (0x1)) == 0) { // 判断偶数的高效写法
if (!maxHeap.isEmpty() && num < (Integer) maxHeap.peek()) {
maxHeap.offer(num);
num = (Integer) maxHeap.poll();
}
minHeap.offer(num);
} else {
if (!minHeap.isEmpty() && num > (Integer) minHeap.peek()) {
minHeap.offer(num);
num = (Integer) minHeap.poll();
}
maxHeap.offer(num);
}
}
public Doub
b41a
le GetMedian() {
if (count == 0) {
throw new RuntimeException("no available number!");
}
// 总数为奇数时,大顶堆堆顶就是中位数
double result;
if ((count & (0x1)) == 1) {
result = Double.parseDouble(maxHeap.peek() + "");
}
else {
result = (Double.parseDouble(minHeap.peek() + "") + Double
.parseDouble(maxHeap.peek() + "")) / 2.0;
}
return result;
}
}
相关文章推荐
- 如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
- //问题:将n个数从小到大排序如果n是奇数输出正中间的数,如果n是偶数,输出中间的两个数(用动态内存分配的方法)
- 给定一个数组和滑动窗口的大小,找出所有滑动窗口里数值的最大值。例如,如果输入数组{2,3,4,2,6,2,5,1}及滑动窗口的大小3,那么一共存在6个滑动窗口,他们的最大值分别为{4,4,6,6,6,
- 华为:给定一个数组input[],如果数组长度n为奇数,则将数组中最大的元素放到 output[]数组最中间的位置,如果数组长度n为偶数。。 .
- 给定一个数组和滑动窗口的大小,找出所有滑动窗口里数值的最大值。例如,如果输入数组{2,3,4,2,6,2,5,1}及滑动窗口的大小3,那么一共存在6个滑动窗口,他们的最大值分别为{4,4,6,6,6,5}; 针对数组{2,3,4,2,6,2,5,1}的滑动窗口有以下6个: {[2,3,4],2,6,2,5,1}, {2,[3,4,2],6,2,5,1}, {2,3,[4,2,6],2,5,1},
- 12.输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有的奇数位于数组的前半部分,所有的偶数位于位于数组的后半部分,并保证奇数和奇数,偶数和偶数之间的相对位置不变。
- 每天一道算法题7 查找链表中倒数第k个结点 ; 输入一个单向链表。如果该链表的结点数为奇数,输出中间的结点;如果链表结点数为偶数,输出中间两个结点前面的一个
- 输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有的奇数位于数组的前半部分,所有的偶数位于位于数组的后半部分,并保证奇数和奇数,偶数和偶数之间的相对位置不变。
- 如何用C语言获取一个数二进制序列中所有的偶数位和奇数位,分别输出二进制序列
- 输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有的奇数位于数组的前半部分,所有的偶数位于位于数组的后半部分,并保证奇数和奇数,偶数和偶数之间的相对位置不变。
- 输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有的奇数位于数组的前半部分,所有的偶数位于位于数组的后半部分,并保证奇数和奇数,偶数和偶数之间的相对位置不变。
- 输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有的奇数位于数组的前半部分,所有的偶数位于位于数组的后半部分,并保证奇数和奇数,偶数和偶数之间的相对位置不变。
- 数据流中所有数排序之后的中位数
- 剑指offer题目描述 输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有的奇数位于数组的前半部分,所有的偶数位于位于数组的后半部分,并保证奇数和奇数,偶数和偶数之间的相对位置不变。
- 输入一个整型数组,实现一个函数,来调整数组中的数字顺序是的数组中所有的奇数位于数组前半部分,所有偶数位于数组的后半部分。
- 输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有的奇数位于数组的前半部分,所有的偶数位于位于数组的后半部分,并保证奇数和奇数,偶数和偶数之间的相对位置不变。
- 给定一个数组input[] ,如果数组长度n为奇数,则将数组中最大的元素放到 output[] 数组 最中间的位置,如果数组长度n为偶数,则将数组中最大的元素放到 output[] 数组中间两个位置偏右的那个位置上
- 【数据结构】输入一个整数数组,调整数组中数字的顺序,使得所有奇数位于数组的前半部分,所有偶数位于数组的后半部分。
- C语言 程序实现将一个数组所有奇数放在前半部分,偶数位于后半部分
- 中位数 21% 通过 给定一个未排序的整数数组,找到其中位数。 中位数是排序后数组的中间值,如果数组的个数是偶数个,则返回排序后数组的第N/2个数