基数估算HyperLogLog
2017-10-23 13:13
225 查看
HyperLogLog
HyperLogLog 可以接受多个元素作为输入,并给出输入元素的基数估算值:• 基数:集合中不同元素的数量。比如 {'apple', 'banana', 'cherry', 'banana', 'apple'} 的基数就是 3 。
• 估算值:算法给出的基数并不是精确的,可能会比实际稍微多一些或者稍微少一些,但会控制在合理的范围之内。
HyperLogLog 的优点是,即使输入元素的数量或者体积非常非常大,计算基数所需的空间总是固定的、并且是很小的。
在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基数。这和计算基数时,元素越多耗费内存就越多的集合形成鲜明对比。
但是,因为 HyperLogLog 只会根据输入元素来计算基数,而不会储存输入元素本身,所以HyperLogLog 不能像集合那样,返回输入的各个元素。
相关文章推荐
- 结合redis设计与实现的redis源码学习-10-hyperloglog(基数统计)
- HyperLogLog基数统计
- 基数计数——HyperLogLog
- Redis 学习笔记(十一)基数统计(HyperLogLog)
- 布隆过滤器和Hyperloglog基数统计的介绍
- Redis源码剖析--基数统计hyperloglog
- 【关于TABLE函数的SQL优化】解决CBO对TABLE函数基数估算导致的性能问题
- Redis 基数统计:HyperLogLog 小内存大用处
- Redis 学习笔记(十一)基数统计(HyperLogLog)
- HyperLogLog-Redis中的基数统计算法
- Oracle 执行计划(2)-基数 cardinality【即估算一个操作返回的行数】
- 在sqlserver中,优化器如何利用统计信息来估算返回的行数(三)
- 算法导论-12-2-基数树
- 大数据应用之双色球算奖平台总体设计数据规模估算篇
- 一次错误估算带来的启示
- HDU-1106 快排模板 和 基数排序
- 基数排序
- 各种排序总结(七)基数排序
- 面试常见问题——估算运行时间
- 12045徐波:PMBOK融会贯通:几种估算类比:类比估算、参数估算、自下而上估算、三点估算