redis–10–操作–HyperLogLog

redis–10–操作–HyperLogLog

1、简介
1.1、基数问题
求集合中不重复元素个数的问题称为基数问题
什么是基数?
比如数据集 {1, 3, 5, 5, 5}, 那么这个数据集的基数集为 {1, 3, 5 }, 基数(不重复元素)为3。
基数估计
就是在误差可接受的范围内,快速计算基数。
1.2、解决基数问题方案:
数据存储在MySQL表中,使用distinct count计算不重复个数使用Redis提供的hash、set、bitmaps等数据结构来处理
1.3、HyperLogLog
以上的方案结果精确,但随着数据不断增加,导致占用空间越来越大,对于非常大的数据集是不切实际的。 能否能够降低一定的精度来平衡存储空间?Redis推出了HyperLogLog
Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者

redis–10–操作–HyperLogLog最先出现在Python成神之路

版权声明:
作者:siwei
链接:https://www.techfm.club/p/21173.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>