您的位置：首页 > 理论基础 > 数据结构算法

Redis学习-数据结构

2017-01-13 09:30 429 查看

Redis 简介

Redis 优势

Redis与其他key-value存储有什么不同

Redis 数据结构
redis数据结构 String

redis数据结构 List
Redis 列表命令

redis数据结构 Set
Redis 集合命令

redis数据结构 sorted set
Redis 有序集合命令

redis数据结构 Hash
Redis hash 命令

Redis HyperLogLog
什么是基数

Redis 简介

Redis 是完全开源免费的，遵守BSD协议，是一个高性能的key-value数据库。

Redis 与其他 key - value缓存产品有以下三个特点：

Redis支持数据的持久化，可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。

Redis不仅仅支持简单的key-value类型的数据，同时还提供list，set，zset，hash等数据结构的存储。

Redis支持数据的备份，即master-slave模式的数据备份。

Redis 优势

性能极高 – Redis能读的速度是110000次/s,写的速度是81000次/s 。

丰富的数据类型 – Redis支持二进制案例的 Strings, Lists, Hashes, Sets 及 Ordered Sets 数据类型操作。

原子 – Redis的所有操作都是原子性的，同时Redis还支持对几个操作全并后的原子性执行。

丰富的特性 – Redis还支持 publish/subscribe, 通知, key 过期等等特性。

Redis与其他key-value存储有什么不同？

Redis有着更为复杂的数据结构并且提供对他们的原子性操作，这是一个不同于其他数据库的进化路径。Redis的数据类型都是基于基本数据结构的同时对程序员透明，无需进行额外的抽象。

Redis运行在内存中但是可以持久化到磁盘，所以在对不同数据集进行高速读写时需要权衡内存，因为数据量不能大于硬件内存。在内存数据库方面的另一个优点是，相比在磁盘上相同的复杂的数据结构，在内存中操作起来非常简单，这样Redis可以做很多内部复杂性很强的事情。同时，在磁盘格式方面他们是紧凑的以追加的方式产生的，因为他们并不需要进行随机访问。

Redis 数据结构

redis是一种高级的key:value存储系统，其中value支持五种数据类型：

字符串（String）

字符串列表（List）

字符串集合（Set）

有序字符串集合（sorted set）

哈希（Hash）

而关于key，有几个点要提醒大家：

key不要太长，尽量不要超过1024字节，这不仅消耗内存，而且会降低查找的效率；

key也不要太短，太短的话，key的可读性会降低；

在一个项目中，key最好使用统一的命名模式，例如user:10000:passwd。

redis数据结构 – String

有人说，如果只使用redis中的字符串类型，且不使用redis的持久化功能，那么，redis就和memcache非常非常的像了。这说明strings类型是一个很基础的数据类型，也是任何存储系统都必备的数据类型。

我们来看一个最简单的例子：

[root@localhost redis]# ./bin/redis-cli
127.0.0.1:6379> set test "helloworld" //设置字符串类型
OK
127.0.0.1:6379>
127.0.0.1:6379>
127.0.0.1:6379> get test
"helloworld" //读取字符串类型
127.0.0.1:6379>

字符串类型的用法就是这么简单，因为是二进制安全的，所以你完全可以把一个图片文件的内容作为字符串来存储。

另外，我们还可以通过字符串类型进行数值操作：

127.0.0.1:6379> set num "2"
OK
127.0.0.1:6379>
127.0.0.1:6379> get num
"2"
127.0.0.1:6379>
127.0.0.1:6379> incr num  //加1
(integer) 3
127.0.0.1:6379>

string类型是Redis最基本的数据类型，一个键最大能存储512MB。

Redis 字符串命令

下表列出了常用的 redis 字符串命令：


序号	命令及描述
1	SET key value 设置指定 key 的值
2	GET key 获取指定 key 的值。
3	GETRANGE key start end 返回 key 中字符串值的子字符
4	GETSET key value 将给定 key 的值设为 value ，并返回 key 的旧值(old value)。
5	GETBIT key offset 对 key 所储存的字符串值，获取指定偏移量上的位(bit)。
6	MGET key1 [key2..] 获取所有(一个或多个)给定 key 的值。
7	SETBIT key offset value 对 key 所储存的字符串值，设置或清除指定偏移量上的位(bit)。
8	SETEX key seconds value 将值 value 关联到 key ，并将 key 的过期时间设为 seconds (以秒为单位)。
9	SETNX key value 只有在 key 不存在时设置 key 的值。
10	SETRANGE key offset value 用 value 参数覆写给定 key 所储存的字符串值，从偏移量 offset 开始。
11	STRLEN key 返回 key 所储存的字符串值的长度。
12	MSET key value [key value …] 同时设置一个或多个 key-value 对。
13	MSETNX key value [key value …] 同时设置一个或多个 key-value 对，当且仅当所有给定 key 都不存在。
14	PSETEX key milliseconds value 这个命令和 SETEX 命令相似，但它以毫秒为单位设置 key 的生存时间，而不是像 SETEX 命令那样，以秒为单位。
15	INCR key 将 key 中储存的数字值增一。
16	INCRBY key increment 将 key 所储存的值加上给定的增量值（increment）。
17	INCRBYFLOAT key increment 将 key 所储存的值加上给定的浮点增量值（increment）。
18	DECR key 将 key 中储存的数字值减一。
19	DECRBY key decrement key 所储存的值减去给定的减量值（decrement）。
20	APPEND key value 如果 key 已经存在并且是一个字符串， APPEND 命令将 value 追加到 key 原来的值的末尾。

redis数据结构 – List

redis的另一个重要的数据结构叫做lists，翻译成中文叫做“列表”。

- Redis列表是简单的字符串列表，按照插入顺序排序。你可以添加一个元素导列表的头部（左边）或者尾部（右边）

一个列表最多可以包含 232 - 1 个元素 (4294967295, 每个列表超过40亿个元素)。

- 首先要明确一点，redis中的lists在底层实现上并不是数组，而是链表，也就是说对于一个具有上百万个元素的lists来说，在头部和尾部插入一个新元素，其时间复杂度是常数级别的，比如用LPUSH在10个元素的lists头部插入新元素，和在上千万元素的lists头部插入新元素的速度应该是相同的。

- 虽然lists有这样的优势，但同样有其弊端，那就是，链表型lists的元素定位会比较慢，而数组型lists的元素定位就会快得多。

lists的常用操作包括LPUSH、RPUSH、LRANGE等。我们可以用LPUSH在lists的左侧插入一个新元素，用RPUSH在lists的右侧插入一个新元素，用LRANGE命令从lists中指定一个范围来提取元素。我们来看几个例子：

//新建一个叫做 list 的 list， 并在列表的头部插入元素 "1"
127.0.0.1:6379> lpush list "1"
(integer) 1
//在list 的尾部 插入元素 "2"
127.0.0.1:6379> rpush list "2"
(integer) 2
//在list的头部插入元素 "-1"
127.0.0.1:6379> lpush list "-1"
(integer) 3
//展示list中 编号 0 到 1 的元素
127.0.0.1:6379> lrange list 0 1
1) "-1"
2) "1"
//展示list中 编号 0 到 倒数第一个元素
127.0.0.1:6379> lrange list 0 -1
1) "-1"
2) "1"
3) "2"
127.0.0.1:6379>

lists的应用相当广泛，随便举几个例子：

我们可以利用lists来实现一个消息队列，而且可以确保先后顺序，不必像MySQL那样还需要通过ORDER BY来进行排序。

利用LRANGE还可以很方便的实现分页的功能。

在博客系统中，每片博文的评论也可以存入一个单独的list中。

Redis 列表命令

下表列出了列表相关的基本命令：


序号	命令及描述
1	BLPOP key1 [key2 ] timeout 移出并获取列表的第一个元素，如果列表没有元素会阻塞列表直到等待超时或发现可弹出元素为止。
2	BRPOP key1 [key2 ] timeout 移出并获取列表的最后一个元素，如果列表没有元素会阻塞列表直到等待超时或发现可弹出元素为止。
3	BRPOPLPUSH source destination timeout 从列表中弹出一个值，将弹出的元素插入到另外一个列表中并返回它；如果列表没有元素会阻塞列表直到等待超时或发现可弹出元素为止。
4	LINDEX key index 通过索引获取列表中的元素
5	LINSERT key BEFORE AFTERpivotvalue 在列表的元素前或者后插入元素
6	LLEN key 获取列表长度
7	LPOP key 移出并获取列表的第一个元素
8	LPUSH key value1 [value2] 将一个或多个值插入到列表头部
9	LPUSHX key value 将一个或多个值插入到已存在的列表头部
10	LRANGE key start stop 获取列表指定范围内的元素
11	LREM key count value 移除列表元素
12	LSET key index value 通过索引设置列表元素的值
13	LTRIM key start stop 对一个列表进行修剪(trim)，就是说，让列表只保留指定区间内的元素，不在指定区间之内的元素都将被删除。
14	RPOP key 移除并获取列表最后一个元素
15	RPOPLPUSH source destination 移除列表的最后一个元素，并将该元素添加到另一个列表并返回
16	RPUSH key value1 [value2] 在列表中添加一个或多个值
17	RPUSHX key value 为已存在的列表添加值

redis数据结构 – Set

redis的集合，是一种无序的集合，集合中的元素没有先后顺序。

Redis的Set是string类型的无序集合。集合成员是唯一的，这就意味着集合中不能出现重复的数据。

Redis 中集合是通过哈希表实现的，所以添加，删除，查找的复杂度都是O(1)。

集合中最大的成员数为 232 - 1 (4294967295,每个集合可存储40多亿个成员)。

集合相关的操作也很丰富，如添加新元素、删除已有元素、取交集、取并集、取差集等。我们来看例子：

//新建一个名为 set 的set，并添加一个 "one" 元素
127.0.0.1:6379> sadd set "one"
(integer) 1
127.0.0.1:6379>
127.0.0.1:6379>
//继续添加一个元素
127.0.0.1:6379> sadd set "two"
(integer) 1
127.0.0.1:6379>
//展示set中的所有元素
127.0.0.1:6379> smembers set
1) "two"
2) "one"
127.0.0.1:6379>
//判断"one"元素是否为set中的成员，是返回 1
127.0.0.1:6379> sismember set "one"
(integer) 1
127.0.0.1:6379>
//不是set中的成员，返回 0
127.0.0.1:6379> sismember set "there"
(integer) 0
127.0.0.1:6379>
//新增一个set2
127.0.0.1:6379> sadd set2 "1"
(integer) 1
127.0.0.1:6379> smembers set2
1) "1"
//对两个集合求并集
127.0.0.1:6379> sunion set set2
1) "1"
2) "two"
3) "one"
127.0.0.1:6379>

==对于集合的使用，也有一些常见的方式，比如，QQ有一个社交功能叫做“好友标签”，大家可以给你的好友贴标签，比如“大美女”、“土豪”、“欧巴”等等，这时就可以使用redis的集合来实现，把每一个用户的标签都存储在一个集合之中==。

Redis 集合命令

下表列出了 Redis 集合基本命令：


序号	命令及描述
1	SADD key member1 [member2] 向集合添加一个或多个成员
2	SCARD key 获取集合的成员数
3	SDIFF key1 [key2] 返回给定所有集合的差集
4	SDIFFSTORE destination key1 [key2] 返回给定所有集合的差集并存储在 destination 中
5	SINTER key1 [key2] 返回给定所有集合的交集
6	SINTERSTORE destination key1 [key2] 返回给定所有集合的交集并存储在 destination 中
7	SISMEMBER key member 判断 member 元素是否是集合 key 的成员
8	SMEMBERS key 返回集合中的所有成员
9	SMOVE source destination member 将 member 元素从 source 集合移动到 destination 集合
10	SPOP key 移除并返回集合中的一个随机元素
11	SRANDMEMBER key [count] 返回集合中一个或多个随机数
12	SREM key member1 [member2] 移除集合中一个或多个成员
13	SUNION key1 [key2] 返回所有给定集合的并集
14	SUNIONSTORE destination key1 [key2] 所有给定集合的并集存储在 destination 集合中
15	SSCAN key cursor [MATCH pattern] [COUNT count] 迭代集合中的元素

redis数据结构 – sorted set

Redis 有序集合和集合一样也是string类型元素的集合,且不允许重复的成员。

不同的是每个元素都会关联一个double类型的分数。redis正是通过分数来为集合中的成员进行从小到大的排序。

有序集合的成员是唯一的,但分数(score)却可以重复。

集合是通过哈希表实现的，所以添加，删除，查找的复杂度都是O(1)。集合中最大的成员数为 232 - 1 (4294967295, 每个集合可存储40多亿个成员)。

redis不但提供了无需集合（sets），还很体贴的提供了有序集合（sorted sets）。有序集合中的每个元素都关联一个序号（score），这便是排序的依据。

redis不但提供了无需集合（sets），还很体贴的提供了有序集合（sorted sets）。有序集合中的每个元素都关联一个序号（score），这便是排序的依据。

很多时候，我们都将redis中的有序集合叫做zsets，这是因为在redis中，有序集合相关的操作指令都是以z开头的，比如zrange、zadd、zrevrange、zrangebyscore等等

老规矩，我们来看几个生动的例子：

//新建一个 zset ，并添加一个 序号为1的元素 test1
127.0.0.1:6379> zadd zset 1 test1
(integer) 1
//添加一个 序号为2的元素 test2
127.0.0.1:6379> zadd zset 2 test2
(integer) 1
//展示 zset 中的所有元素 同时展示序号
127.0.0.1:6379> zrange zset 0 -1  withscores
1) "test1"
2) "1"
3) "test2"
4) "2"
//只列出zset 元素
127.0.0.1:6379> zrange zset 0 -1
1) "test1"
2) "test2"
3) "test3"
4) "test5"
5) "test6"

Redis 有序集合命令

下表列出了 redis 有序集合的基本命令:


序号	命令及描述
1	ZADD key score1 member1 [score2 member2] 向有序集合添加一个或多个成员，或者更新已存在成员的分数
2	ZCARD key 获取有序集合的成员数
3	ZCOUNT key min max 计算在有序集合中指定区间分数的成员数
4	ZINCRBY key increment member 有序集合中对指定成员的分数加上增量 increment
5	ZINTERSTORE destination numkeys key [key …] 计算给定的一个或多个有序集的交集并将结果集存储在新的有序集合 key 中
6	ZLEXCOUNT key min max 在有序集合中计算指定字典区间内成员数量
7	ZRANGE key start stop [WITHSCORES] 通过索引区间返回有序集合成指定区间内的成员
8	ZRANGEBYLEX key min max [LIMIT offset count] 通过字典区间返回有序集合的成员
9	ZRANGEBYSCORE key min max [WITHSCORES] [LIMIT] 通过分数返回有序集合指定区间内的成员
10	ZRANK key member 返回有序集合中指定成员的索引
11	ZREM key member [member …] 移除有序集合中的一个或多个成员
12	ZREMRANGEBYLEX key min max 移除有序集合中给定的字典区间的所有成员
13	ZREMRANGEBYRANK key start stop 移除有序集合中给定的排名区间的所有成员
14	ZREMRANGEBYSCORE key min max 移除有序集合中给定的分数区间的所有成员
15	ZREVRANGE key start stop [WITHSCORES] 返回有序集中指定区间内的成员，通过索引，分数从高到底
16	ZREVRANGEBYSCORE key max min [WITHSCORES] 返回有序集中指定分数区间内的成员，分数从高到低排序
17	ZREVRANK key member 返回有序集合中指定成员的排名，有序集成员按分数值递减(从大到小)排序
18	ZSCORE key member 返回有序集中，成员的分数值
19	ZUNIONSTORE destination numkeys key [key …] 计算给定的一个或多个有序集的并集，并存储在新的 key 中
20	ZSCAN key cursor [MATCH pattern] [COUNT count] 迭代有序集合中的元素（包括元素成员和元素分值）

redis数据结构 – Hash

Redis hash 是一个string类型的field和value的映射表，hash特别适合用于存储对象。

比如一个用户要存储其全名、姓氏、年龄等等，就很适合使用哈希。

Redis 中每个 hash 可以存储 232 - 1 键值对（40多亿）。

// 创建一个 哈希 并赋值
127.0.0.1:6379> HMSET user:1000 username donggua password 123456 age 200
OK
127.0.0.1:6379>
127.0.0.1:6379>
// 列出哈希的内容
127.0.0.1:6379> hgetall user:1000
1) "username"
2) "donggua"
3) "password"
4) "123456"
5) "age"
6) "200"
127.0.0.1:6379>
// 更改哈希中的某一个值
127.0.0.1:6379> hset user:1000 password 654321
(integer) 0
//再次列出哈希中的内容
127.0.0.1:6379> hgetall user:1000
1) "username"
2) "donggua"
3) "password"
4) "654321"
5) "age"
6) "200"
127.0.0.1:6379>

Redis hash 命令

下表列出了 redis hash 基本的相关命令：


序号	命令及描述
1	HDEL key field2 [field2] 删除一个或多个哈希表字段
2	HEXISTS key field 查看哈希表 key 中，指定的字段是否存在。
3	HGET key field 获取存储在哈希表中指定字段的值。
4	HGETALL key 获取在哈希表中指定 key 的所有字段和值
5	HINCRBY key field increment 为哈希表 key 中的指定字段的整数值加上增量 increment 。
6	HINCRBYFLOAT key field increment 为哈希表 key 中的指定字段的浮点数值加上增量 increment 。
7	HKEYS key 获取所有哈希表中的字段
8	HLEN key 获取哈希表中字段的数量
9	HMGET key field1 [field2] 获取所有给定字段的值
10	HMSET key field1 value1 [field2 value2 ] 同时将多个 field-value (域-值)对设置到哈希表 key 中。
11	HSET key field value 将哈希表 key 中的字段 field 的值设为 value 。
12	HSETNX key field value 只有在字段 field 不存在时，设置哈希表字段的值。
13	HVALS key 获取哈希表中所有值
14	HSCAN key cursor [MATCH pattern] [COUNT count] 迭代哈希表中的键值对。

Redis HyperLogLog

Redis 在 2.8.9 版本添加了 HyperLogLog 结构。

- Redis HyperLogLog 是用来做基数统计的算法，HyperLogLog 的优点是，在输入元素的数量或者体积非常非常大时，计算基数所需的空间总是固定的、并且是很小的。

- 在 Redis 里面，每个 HyperLogLog 键只需要花费 12 KB 内存，就可以计算接近 2^64 个不同元素的基数。这和计算基数时，元素越多耗费内存就越多的集合形成鲜明对比。

- 因为 HyperLogLog 只会根据输入元素来计算基数，而不会储存输入元素本身，所以 HyperLogLog 不能像集合那样，返回输入的各个元素。

什么是基数?

比如数据集 {1, 3, 5, 7, 5, 7, 8}，那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。基数估计就是在误差可接受的范围内，快速计算基数。

来个例子：

//创建一个 HyperLogLog 为 dg, 添加一个元素
127.0.0.1:6379> pfadd dg "redis"
(integer) 1
127.0.0.1:6379>
//再次添加一个元素
127.0.0.1:6379> pfadd dg "mongodb"
(integer) 1
127.0.0.1:6379>
//再次添加一个元素
127.0.0.1:6379> pfadd dg "mysql"
(integer) 1
//返回dg 的基数
127.0.0.1:6379> pfcount dg
(integer) 3
127.0.0.1:6379>
//新建一个HyperLogLog 为gd
127.0.0.1:6379> pfadd gd "oracle"
//将dg 合并到gd中
127.0.0.1:6379> pfmerge gd dg
OK
//返回dg的基数
127.0.0.1:6379> pfcount gd
(integer) 4
127.0.0.1:6379>

Redis HyperLogLog 命令

下表列出了 redis HyperLogLog 的基本命令：


序号	命令及描述
1	[PFADD key element [element …]] 添加指定元素到 HyperLogLog 中。
2	[ PFCOUNT key [key …] ] 返回给定 HyperLogLog 的基数估算值。
3	[PFMERGE destkey sourcekey [sourcekey …] ] 将多个 HyperLogLog 合并为一个 HyperLogLog

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： redis

相关文章推荐

新的分享

章节导航