您的位置:首页 > 数据库 > Redis

学习笔记-Redis设计与实现-简单动态对象(simple dynamic string, SDS)

2017-02-07 07:34 756 查看

简单动态对象(simple dynamic string, SDS)


C字符串只会作为字符串字面量(string literal)用在一些无须对字符串进行修改的地方,不如打印日志redisLog(REDIS_WARNING, "Redis is now ready to exit, byebye…");

当Redis需要的不仅仅是一个字符串字面量,而是一个可以被修改的字符串时,Redis就会使用SDS来表示字符串值

SDS还被用作缓冲区(buffer)AOF模块中的AOF缓冲区客户端状态中的输入缓冲区

SDS的定义




这个结构体的长度是4+4+6=14个字节

SDS与C字符串的区别

常数复杂度获取字符串长度


C获取字符串长度的复杂度为O(N),SDS长度复杂度为O(1)

设置和更新SDS长度的工作是由SDS的API在执行时自动完成的,使用SDS无须进行任何手动修改长度的工作(修改长度且向修改后的SDS填充数据时,应该是比C复杂的?)

使用SDS,Redis将获取字符串长度所需的复杂付从O(N)降低到了O(1),确保了获取字符串长度的工作不会成为Redis的性能瓶颈

杜绝缓冲区溢出


SDS的控件分配策略完全杜绝了发生缓冲区溢出的可能性:当SDS API需要对SDS进行修改时,API会先检查SDS的空间是否满足修改所需的要求,如果不满足的话,API会自动将SDS的空间扩展至执行修改所需的大小,然后才执行实际的修改问题

注意:sdscat不仅对SDS进行了拼接操作,还为SDS分配了与当前len相同的未使用空间。

减少修改字符串时带来的内存重分配次数

SDS通过未使用空间借出了字符串长度和底层数组长度之间的关联。通过未使用空间,SDS实现了空间预分配和惰性空间释放两种优化策略。

空间预分配

空间预分配用于优化SDS的字符串增长操作:当SDS的API对一个SDS进行修改,并且需要对SDS进行空间扩展的时候,程序不仅会未SDS分配修改所必须的空间,还会为SDS分配额外的未使用空间:

修改后,SDS的len<1MB,程序分配和len属性同样大小的未使用空间

修改后,SDS的len>=1MB,程序会分配1MB的未使用空间。在扩展SDS空间之前,SDS API会先检查未使用空间是否足够,如果足够的话,就会·直接使用未使用空间,而无需执行内存重分配。通过这种预分配策略,SDS将连续增长N次字符串所需的内存重分配次数从必定N次降低为最对N次。

惰性空间释放


惰性空间释放用于优化SDS的字符串缩短操作:当SDS的API需要缩短SDS保存的字符串时,程序并不立即使用内存重分配操作来回收缩短后多出来的字节,而是使用free属性将这些字节的数量记录起来,并等待将来使用

通过惰性空间释放策略,SDS避免了缩短字符串时所需要的内存重分配操作,并为将来可能有的增长操作提供了优化。

SDS提供相应的API,在有需要时,真正释放SDS的未使用空间,不用担心惰性空间释放策略会造成内存浪费。

二进制安全


SDS得API都是二进制安全得的binary-safe),所有SDS API都会以处理二进制得方式来处理SDS存放在buf数组里得数据,程序不会对其中得数据做任何限制、过滤、或者假设,数据在写入时是什么样得,它被读取时就是什么样的。

SDS的buf属性称为字节数组,用它来保存一系列二进制数据。

通过使用二进制安全的SDS,使得Redis不仅可以保存文本数据,还可以保存任意格式的二进制数据。

兼容部分C字符串函数


SDS的API都是二进制安全的,并遵循C字符串以空字符结尾的惯例,这是为了让保存文本数据的SDS可以重用一部分<string.h>库定义的函数。

总结



SDSAPI





重点回顾


Redis只会使用C字符串作为字面量,在大多数情况下,Redis使用SDS(Simple Dynamic String,简单动态字符串)作为字符串表示。

比起C字符串,SDS具有以下有点:

常数复杂度获取字符串长度

杜绝缓冲区溢出

减少修改字符串长度时所需的内存重分配次数

二进制安全

兼容部分C字符串函数
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  simple dynamic C字符串