您的位置:首页 > 理论基础 > 数据结构算法

redis 数据结构之和对象---简单动态字符串SDS(simple dynamic string)

2014-11-08 16:19 627 查看
1.介绍:

reids 没有直接使用C语言传统的字符串表示(以空字符结尾的字符数组)而是构建了一种名为简单动态字符串的抽象类型,并为redis的默认字符串表示,因为C字符串不能满足redis对字符串的安全性、效率以及功能方面的需求

2.SDS的定义:

 


每个sds.h/sdshdr结构表示一个SDS的值
struct sdshdr{
//记录buf数组中已使用的字节的数量
//等于sds所保存字符串的长度
int len;

//记录buf中未使用的数据
int free;

//字符数组,用于保存字符串
}

* free 属性的值为0,表示这个SDS没有分配任何未使用的空间
* len  属性长度为5,表示这个SDS保存一个五字节长的字符串
* buf  属性是一个char类型的数组,数组的前5个字节分别保存了'R','e','d','i','s'五个字符,而最后一个字节则保存了空字符串'\0'


3. SDS 与C字符串的区别

3.1、常数复杂度获取字符串长度

        c字符串结构



当取字符串长度时需要遍历整个字符串,对字符串进行计数直到为空的字符串为值,这个操作的复杂度为O(N)
SDS简单动态字符的结构len属性就已存储了SDS长度,所以取一个SDS的长度为O(1)

3.2、杜绝绶冲区溢出



c字符串不记录长度,容易造成溢出
例:假设在程序中有两个在内存中紧邻着的C字符串S1和S2,其中S1保存了字符串"Redis" 而S2则保存了字符串"MongoDB"
如果我们将执行了stract(s1, " Cluster") 却忘记执行执行前分配足够的空间,那么在执行后S1数组将溢出到S2的空间中,导致S2的内容被意外修改
SDS的空间分配策略安全杜绝了发生绶冲区溢出的可能性,当SDS API需要对对SDS进行修改时,API会先检查SDS的空间是否满足需要,如果不满足则会自动扩展至执行修改所需的大小(属性len增加),然后才执行实际的修改操作

3.3、减少修改字符串时带来的内存重分配次数
c字符串在修改每一个字符串的增加或缩短时都会进行一次内存重分配操作,由于内存重分配的波及复杂的算法有可能执行系统的调用所以是用一个比较耗时的操作
针对C字符串的劣势SDS实现了空间预分配和惰性空间释放两种优化策略
空间预留分配:对SDS进行修改时对SDS进行空间扩展的同时,还会对SDS分配额外的未使用的空间
分配公式:
SDS的属性小于1MB 将分配同等大小的free属性 例:SDS的len将变成13字节,那么程序也会分配13字节的未使用空间。SDS组数的实际长度:13+13+1 = 27(未使用+已使用+1)
SDS的属性大小1MB 如果SDS的长度大于1MB将分配1MB的未使用空间,例SDS修改之后SDS的len将变成30MB,那么会分配1MB的未使用空间。SDS数组的实际长充为:30MB+1MB+1byte
惰性空间释放:
SDS的长度缩短,内存分配的空间不会发生变化,SDS的惰性空间策略避免了内存重新分配操作,并为将来的可能的增长操作提供了优化,API也提供了释放未使空间,所以不用担心空间的浪费

3.4 二进制安全

C字符串除了字符串的未尾之外,字符串里面不能包含空字符,否则最先被程序读入的空间将被误认为是字符串结尾,这些限制了C字符串只能保存文本数
SDS则没有这种限制,可以保存文本或者二进制数据

3.5 兼容部分C字符串函数
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: