Redis源码分析(一)——Redis数据结构-字符串SDS
1. SDS简介
- Redis中使用的字符串均为『简单动态字符串』(Simple Dynamic String),简称SDS。
- SDS是在C字符串的基础上进行了一些包装,使得它更符合Redis的使用场景。
- 在Redis中,C字符串只用在一些无需修改的地方,如日志打印;其他需要使用字符串的地方基本上使用的都是SDS。
2. 数据结构
struct sdshdr{
int len;
int free;
char buf[];
};
-
len
:buf数组中字符串的实际使用量。 -
free
:buf数组中空闲量。 -
buf
:存储字符的数组。
3. SDS的优点
Redis使用C语言编写,而Redis不使用C语言字符串是有原因的,Redis中的SDS字符串与C字符串相比有如下优点。
3.1 获取字符串长度效率高
C语言字符串是不记录字符串长度的,所以每次获取字符串长度时,都要对字符数组进行一次遍历,那么时间复杂度就为O(n)。 而SDS中采用len记录当前字符串的长度,所以统计字符串长度的时间复杂度为O(1),因此效率高于C字符串。
3.2 避免了缓冲区溢出
3.2.1 什么是『缓冲区溢出』?
当使用strcat(char *dest, char *src)
拼接两个字符串时,strcat
是默认第一个字符数组的后面是有足够空间的,它会直接把第二个字符数组中的字符挨个复制到第一个字符数组的后面。
那么问题就来了,如果这两个字符数组的内存空间是紧挨着的,那么当执行strcat时,第二个字符数组的就会被覆盖掉。这就是缓冲区溢出。
所以在使用strcat拼接两个字符串前,一定要先判断第一个字符串后面是否有足够的内存空间;如果不够了,那就得手动扩容。那么这一系列判断+扩容操作都是需要程序员自己去完成的,有些麻烦。
3.2.2 Redis如何避免缓冲区溢出?
而SDS提供的所有修改字符串的API中,都会判断修改之后是否会内存溢出,如果会内存溢出,它会帮你进行内存扩容。 所以对于SDS而言,这一系列操作都由它来帮你完成,无需程序员手动判断。
3.3 减少修改字符串时内存重分配的次数
3.3.1 什么是『内存重分配』?
- 当我们使用append扩充字符串时,我们首先要扩充当前字符数组的内存,然后再将第二个字符数组中的值一一复制进来,否则就有可能出现『缓冲区溢出』。这个过程就是『内存重分配』。
- 当我们需要截取字符串后,我们需要释放已经不被使用的内存空间,否则就可能出现『内存泄露』。这个过程也是『内存重分配』。
内存重分配过程会涉及复杂的算法和系统调用,较为耗时。如果像C字符串那样,每次修改字符串都要进行一次内存重分配,那么效率是极底的,所以SDS使用了『空间预分配』和『惰性空间释放』降低了重分配的频率,从而提升效率。
3.3.2 SDS如何减少内存重分配次数?
- 空间预分配
当需要扩展SDS长度的时候,Redis不仅会给它分配所需的内存空间,还会分配一段额外的空间作为备用。
备用空间大小按照如下公式计算:
- 如果扩展之后,SDS字符数组的长度小于1M,那么就使得备用空间的大小和字符串实际长度保持一致,即:len==free;
- 如果扩展之后,SDS字符数组的长度大于1M,那么备用空间的大小就设置成1M。 那么这样的话,当要append时,直接使用备用空间即可,无需再次扩容啦,从而减少了内存重分配的次数。SDS将连续增长N次字符串所需的内存重分配次数从『必定N次』减少到了『最多N次』。
- 惰性空间释放 当需要缩短字符串时,SDS不会立即释放多于的内存空间,而是将其保留,修改free值。这样的话,当下次需要扩容时,直接使用这部分内存空间即可,减少了内存重分配的次数。
3.4 二进制安全 binary-safe
3.4.1 什么是『二进制安全』?
所谓『二进制安全』就是:往SDS里面放什么数据,取出来还是什么数据。SDS不会对存储的这些数据做任何修改、限制、过滤等。
3.4.2 SDS如何保证二进制安全?
C字符串对存入的字符串是有严格要求的: 1. 必须符合某种编码(如ASKII) 2. 不能含有空格
而SDS对于存储的数据没有任何限制,因此称为『二进制安全』。
3.5 兼容C字符串
C字符串要求字符数组的末尾必须是 ,作为字符串尾的标记。而SDS中的字符数组也遵循了这一规范,所以仍然可以使用C字符串相关函数,因此避免了重复代码。
- SpringMVC处理multipart请求.
- 一条简单的sql语句运行15天的原因分析(r5笔记第17天)
- 巧用flashback database实现灵活的数据回滚(r5笔记第16天)
- Spring Cache For Redis.
- css重写checkbox样式
- 通过shell脚本同时监控多个数据库负载(r5笔记第14天)
- Java 定时器 Timer 的使用.
- 通过shell脚本来统计段大小(r5笔记第14天)
- Linux下配置MySQL主从复制(r5笔记第13天)
- Final 关键字
- ArrayList 和 LinkedList的执行效率比较
- 关于consistent gets(r5笔记第12天)
- wait/notify 实现多线程交叉备份
- 01.SVN介绍与安装
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 使用ES6的fetch API读取数据时要注意的一个和cookie相关的坑
- 跟牛老师一起学WEBGIS——WEBGIS基础(地图切片)
- Go语言 | 并发设计中的同步锁与waitgroup用法
- LeetCode 99 | 如何不用递归遍历二叉搜索树?MT方法给你答案
- 以攻击者角度学习某风控设备指纹产品
- 高并发系统三大利器之缓存
- 前端测试题:(解析)js中关于类(class)的继承的说法,下面错误的是?
- 程序员深夜惨遭老婆鄙视,原因竟是CAS原理太简单?| 每一张图都力求精美
- MySQL数据延迟跳动的问题分析
- Python GUI项目实战(八)修改密码功能的实现
- Prometheus监控神器-Alertmanager篇(3)
- Prometheus监控神器-Alertmanager篇(4)
- 71-STM32+ESP8266+AIR202基本控制篇-移植使用-移植微信小程序MQTT底层包到自己的工程项目
- 目标检测 | Anchor free之CornerNet网络深度解析
- 手把手教你 3 分钟搞定个人网站 http 免费升级到 https