redis源码之set结构

时间:2022-07-26
本文章向大家介绍redis源码之set结构,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

关于set的命令和常用场景我们暂时先不说了,如果对命令不太熟悉的朋友可以用 help @set命令查看,我们先来看set中的一种现象

127.0.0.1:6379> sadd set-1 a b c d e
(integer) 5
127.0.0.1:6379> SMEMBERS set-1
1) "a"
2) "c"
3) "d"
4) "b"
5) "e"

大家都知道set是一种无序的集合,通过SMEMBERS取出所有元素,元素是无序的展示的,这一切很正常,但是我们接着往下看

127.0.0.1:6379> sadd set-2 1 2 3 4 5 6
(integer) 6
127.0.0.1:6379> SMEMBERS set-2
1) "1"
2) "2"
3) "3"
4) "4"
5) "5"
6) "6"

这一次我们给set-2添加的元素全部都是数字,通过SMEMBERS取出所有元素,结果居然是排序过的(如果给set-2再添加任意一个非数字的元素,结果立即会变为无序),但是我们都知道set是一种无序的集合,这是为什么呢?

其实我们可以分别看一下set-1和set-2的类型

127.0.0.1:6379> object encoding set-1
"hashtable"
127.0.0.1:6379> object encoding set-2
"intset"

我们发现set-1是hashtable类型,而set-2是intset类型的

其实对于redis的set类型来说,set是无序的,自动去重的集合数据类型,set数据结构底层实现为一个value为null的字典(dict),当数据可以用整型表示时,set集合将被编码为intset数据结构。两个条件任意满足时set将用hashtable存储数据。1:元素个数大于set-max-iniset-entries(默认为512) 2:元素无法用整型表示 set-max-iniset-entries

其实intset类型的源码也比较简单

typedef struct intset {
    uint32_t encoding;  //编码类型
    uint32_t length;  //元素个数
    int8_t contents[];  //元素存储
} intset;

#define INTSET_ENC_INT16 (sizeof(int16_t))
#define INTSET_ENC_INT32 (sizeof(int32_t))
#define INTSET_ENC_INT64 (sizeof(int64_t))

整型集合是一个有序的,存储整型数据的结构,整型集合在redis中可以保存int16_t,int32_t,int64_t类型的整型数据,并且可以保证集合中不会出现重复数据。

intset的优势主要在于查找方便,毕竟已经排过序,另外是否需要扩容也很好判断,直接看最大的值就可以了