跳表原理及C++实现
时间:2022-07-23
本文章向大家介绍跳表原理及C++实现,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
引言
二分查找底层依赖的是数组随机访问的特性,所以只能用数组来实现。如果数据存储在链表中,就真的没法用二分查找算法了吗?实际上,只需要对链表稍加改造,就可以支持类似“二分”的查找算法。改造之后的数据结构叫作跳表。
定义
跳表是一个随机化的数据结构。它允许快速查询一个有序连续元素的数据链表。跳跃列表的平均查找和插入时间复杂度都是O(log n),优于普通队列的O(n)。性能上和红黑树,AVL树不相上下,但跳表的原理非常简单,目前Redis和LevelDB中都有用到。
跳表是一种可以替代平衡树的数据结构。跳表追求的是概率性平衡,而不是严格平衡。因此,跟平衡二叉树相比,跳表的插入和删除操作要简单得多,执行也更快。
C++简单实现
下面实现过程主要是简单实现跳表的过程,不是多线程安全的,LevelDB实现的跳表支持多线程安全,用了std::atomic原子操作,本文主要是为了理解跳表的原理,所以采用最简单的实现。
#ifndef SKIPLIST_H
#define SKIPLIST_H
#include <ctime>
#include <initializer_list>
#include <iostream>
#include <random>
template <typename Key>
class Skiplist {
public:
struct Node {
Node(Key k) : key(k) {}
Key key;
Node* next[1]; // C语言中的柔性数组技巧
};
private:
int maxLevel;
Node* head;
enum { kMaxLevel = 12 };
public:
Skiplist() : maxLevel(1)
{
head = newNode(0, kMaxLevel);
}
Skiplist(std::initializer_list<Key> init) : Skiplist()
{
for (const Key& k : init)
{
insert(k);
}
}
~Skiplist()
{
Node* pNode = head;
Node* delNode;
while (nullptr != pNode)
{
delNode = pNode;
pNode = pNode->next[0];
free(delNode); // 对应malloc
}
}
// 禁止拷贝构造和赋值
Skiplist(const Skiplist&) = delete;
Skiplist& operator=(const Skiplist&) = delete;
Skiplist& operator=(Skiplist&&) = delete;
private:
Node* newNode(const Key& key, int level)
{
/*
* 开辟sizeof(Node) + sizeof(Node*) * (level - 1)大小的空间
* sizeof(Node*) * (level - 1)大小的空间是给Node.next[1]指针数组用的
* 为什么是level-1而不是level,因为sizeof(Node)已包含一个Node*指针的空间
*/
void* node_memory = malloc(sizeof(Node) + sizeof(Node*) * (level - 1));
Node* node = new (node_memory) Node(key);
for (int i = 0; i < level; ++i)
node->next[i] = nullptr;
return node;
}
/*
* 随机函数,范围[1, kMaxLevel],越小概率越大
*/
static int randomLevel()
{
int level = 1;
while (rand() % 2 && level < kMaxLevel)
level++;
return level;
}
public:
Node* find(const Key& key)
{
// 从最高层开始查找,每层查找最后一个小于key的前继节点,不断缩小范围
Node* pNode = head;
for (int i = maxLevel - 1; i >= 0; --i)
{
while (pNode->next[i] != nullptr && pNode->next[i]->key < key)
{
pNode = pNode->next[i];
}
}
// 如果第一层的pNode[0]->key == key,则返回pNode->next[0],即找到key
if (nullptr != pNode->next[0] && pNode->next[0]->key == key)
return pNode->next[0];
return nullptr;
}
void insert(const Key& key)
{
int level = randomLevel();
Node* new_node = newNode(key, level);
Node* prev[kMaxLevel];
Node* pNode = head;
// 从最高层开始查找,每层查找最后一个小于key的前继节点
for (int i = level - 1; i >= 0; --i)
{
while (pNode->next[i] != nullptr && pNode->next[i]->key < key)
{
pNode = pNode->next[i];
}
prev[i] = pNode;
}
// 然后每层将新节点插入到前继节点后面
for (int i = 0; i < level; ++i)
{
new_node->next[i] = prev[i]->next[i];
prev[i]->next[i] = new_node;
}
if (maxLevel < level) // 层数大于最大层数,更新最大层数
maxLevel = level;
}
void erase(const Key& key)
{
Node* prev[maxLevel];
Node* pNode = head;
// 从最高层开始查找,每层查找最后一个小于key的前继节点
for (int i = maxLevel - 1; i >= 0; --i)
{
while (pNode->next[i] != nullptr && pNode->next[i]->key < key)
pNode = pNode->next[i];
prev[i] = pNode;
}
// 如果找到key,
if (pNode->next[0] != nullptr && pNode->next[0]->key == key)
{
Node *delNode = pNode->next[0];
// 从最高层开始,如果当前层的next节点的值等于key,则删除next节点
for (int i = maxLevel - 1; i >= 0; --i)
{
if (prev[i]->next[i] != nullptr && key == prev[i]->next[i]->key)
prev[i]->next[i] = prev[i]->next[i]->next[i];
}
free(delNode); // 最后销毁pNode->next[0]节点
}
// 如果max_level>1且头结点的next指针为空,则该层已无数据,max_level减一
while (maxLevel > 1 && head->next[maxLevel] == nullptr)
{
maxLevel--;
}
}
};
#endif
Redis和LevelDB选用跳表而弃用红黑树的原因
- Skiplist的复杂度和红黑树一样,而且实现起来更简单。
- 在并发环境下Skiplist有另外一个优势,红黑树在插入和删除的时候可能需要做一些rebalance的操作,这样的操作可能会涉及到整个树的其他部分,而skiplist的操作显然更加局部性一些,锁需要盯住的节点更少,因此在这样的情况下性能好一些。
- 企业安全漏洞通告引擎
- 通过httprouter和redis框架搭建restful api服务
- .NET Core 实现定时抓取博客园首页文章信息并发送到邮箱
- 基于 R 语言和 SPSS 的决策树算法介绍及应用
- Android 8.0 中的安全增强功能
- python2 群发 html 或文本邮件
- windows 安装 storm 及 eclipse 调试 TopN 实例
- shell 学习笔记(16)
- 根据ip查找ISP运营商和归属地的几种方法
- windows 安装 spark 及 pycharm 调试 TopN 实例
- storm kafka 编程指南
- 基于Session的身份窃取
- 使用 django-blog-zinnia 搭建个人博客
- 针对提权小神器Sherlock的分析与利用
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- @Component和@Bean以及@Autowired、@Resource
- mybatis generator and 和or条件
- 『.Net反射』ILGenerator.Emit 动态MSIL 编程
- Spring通过XML配置文件以及通过注解形式来AOP 来实现前置,后置,环绕,异常通知
- 切面编程(环绕通知与前后置通知区别)
- Spring在代码中获取bean的几种方式
- Spring 一个接口多个实现类怎么注入
- ASP.NET MVC Controller的激活
- js 逗号表达式
- spring动态调用方法
- Spring AOP动态代理原理与实现方式
- 基于注解多数据源解决方案
- Java并发编程:CountDownLatch、CyclicBarrier和Semaphore
- 你需要实现一个高效的缓存,它允许多个用户读,但只允许一个用户写,以此来保持它的完整性,你会怎样去实现它?
- java阻塞队列得实现