【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例
时间:2022-06-25
本文章向大家介绍【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
漫游 Tox-rs,第一部分
长文预警。Tox 是一个分布式的P2P,加密传输,易于使用的基于DHT的网络。
Tox 原来是个C项目,作者用Rust通过审视发现,实现里面有不少漏洞,易被攻击。所以他用Rust重写了它。就是上面那个项目地址。现在作者,开始整理这几年的工作,开始生成文档。
Read More
切片索引检查导致的3倍性能下降问题一例
作者发现下面这两片代码:
pub fn insertion_sort(data: &mut [i32]) {
for sorted in 0..data.len() {
let min = (sorted..data.len()).min_by_key(|&i| &data[i]).unwrap();
data.swap(sorted, min);
}
}
pub fn insertion_sort_fast(data: &mut [i32]) {
unsafe {
for sorted in 0..data.len() {
let min = (sorted..data.len())
.min_by_key(|&i| data.get_unchecked(i))
.unwrap();
std::ptr::swap(data.get_unchecked_mut(sorted), data.get_unchecked_mut(min));
}
}
}
性能有3倍左右的差距
insertions sort time: [551.79 us 553.24 us 555.71 us]
insertions sort (fast) time: [187.75 us 188.15 us 188.84 us]
很奇怪。于是很多人给他建议。
换种写法,跟unsafe差不多快。
pub fn insertion_sort(data: &mut [i32]) {
for sorted in 0..data.len() {
let min = data
.iter()
.enumerate().skip(sorted)
.min_by_key(|(i, e)| *e)
.unwrap()
.0;
data.swap(sorted, min);
}
}
打开 -C opt-level=z
编译标志,按下面方式写:
pub fn insertion_sort_fast(data: &mut [i32]) {
let mut data = data;
while data.len() > 1 {
let (head, tail) = data.split_first_mut().unwrap();
let tailmin = tail.iter_mut().min().unwrap();
if head > tailmin {
std::mem::swap(head, tailmin);
}
data = tail;
}
}
还有一种写法:
pub fn insertion_sort_iter(data: &mut [i32]) {
for sorted in 0..data.len() {
let min = data[sorted..].iter().enumerate().min_by_key(|&(_, e)| e).unwrap().0;
data.swap(sorted, min + sorted);
}
}
insertions sort (fast) time: [187.05 us 187.37 us 187.84 us]
insertions sort (iter) time: [186.87 us 187.30 us 188.00 us]
跟 unsafe 差不多。
Read More
ccl - 据说是目前为止性能最高的并发哈希库
ccl 目前包含一个并发hashmap和一个并发时限缓存,初步的评测很强力。
20k inserts + 20k mut lookups with replace 16C/32T Xeon 2.1Ghz Hetzner CXX51
hashbrown_rwlock time: [64.199 ms 64.234 ms 64.266 ms]
chashmap time: [15.190 ms 15.220 ms 15.251 ms]
dhashmap_ccl time: [1.0199 ms 1.0244 ms 1.0303 ms]
concache time: [126.15 ms 126.61 ms 127.03 ms]
crossbeam-skiplist time: [10.648 ms 10.681 ms 10.713 ms]
Read More Repo
terminal-typeracer - 终端下的打字竞速游戏
什么,现在还有人喜欢打字比赛?确实有,这不,作者就做了一个打字竞速游戏。看看界面先:
代码在这里
Repo
calcify - 3D/4D 矩阵代数库
用于物理模拟。
- 【设计模式】—— 策略模式Strategy
- MyBatis魔法堂:即学即用篇
- 【设计模式】—— 状态模式State
- php环境无法上传文件的解决方法
- Java魔法堂:JUnit4使用详解
- Windows魔法堂:解决“由于启动计算机时出现页面文件配置问题.......”
- Java魔法堂:自定义和解析注解
- 【Hibernate那点事儿】—— Hibernate应该了解的知识
- 【Hibernate那点事儿】—— Hibernate应该了解的知识
- Java魔法堂:以Windows服务的形式运行Java程序
- 【Hibernate那点事儿】—— Hibernate知识总结
- java获取网页源代码
- Java魔法堂:注解用法详解——@SuppressWarnings
- 日志那点事儿——slf4j源码剖析
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法