【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例

时间:2022-06-25
本文章向大家介绍【Rust日报】 2019-05-26:切片索引检查导致的3倍性能下降问题一例,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

漫游 Tox-rs,第一部分

长文预警。Tox 是一个分布式的P2P,加密传输,易于使用的基于DHT的网络。

Tox 原来是个C项目,作者用Rust通过审视发现,实现里面有不少漏洞,易被攻击。所以他用Rust重写了它。就是上面那个项目地址。现在作者,开始整理这几年的工作,开始生成文档。

Read More

切片索引检查导致的3倍性能下降问题一例

作者发现下面这两片代码:

pub fn insertion_sort(data: &mut [i32]) {
    for sorted in 0..data.len() {
        let min = (sorted..data.len()).min_by_key(|&i| &data[i]).unwrap();
        data.swap(sorted, min);
    }
}

pub fn insertion_sort_fast(data: &mut [i32]) {
    unsafe {
        for sorted in 0..data.len() {
            let min = (sorted..data.len())
                .min_by_key(|&i| data.get_unchecked(i))
                .unwrap();
            std::ptr::swap(data.get_unchecked_mut(sorted), data.get_unchecked_mut(min));
        }
    }
}

性能有3倍左右的差距

insertions sort          time:   [551.79 us 553.24 us 555.71 us]                               
insertions sort (fast)   time:   [187.75 us 188.15 us 188.84 us]

很奇怪。于是很多人给他建议。

换种写法,跟unsafe差不多快。

pub fn insertion_sort(data: &mut [i32]) {
    for sorted in 0..data.len() {
        let min = data
            .iter()
            .enumerate().skip(sorted)
            .min_by_key(|(i, e)| *e)
            .unwrap()
            .0;
        data.swap(sorted, min);
    }
}

打开 -C opt-level=z 编译标志,按下面方式写:

pub fn insertion_sort_fast(data: &mut [i32]) {
    let mut data = data;
    while data.len() > 1 {
        let (head, tail) = data.split_first_mut().unwrap();
        let tailmin = tail.iter_mut().min().unwrap();
        if head > tailmin {
            std::mem::swap(head, tailmin);
        }
        data = tail;
    }
}

还有一种写法:

pub fn insertion_sort_iter(data: &mut [i32]) {
    for sorted in 0..data.len() {
        let min = data[sorted..].iter().enumerate().min_by_key(|&(_, e)| e).unwrap().0;
        data.swap(sorted, min + sorted);
    }
}

insertions sort (fast) time:  [187.05 us 187.37 us 187.84 us]
insertions sort (iter) time:  [186.87 us 187.30 us 188.00 us]

跟 unsafe 差不多。

Read More

ccl - 据说是目前为止性能最高的并发哈希库

ccl 目前包含一个并发hashmap和一个并发时限缓存,初步的评测很强力。

20k inserts + 20k mut lookups with replace 16C/32T Xeon 2.1Ghz Hetzner CXX51

hashbrown_rwlock        time:   [64.199 ms 64.234 ms 64.266 ms]                              

chashmap                time:   [15.190 ms 15.220 ms 15.251 ms]                      

dhashmap_ccl            time:   [1.0199 ms 1.0244 ms 1.0303 ms]     

concache                time:   [126.15 ms 126.61 ms 127.03 ms]   

crossbeam-skiplist      time:   [10.648 ms 10.681 ms 10.713 ms]       

Read More Repo

terminal-typeracer - 终端下的打字竞速游戏

什么,现在还有人喜欢打字比赛?确实有,这不,作者就做了一个打字竞速游戏。看看界面先:

代码在这里

Repo

calcify - 3D/4D 矩阵代数库

用于物理模拟。