【C++】攻克哈希表(unordered_map)
与hash_map纠缠的日子
hash_map可以说是我一直欲求不得的宝了,第一次接触我就想拿下它,奈何,网上这种的:《手把手教你实现hash_map》,zzz,还手把手呢,自制hash_map,我们自己不会?我要的是使用教程啊。。
后来千方百计弄到一套函数,以为至于能一窥堂奥了,结果一测试,VS报错说hash_map,安检过不了,于是我又在网上找了,说去改配置文件,结果改完之后根本没办法写回系统。。
然后我想起来之前在Linux下有见过老师用,代码还在呢,便急匆匆去Linux下测试,还是那个错,说过不了安检。唉。。
好在编译器还给我指了条明路:unordered_map。这不,我就来了。
然后,这篇文章顺序有点凌乱,哈哈哈,要哪一部分自行目录导航吧
unordered_map测试代码
先来看看内存测试代码,Linux环境。
如果硬件不好,N就别开那么大了,稍微小点死不了
/**
比较map、hash_map和unordered_map的执行效率以及内存占用情况
**/
#include <sys/types.h>
#include <unistd.h>
#include <sys/time.h>
#include <iostream>
#include <fstream>
#include <string>
#include <map>
//#include <ext/hash_map>
#include <tr1/unordered_map>
using namespace std;
//using namespace __gnu_cxx;
using namespace std::tr1;
#define N 100000000 //分别测试N=100,000、N=1,000,000、N=10,000,000以及N=100,000,000
//分别定义MapKey=map<int,int>、hash_map<int,int>、unordered_map<int,int>
//typedef map<int,int> MapKey; //采用map
//typedef hash_map<int,int> MapKey; //采用hash_map
typedef unordered_map<int,int> MapKey; //采用unordered_map
int GetPidMem(pid_t pid,string& memsize)
{
char filename[1024];
snprintf(filename,sizeof(filename),"/proc/%d/status",pid);
ifstream fin;
fin.open(filename,ios::in);
if (! fin.is_open())
{
cout<<"open "<<filename<<" error!"<<endl;
return (-1);
}
char buf[1024];
char size[100];
char unit[100];
while(fin.getline(buf,sizeof(buf)-1))
{
if (0 != strncmp(buf,"VmRSS:",6))
continue;
sscanf(buf+6,"%s%s",size,unit);
memsize = string(size)+string(unit);
}
fin.close();
return 0;
}
int main(int argc, char *argv[])
{
struct timeval begin;
struct timeval end;
MapKey MyMap;
gettimeofday(&begin,NULL);
for(int i=0;i<N;++i)
MyMap.insert(make_pair(i,i));
gettimeofday(&end,NULL);
cout<<"insert N="<<N<<",cost="<<end.tv_sec-begin.tv_sec + float(end.tv_usec-begin.tv_usec)/1000000<<" sec"<<endl;
for(int i=0;i<N;++i)
MyMap.find(i);
gettimeofday(&end,NULL);
cout<<"insert and getall N="<<N<<",cost="<<end.tv_sec-begin.tv_sec + float(end.tv_usec-begin.tv_usec)/1000000<<" sec"<<endl;
string memsize;
GetPidMem(getpid(),memsize);
cout<<memsize<<endl;
return 0;
}
unordered_map与map的区别
boost::unordered_map, 它与 stl::map的区别就是,stl::map是按照operator<比较判断元素是否相同,以及比较元素的大小,然后选择合适的位置插入到树中。所以,如果对map进行遍历(中序遍历)的话,输出的结果是有序的。顺序就是按照operator< 定义的大小排序。 而boost::unordered_map是计算元素的Hash值,根据Hash值判断元素是否相同。所以,对unordered_map进行遍历,结果是无序的。 用法的区别就是,stl::map 的key需要定义operator< 。 而boost::unordered_map需要定义hash_value函数并且重载operator==。对于内置类型,如string,这些都不用操心。对于自定义的类型做key,就需要自己重载operator< 或者hash_value()了。 最后,说,当不需要结果排好序时,最好用unordered_map。 其实,stl::map对于与java中的TreeMap,而boost::unordered_map对应于java中的HashMap。
hash_map ≈ unordered_map
最初的 C++ 标准库中没有类似 hash_map 的实现,但不同实现者自己提供了非标准的 hash_map。 因为这些实现不是遵循标准编写的,所以它们在功能和性能保证方面都有细微差别。
从 C++ 11 开始,hash_map 实现已被添加到标准库中。但为了防止与已开发的代码存在冲突,决定使用替代名称 unordered_map。这个名字其实更具描述性,因为它暗示了该类元素的无序性。
unordered_map 使用
#include <unordered_map>
//取得键和值:
unordered_map<Key,T>::iterator it;
it->first; // same as (*it).first (the key value)
it->second; // same as (*it).second (the mapped value)
成员函数:
=迭代器== begin | 返回指向容器起始位置的迭代器(iterator) end | 返回指向容器末尾位置的迭代器 cbegin | 返回指向容器起始位置的常迭代器(const_iterator) cend | 返回指向容器末尾位置的常迭代器
=Capacity= size 返回有效元素个数 max_size 返回 unordered_map 支持的最大元素个数 empty 判断是否为空
=元素访问= operator[] 访问元素 at 访问元素(如 m.at(5) = 3.33)
=元素修改= insert 插入元素 erase 删除元素 swap 交换内容 clear 清空内容 emplace 构造及插入一个元素 emplace_hint 按提示构造及插入一个元素
=操作= find 通过给定主键查找元素 count 返回匹配给定主键的元素的个数 equal_range 返回值匹配给定搜索值的元素组成的范围
=Buckets== bucket_count 返回槽(Bucket)数 max_bucket_count 返回最大槽数 bucket_size 返回槽大小 bucket 返回元素所在槽的序号 load_factor 返回载入因子,即一个元素槽(Bucket)的最大元素数 max_load_factor 返回或设置最大载入因子 rehash 设置槽数 reserve 请求改变容器容量
- History API与浏览器历史堆栈管理
- node中创建服务进程
- 数据挖掘工程师:如何通过百度地图API抓取建筑物周边位置、房价信息
- crontab导致CPU异常的问题分析及处理(r3笔记第100天)
- 短信接口被恶意调用(二)肉搏战-阻止恶意请求
- 关于首屏时间采集自动化的解决方案
- javax.net.ssl.SSLHandshakeException: No appropriate protocol (protocol is disabled or cipher suites
- 一次数据库无法登陆的问题及排查 (r3笔记第99天)
- 用深度学习keras的cnn做图像识别分类,准确率达97%
- 短信发送接口被恶意访问的网络攻击事件(三)定位恶意IP的日志分析脚本
- job处理缓慢的性能问题排查与分析(r4笔记第18天)
- 京东商品评论情感分析:数据采集与词向量构造方法
- springboot开启access_log日志输出
- 完美的执行计划导致的性能问题(r4笔记第17天)
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 七日Python之路--第九天(blog与Django)
- Python数据可视化-seaborn Iris鸢尾花数据
- pythonGUI -- pyside安装与初试
- TS 设计模式02 - 建造者模式
- 艺术鬼才!Unicode 字符还能这么玩?
- TS 设计模式03 - 单例模式
- MySQL 案例:Limit 分页查询优化
- 白话Xavier | 神经网络初始化的工程选择
- matplotlib 设置绘图时显示中文
- JavaScript 学习(1)
- Swift 反初始化
- R语言中Gibbs抽样的Bayesian简单线性回归
- Redis的各种数据类型到底能玩出什么花儿?
- Linux磁盘操作
- linux实现shell脚本监控磁盘内存达到阈值时清理catalina.out日志