【C++】攻克哈希表(unordered_map)

与hash_map纠缠的日子

hash_map可以说是我一直欲求不得的宝了，第一次接触我就想拿下它，奈何，网上这种的：《手把手教你实现hash_map》,zzz,还手把手呢，自制hash_map，我们自己不会？我要的是使用教程啊。。

后来千方百计弄到一套函数，以为至于能一窥堂奥了，结果一测试，VS报错说hash_map，安检过不了，于是我又在网上找了，说去改配置文件，结果改完之后根本没办法写回系统。。

然后我想起来之前在Linux下有见过老师用，代码还在呢，便急匆匆去Linux下测试，还是那个错，说过不了安检。唉。。

好在编译器还给我指了条明路：unordered_map。这不，我就来了。

然后，这篇文章顺序有点凌乱，哈哈哈，要哪一部分自行目录导航吧

unordered_map测试代码

先来看看内存测试代码，Linux环境。

如果硬件不好，N就别开那么大了，稍微小点死不了

/**
比较map、hash_map和unordered_map的执行效率以及内存占用情况
**/
 
#include <sys/types.h>
#include <unistd.h>
#include <sys/time.h>	
#include <iostream>
#include <fstream>
#include <string>
#include <map>
//#include <ext/hash_map>
#include <tr1/unordered_map>
 
using namespace std;
//using namespace __gnu_cxx;
using namespace std::tr1;
 
#define N 100000000  //分别测试N=100,000、N=1,000,000、N=10,000,000以及N=100,000,000
 
//分别定义MapKey=map<int,int>、hash_map<int,int>、unordered_map<int,int>
//typedef map<int,int> MapKey;          //采用map
//typedef hash_map<int,int> MapKey;     //采用hash_map
typedef unordered_map<int,int> MapKey;  //采用unordered_map
 
int GetPidMem(pid_t pid,string& memsize)
{
	char filename[1024];
	
	snprintf(filename,sizeof(filename),"/proc/%d/status",pid);
	
	ifstream fin;
	
	fin.open(filename,ios::in);
	if (! fin.is_open())
	{
		cout<<"open "<<filename<<" error!"<<endl;
		return (-1);
	}
	
	char buf[1024];
	char size[100];
	char unit[100];
	
	while(fin.getline(buf,sizeof(buf)-1))
	{
		if (0 != strncmp(buf,"VmRSS:",6))
			continue;
		
		sscanf(buf+6,"%s%s",size,unit);
		
		memsize = string(size)+string(unit);
	}
	
	fin.close();
	
	return 0;
}
 
int main(int argc, char *argv[])
{
	struct timeval begin;
	
	struct timeval end;
		
	MapKey MyMap;
	
	gettimeofday(&begin,NULL);
	
	for(int i=0;i<N;++i)
		MyMap.insert(make_pair(i,i));
	
	gettimeofday(&end,NULL);
	
	cout<<"insert N="<<N<<",cost="<<end.tv_sec-begin.tv_sec + float(end.tv_usec-begin.tv_usec)/1000000<<" sec"<<endl;
	
	for(int i=0;i<N;++i)
		MyMap.find(i);
 
	gettimeofday(&end,NULL);
	
	cout<<"insert and getall N="<<N<<",cost="<<end.tv_sec-begin.tv_sec + float(end.tv_usec-begin.tv_usec)/1000000<<" sec"<<endl;
	
	string memsize;
	
	GetPidMem(getpid(),memsize);
	
	cout<<memsize<<endl;
	
	return 0;
}

unordered_map与map的区别

boost::unordered_map，它与 stl::map的区别就是，stl::map是按照operator<比较判断元素是否相同，以及比较元素的大小，然后选择合适的位置插入到树中。所以，如果对map进行遍历（中序遍历）的话，输出的结果是有序的。顺序就是按照operator< 定义的大小排序。而boost::unordered_map是计算元素的Hash值，根据Hash值判断元素是否相同。所以，对unordered_map进行遍历，结果是无序的。用法的区别就是，stl::map 的key需要定义operator< 。而boost::unordered_map需要定义hash_value函数并且重载operator==。对于内置类型，如string，这些都不用操心。对于自定义的类型做key，就需要自己重载operator< 或者hash_value()了。最后，说，当不需要结果排好序时，最好用unordered_map。其实，stl::map对于与java中的TreeMap，而boost::unordered_map对应于java中的HashMap。

hash_map ≈ unordered_map

最初的 C++ 标准库中没有类似 hash_map 的实现，但不同实现者自己提供了非标准的 hash_map。因为这些实现不是遵循标准编写的，所以它们在功能和性能保证方面都有细微差别。

从 C++ 11 开始，hash_map 实现已被添加到标准库中。但为了防止与已开发的代码存在冲突，决定使用替代名称 unordered_map。这个名字其实更具描述性，因为它暗示了该类元素的无序性。

unordered_map 使用

#include <unordered_map>

//取得键和值：
unordered_map<Key,T>::iterator it;
it->first;               // same as (*it).first   (the key value)
it->second;              // same as (*it).second  (the mapped value)

成员函数：

=迭代器== begin | 返回指向容器起始位置的迭代器（iterator） end | 返回指向容器末尾位置的迭代器 cbegin | 返回指向容器起始位置的常迭代器（const_iterator） cend | 返回指向容器末尾位置的常迭代器

=Capacity= size 返回有效元素个数 max_size 返回 unordered_map 支持的最大元素个数 empty 判断是否为空

=元素访问= operator[] 访问元素 at 访问元素（如 m.at(5) = 3.33）

=元素修改= insert 插入元素 erase 删除元素 swap 交换内容 clear 清空内容 emplace 构造及插入一个元素 emplace_hint 按提示构造及插入一个元素

=操作= find 通过给定主键查找元素 count 返回匹配给定主键的元素的个数 equal_range 返回值匹配给定搜索值的元素组成的范围

=Buckets== bucket_count 返回槽（Bucket）数 max_bucket_count 返回最大槽数 bucket_size 返回槽大小 bucket 返回元素所在槽的序号 load_factor 返回载入因子，即一个元素槽（Bucket）的最大元素数 max_load_factor 返回或设置最大载入因子 rehash 设置槽数 reserve 请求改变容器容量