CCJ*_*CCJ 5 c++ hash templates unordered-map hashmap
我最近一直在使用 STL 的 unordered_map ,虽然它似乎工作得很好,但我不太明白散列函数是如何工作的,因为数据类型是作为模板参数给出的。为了更彻底地理解这个数据结构,我用 C++ 实现了我自己的小 Hashmap 类:
哈希表接口:
#ifndef _HASHMAP_H_
#define _HASHMAP_H_
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <iostream>
#include <vector.h>
//Beginning of Hashmap class definition
template <class Key, class Value>
class Hashmap{
private:
int mappedElementCount;
public:
explicit Hashmap();
virtual ~Hashmap();
virtual void test();
virtual int hash(Key*);
int* getSize();
void putKVPair(Key*,Value*);
void clearMap();
//When we use these methods, we'll want a linear vector of keys and values to
//iterate over, so vector is good here
std::vector<Key>* getKeys();
std::vector<Value>* getValues();
}; //end hashmap class definition
#endif /*_HASHMAP_H_*/
Run Code Online (Sandbox Code Playgroud)
哈希图实现:
#include "Hashmap.h"
template<class Key,class Value> Hashmap<Key,Value>::Hashmap(){
mappedElementCount = 0;
}
template<class Key,class Value> Hashmap<Key,Value>::~Hashmap(){
printf("\nDestroying the base Hashmap object!\n");
}
template<class Key,class Value> void Hashmap<Key,Value>::test(){
printf("The size of our Key is %i and the size of our Value is
%i\n",sizeof(Key),sizeof(Value));
}
template<class Key,class Value> int Hashmap<Key,Value>::hash(Key* k_ptr){
unsigned int hashval;
/* we start our hash out at 0 */
hashval = 0;
//TODO: How do we generate a hash signature when we don't know what data type
//we're going to be working with?
return hashval % mappedElementCount;
}
template<class Key,class Value> std::vector<Key>* Hashmap<Key,Value>::getKeys(){
//TODO: prepare a vector initialized with all Key objects and return it here
return keys;
}
template<class Key,class Value> std::vector<Value>* Hashmap<Key,Value>::getValues(){
//TODO: prepare a vector initialized with all Value objects and return it here
return values;
}
template<class Key,class Value> int* Hashmap<Key,Value>::getSize(){
return &mappedElementCount;
}
template<class Key,class Value> void Hashmap<Key,Value>::putKVPair(Key* k, Value* v){
//TODO: implement hashing of the key object k to determine
//the address of the value object v
//first step, generate a hash from our key
int tempHash = hash(k);
//TODO: store the Value at an address given by or influenced by tempHash
//If all was successfully completed, increment the mapped records counter
mappedElementCount++;
}
template<class Key,class Value> void Hashmap<Key,Value>::clearMap(){
//TODO: implement a cascading chain of deallocation of stored objects within the
//hashmap
//MAYBE-- only if we create new objects rather than just mapping reference
//associations,
//which is really the goal here... In the latter case, just empty the Hashmap
//itself
}
Run Code Online (Sandbox Code Playgroud)
解决此问题的一种可能的 OOP 方法是使用 Hashmap 作为基类并提供具有已知 Key 数据类型的派生类,例如以下 Stringmap:
字符串映射接口:
#ifndef _STRINGMAP_H_
#define _STRINGMAP_H_
#include "Hashmap.h"
template <class Value>
class Stringmap:public Hashmap<std::string,Value>{
private:
public:
//Con/de 'structors
explicit Stringmap();
~Stringmap();
//Here we know our Key will be of type std::string
//so we can generate our hash sig by char values
//Override hash from the base class
int hash(std::string*);
//override test from base class
void test();
};
#endif /*_STRINGMAP_H_ def*/
Run Code Online (Sandbox Code Playgroud)
字符串映射实现:
#include "Stringmap.h"
template<class Value> Stringmap<Value>::Stringmap():Hashmap<std::string,Value>(){
}
template<class Value> Stringmap<Value>::~Stringmap(){
printf("\nDestroying the derived stringmap object!\n");
}
template<class Value> void Stringmap<Value>::test(){
printf("The size of our Value is %i\n",sizeof values[0]);
}
template<class Value> int Stringmap<Value>::hash(std::string* str_ptr){
unsigned int hashval;
/* we start our hash out at 0 */
hashval = 0;
/* for each character, we multiply the old hash by 31 and add the current
* character. Remember that shifting a number left is equivalent to
* multiplying it by 2 raised to the number of places shifted. So we
* are in effect multiplying hashval by 32 and then subtracting hashval.
* Why do we do this? Because shifting and subtraction are much more
* efficient operations than multiplication.
*/
for(int i=0;i<str_ptr->length();i++) {
hashval = (*(str_ptr))[i] + ((hashval << 5) - hashval);
}
/* we then return the hash value mod the hashmap size so that it will
* fit into the necessary range
*/
return hashval % (*(Hashmap<std::string,Value>::getSize()));
}
Run Code Online (Sandbox Code Playgroud)
所以问题如下:当要散列的数据类型当前未知时,是否可以创建散列签名?如果是这样,如何?查看 std::hash 文档,似乎 C++ 标准只是为每个原始数据类型以及 T*(对于任何类型 T)定义了一个散列函数......缺少的是如何为给定的散列实现原始数据类型,更重要的是,它是如何为泛型 T* 实现的。我想我可以只调用 hash(Key) 并希望最好,但了解幕后发生的事情会很好。
谢谢,CCJ
std::unorderd_map采用 2 个显式模板参数(Key, 和Value),还有一堆隐藏模板参数,其中 Hash 函数默认为std::hash<Key>。
此 STL 哈希函数std::hash<Key>采用 aKey并返回 a std::size_t。它已经专门用于所有整数类型 和std::string。从这个参考网站
散列模板定义了一个实现散列函数的函数对象。这个函数对象的实例定义了一个 operator() :
- 接受一个 Key 类型的参数。
- 返回一个 size_t 类型的值,表示参数的哈希值。
- 调用时不抛出异常。
- 对于两个相等的参数 k1 和 k2, std::hash()(k1) == std::hash()(k2)。
- 对于不相等的两个不同参数 k1 和 k2, std::hash()(k1) == std::hash()(k2) 的概率应该很小,接近 1.0/std::numeric_limits::max ()。
哈希模板既可复制构造又可破坏。无序关联容器 std::unordered_set、std::unordered_multiset、std::unordered_map、std::unordered_multimap 使用模板 std::hash 的特化作为默认散列函数。
参考以这句话结尾:
** 实际的散列函数取决于实现,不需要满足除上述规定之外的任何其他质量标准。 **
因此,您可以查看系统的实现,但这并不能保证其他系统的实现。
| 归档时间: |
|
| 查看次数: |
6422 次 |
| 最近记录: |