封装哈希表

本文旨在讲解哈希表的封装,我们以哈希桶的结构来进行封装unorderedmap/set。要想实现封装哈希表,我们首先得先将哈希表的结构给搭建出来,然后再根据哈希桶的结构进一步封装unorderedmap/set!

下面我们先来实现哈希桶的结构,哈希桶的结构其实就是相同映射值的在一个桶内,然后把相同的桶内的元素通过指针链接起来即可,所以我们要先实现哈希表中的结点的结构体!因为其节点类似于链表的结构,所以里面存放的是节点的指针,以及该节点存储的值!

因为我们是用自己的方式来实现哈希表并进一步封装unorderedmap/set,所以我们得用自己的命名空间来包装!下面来看一下该哈希表结点的结构实现!步骤分为两大步:1.实现哈希表。

2.利用已有的哈希表来进行封装!

一、实现哈希表!

对于哈希表么,我们首先也得实现哈希表中的结构的结构体!上面已经讲过,该结构体类型类似于一种链表,所以我们现在就开始实现一下哈希表结点的结构体!

1.哈希表结点的结构

构造函数也是同样的,直接进行值的构造即可!

采用模版,首先一开始都将存储的元素即为pair类型,最后进行封装的时候再进行修改即可!


当哈希表的结点的结构体搭建出来的时候,我们就可以搭建我们得哈希表整体的结构了,对于哈希表而言,我们需要的成员是以哈希结点指针为元素的向量vector,以及有效元素的个数!

下面来看一下哈希表中的成员!

2.哈希表中的成员变量

都是基于模版给出的,可以适用于多种类型!

当表中的成员写完之后,我们首先要都该类进行构造函数和析构函数的编写!

3.构造函数

构造函数,就是完成初始化的动作,我们只需要对我们的vector向量开辟一段空间即可完成构造函数!

4.析构函数

因为成员变量中自定义的指针类型,所以系统默认的析构函数不能完成析构,需要我们手动释放,自己来实现析构函数!实现析构函数,只需要将表中存在的结点释放,然后置空即可!

对于析构函数,我们只需要遍历表,然后将表中存在的元素进行delete掉即可!然后一个桶内的元素清空之后,然后将表进行赋空即可!下面来看一下析构函数的实现!


构造函数以及析构函数实现之后,那么我们就开始实现一些相关操作的函数!

增删查这几个常见的函数!

5.Insert函数

对与Insert函数,我们首先需要关注的是是否需要扩容!当需要扩容的话,我们无需在新建节点了,只需要将结点的指针进行修改即可!我们需要定义一个新的vector,然后用于存储旧表中的元素!我们可以采用头插法来进行对新表的插入,最后将旧表中所有的元素插入完成之后,将旧表置空,然后交换新旧表即可!!因为新表的创建是在局部内,且在栈上进行创建的,所以不用担心有内存泄漏的问题!

下面来看一下Insert函数的实现!


实现了Insert函数之后,我们可以继续实现Find函数,如果找到Find的值时,返回该节点的指针即可,否则返回nullptr;我们要做的是首先要求出对应的映射值,然后在桶内进行遍历,若桶内存在与key值相同的元素,返回该节点的指针即可!下面我们来实现一下Find函数!

6.Find函数


实现了Find函数之后,我们再来实现Erase函数,需要注意的是,我们实现Erase函数的时候,不能复用Find函数来找到该节点,因为要删除一个节点的时候,我们需要其前驱节点以及后继节点才能正确删除,断开联系!需要注意的是,如果找到了要删除的节点,我们需要判断一下是否为头删,头删与中间节点的删除是不一样的!下面来看一下Erase函数的实现!

7.Erase函数!


HashFun的引进及实现!(用于将一个类型转化为整形!)

实现了上述函数之后,我们的哈希表基本大致实现!但是当我们插入字符类型的时候我们就会发现问题所在,因为字符类型无法自动转化为整形!这时就引进了仿函数HashFun,此时我们可以利用HashFun来将各种类型转化为整形!下面我们就来介绍一下如何实现HashFun,对于整形/浮点型等等我们直接进行强转成size_t即可,因为平常我们使用string的类型较多,所以我们对于string类型直接进行模版的特化,专门针对string类型写一个HashFun;HashFun的实现也是基于模版!下面来看一下HashFun的实现!

因为我们后期要一直使用这个仿函数,我们直接将其定义成全局即可!当引进了仿函数时,我们就需要对我们之前的代码进行修改,凡是设计到求余的操作,都要用到这个函数,将key转化为size_t类型!

所以我们直接在Hashtable该类中再加一个模版参数Hash 给他一个缺省参数!修改如下:

 再给一个缺省参数即可完成!下面我们还要声明一个这样的函数hf,下面代码凡是设计到求余的操作都要用到这个函数!那么我们就对Insert来进行改造!

其他函数凡是涉及取余都是同样的,这里不再修改其他了,就是将取余套一层hf函数即可;


二、unorderedmap/set封装

至此,我们的哈希桶结构已经完成,那么下一步就开始封装我们自己unorderdmap/set,对于我们自己的unorderedmap/set而言,我们只需要添加自己的命名空间,然后就可以与库中的unorderedmap/set进行区分!

因为基于泛型编程,我们对unorderedmap/set的封装总不能写两份代码的,所以我们要实现一种格式,让二者都能使用我们得哈希桶这个结构来进行对unorderedmap/set的封装。所以我们首先要进行修改的就是我们桶中的数据类型,我们只需要桶中的数据类型进行一种改变,即可使unorderedmap/set都能调用代码,同红黑树的封装一样,我们只需要将红黑树中的第二个模版参数当成数据节点的类型即可!下面是哈希桶中数据节点的类型的改变!以及哈希桶的模版参数的变化!

当我们使用map时,T就是一个pair的类型,当我们使用set的时候,T就是一个K的类型!那么我们应该如何求出我们T的类型,就再次引进了一个仿函数KeyofT。下面来看一下MapkofT/SetkofT的实现!

KeyofT的仿函数实现之后,我们的unorderedmap/set就可以使用一份代码来进行封装了,只不过我们需要在取K的时候套一层KeyofT函数即可!至此我们再将哈希表中的Insert...等函数封装到我们的unorderedmap/set即可完成这些函数的调用!

下面看一下我们的unorderd_map/set的实现。

1.Unorderd_Map

2.Unorderd_Set


至此,我们封装的UnorderedMap/Set也能正常使用!

三、迭代器的封装

下面我们再继续封装我们的迭代器!对于迭代器我们还是像以前那样用节点的指针来构造迭代器,但是当我们重载operator++的时候,我们发现仅仅有节点的指针是不行的,还需要有哈希表中的table向量,以及当前位置的映射值,这里我使用哈希表来给大家讲解一些关于类之间相互依赖的问题!所以我们的迭代器的构造就有节点的指针,哈希表,以及哈希映射值这三者组成! 

下面来看一下迭代器实现!

1.迭代器内的成员变量

 

2.迭代器的构造函数

需要注意的是:当我们对迭代器进行构造时,我们需要用到哈希表,而哈希表也需要用到我们的迭代器,这就造成了相互依赖的过程,这时我们只需要加一个前置声明即可解决我们的问题!即:在迭代器的前面加上对类模版哈希类的声明!需要注意的是:对类模版的前置声明时,也需要加上模版参数!代码如下:

 

3.重载operator++

迭代器既然已经实现了,那么我们就可以来重载operator++操作!在哈希表中++的操作,首先判断当前桶内是否还有下一节点,如果当前桶内没有节点,继续向下找其他桶,直到找到最后返回空即可!代码如下:

4.重载operator->

重载operator->即返回_node当前节点指向的值的地址!代码如下:

5.重载operator*

重载operator*即返回_node当前节点指向的值!

 

6.重载operator!=

下面我们再对表内进行迭代器的封装!

四、哈希表内对迭代器的封装!

我们只需要将迭代器在表内进行重定义即可!然后实现begin()和end()函数即可!代码如下:

需要注意的是:对内嵌类型进行typedef时,需要加上typename用于表示是一中类型!

 1.begin()函数的实现!

 2.end()函数的实现!


注意:因为迭代器中要访问到我们表中的私有成员变量,所以我们要进行友元类的声明!!对于模版友元的声明,我们需要将模版参数也加上去,才能正确进行声明!

此时,普通迭代器已经大致完成,要想实现在我们的unorderedmap/set内实现迭代器,只要再次进行封装即可!

3.Unordered_set对迭代器的封装!

再加上begin,end函数的实现,就可以完成范围for的使用了!

4.Unordered_Map对迭代器的封装!

Unordered_Map中的begin和end与上面Unordered_Set的同理!!


至此我们的迭代器也实现完成,那么我们发现当我们对值进行修改的时候,我们的值还能进行修改,但库中的却不能进行修改,所以我们应该再添加一个const迭代器,来进一步对我们的迭代器进行完善!


五、const迭代器的实现!

下面我们来实现一下const迭代器!

对于const迭代器,我们需要再次引进两个变量Ref,Ptr才能完成const迭代器的实现!

下面来看一下const迭代器的声明!!

然后将begin函数和const函数都添加一个const版本! 

1.Unordered_Set中的const迭代器!

然后再对set/map中进行封装即可!对于set而言我们只需将set中的普通迭代器和const迭代器都声明为const迭代器即可! 

但是对于set而言当我们仅仅将迭代器全部声明为const时,并不能解决问题,因为我们的this类型是const的类型,而在迭代器的构造中表是普通类型,当const变量给非const变量赋值时,就会导致权限的放大!那么我们只需要将迭代器的构造再写一个const版本试试!

此时构成了重载,但是当再次对旧表进行构造时,因为旧表也是普通对象,此时我们的表是const对象,所以也会导致权限的放大!那么我们再将表进行const声明即可! 这样就解决了set中key值能修改的问题!

2. Unordered_Map中的const迭代器!

对于Map类型,我们只需要对pair中的first不能修改,而second依旧不能修改!我们只需要对pair的first加上const修饰即可!

      

至此,我们的const迭代器也实现完成! 


下面我们就来实现一下operator[]函数!

六、operator[]函数的实现

对于实现operator函数我们的Insert/Find函数的返回值类型也要进行修改!

我们将Insert的返回值类型设置为pair<iterator,bool>类型,这时当我们在UnorderedSet中进行封装时,就会发现问题,迭代器转化的问题!对于红黑树那里,我们只需要将迭代器转化为Node*即可!但是对我们的哈希表中,迭代器有三部分组成,所以不能进行转化!那么我们只好用一个ret类型进行调用Insert的值,然后将ret对迭代器进行构造即可解决问题!

这里是因为我们知道迭代器的底层是什么,所以我们可以进行对pair的构造!! 

 下面就可以实现operato[],然后就可以实现统计次数!

 

至此UnorderedMap/Set已经实现!在进行封装的时候,一定要一步一步的来,不要想着一口气将所有的代码实现!否则很难完美的封装!

下面我把源代码发到下面,供大家参考!看完本文希望各位佬留下免费的关注和小心心!

        七、源码

1.Hashtable的实现!

#pragma once
//哈希表的实现!
//首先将结点的类型用结构体表示出来!
//然后哈希表主要是有这些结点的类型的向量vector/以及有效元素的个数组成!
#include<string>
#include<vector>
#include<iostream>
using namespace std;

//区别于库中的哈希用自己的命名空间来进行实现1


template<class K>
struct HashFun
{
	//仿函数的实现本质上就是对operator的重载 !
	size_t operator()(const K& key)
	{
		return size_t(key);
	}
};

//专门针对于string的一个模版特化!
template<>
struct HashFun<string>
{

	size_t operator()(const string& str)
	{
		size_t ret = 0;
		for (auto &ch:str)
		{
			ret *= 31;  //这时基于一种算法来实现的!×什么数都可以,就是为了减少冲突!
			ret += ch;
		}
		return ret;
	}
};
namespace Hashbucket
{

	//类似于链表结构  节点内存储值以及下一个节点的指针1
	//泛型编程,将节点的类型设置为一个T即可!
	template<class T>
	struct  Hashdata
	{

		T _data;
		Hashdata* _next;
		//构造函数!
		Hashdata(const T& data)
			:_data(data)
			,_next(nullptr)
		{

		}
	};

	template<class K, class T, class KeyofT, class Hash = HashFun<K> >
	class Hashtable;
	//迭代器的构造!因为要使用到节点,所以放在节点的结构体下面进行声明!
	template<class K, class T,class Ref,class Ptr, class KeyofT, class Hash=HashFun<K>>
	struct __Iterator
	{
		typedef Hashdata<T> Node;
		typedef __Iterator<K, T, Ref,Ptr,KeyofT> Self;

		
		//迭代器的实现需要节点的指针,哈希表,以及哈希映射值,所以要声明这三个成员!
		size_t _hashi;
		Node* _node;
		const Hashtable<K, T, KeyofT>* _pht;
		
		//构造函数
		__Iterator(Node* node, Hashtable<K, T, KeyofT>* pht, size_t hashi)
			:_hashi(hashi)
			,_pht(pht)
			,_node(node)
		{
		}

		__Iterator(Node* node, const Hashtable<K, T, KeyofT>* pht, size_t hashi)
			:_hashi(hashi)
			, _pht(pht)
			, _node(node)
		{
		}
		Self& operator++()
		{
			//当前桶存在下一个节点!
			if (_node->_next)
			{
				_node = _node->_next;
				return *this;
			}
			//当前桶后面没有节点了
			else
			{
				//寻找其他桶,找到不为空的桶返回即可!
				++_hashi;
				while (_hashi < _pht->_table.size())
				{
					Node* cur = _pht->_table[_hashi];
					if (cur)
					{
						_node = cur;
						break;
					}
					++_hashi;
				}
				//最后判断_hashi的值,如果与表的大小一样,说明结束了!
				if (_hashi == _pht->_table.size())
				{
					_node = nullptr;
				}
			}
			return *this;

		}
		Ptr operator->()
		//返回当前节点对应的值的地址!
		{
			return &_node->_data;
		}

		//重载operator!=
		bool operator!=(const Self&s)
		{
			return _node != s._node;
		}

		Ref operator*()
		//返回当前节点对应的值
		{
			return _node->_data;
		}
	};

	//搭建哈希表的框架!
	template<class K,class T,class KeyofT,class Hash>
	class Hashtable
	{
	public:

		template<class K, class T,class Ref,class Ptr, class KeyofT, class Hash >
		friend struct __Iterator;

		typedef Hashdata<T> Node;
		typedef typename __Iterator<K, T,T&,T* ,KeyofT> iterator;
		typedef typename __Iterator<K, T,const T&,const T*, KeyofT> const_iterator;

		iterator begin()
		{
			//从头遍历表,一旦发现有元素返回迭代器!
			for (size_t i = 0; i < _table.size(); i++)
			{
				Node* cur = _table[i];
				if (cur)
				{
					return iterator(cur, this, i);
				}
			}
			return end();
		}

		iterator end()
		{
			//迭代器的最后 用空指针,哈希值用-1表示!
			return iterator(nullptr, this, -1); 
		}
		const_iterator begin()const
		{
			//从头遍历表,一旦发现有元素返回迭代器!
			for (size_t i = 0; i < _table.size(); i++)
			{
				Node* cur = _table[i];
				if (cur)
				{
					return const_iterator(cur, this, i);
				}
			}
			return end();
		}

		const_iterator end()const 
		{
			//迭代器的最后 用空指针,哈希值用-1表示!
			return const_iterator(nullptr, this, -1);
		}
		Hash hf;
		KeyofT kot;
		//构造函数!
		Hashtable()
		{
			//对向量进行开辟一定的空间即可!
			_table.resize(10);
		}

		//析构函数!
		~Hashtable()
		{
			for (size_t i = 0; i < _table.size(); i++)
			{
				Node* cur = _table[i];
				{
					
					while (cur)
					{
						Node* next = cur->_next;
						delete cur;
						cur = next;
					}
				}
				_table[i] = nullptr;
			}
		}

		pair<iterator,bool > Insert(const T& data)
		{
			iterator it = Find(kot(data));
			if (it != end())
			{
				return make_pair(it, false);
			}
			if (_n == _table.size())
			{
				//需要进行扩容!
				vector<Node*> newtable;
				size_t newsize = _table.size() * 2;   //默认每次扩容2倍!

				//开始遍历旧表,当旧表中存在元素的时候,对新表进行头插即可!
				//这里的头插只需要改变指针的指向,无需真正新建节点!

				for (size_t i = 0; i < _table.size(); i++)
				{
					Node* cur = _table[i];
					size_t hashi = hf(kot(data)) % _table.size();  //求出哈希映射值!
					while (cur)
					{
						Node* next = cur->_next;  //提前记录下一个节点!因为下面需要修改cur->_next!
					
						//对新表进行头插!
						cur->_next = newtable[hashi];
						newtable[hashi] = cur;
						cur = next;
					}
					//将旧表中的桶置为空!!
					_table[hashi] = nullptr;

				}
				//最后交换两个向量即可!
				_table.swap(newtable);
			}
			else
			{
				//无需扩容  直接进行头插即可!
				//先求出hashi,即该节点的映射的位置!
				Node* newnode = new Node(data);   //堆中创建一个节点!以kv进行构造!
				size_t hashi = hf(kot(data)) % _table.size();
				//对当前位置进行头插即可!
				newnode->_next = _table[hashi];
				_table[hashi] = newnode;

				//有效元素++;
				++_n;
				return make_pair(iterator(newnode,this,hashi),true);
			}
		}
		iterator Find(const K& key)
		{
			size_t hashi = hf(key) % _table.size();
			Node* cur = _table[hashi];
			while (cur)
			{
				if (key == kot(cur->_data))
				{
					//找到相等的值!直接返回cur即可!
					return iterator(cur,this,hashi);
				}
				cur = cur->_next;
			}
			return iterator(nullptr,this,-1);
		}

		bool Erase(const K& key)
		{
			size_t hashi = hf(key) % _table.size();
			Node* pre = nullptr;
			Node* cur = _table[hashi];
			while (cur)
			{
				if (cur->_kv.first == key)
				{
					//找到要删除的节点了!
					//分两种情况 头删  正常删除1
					
					if (pre == nullptr)
					{
						//头删!
						_table[hashi] = cur->_next;
					}

					else
					{
						pre->_next = cur->_next;
					}

					delete cur;
					return true;
				}
				pre = cur;
				cur = cur->_next;
			}
			return false;
		}
	private:
		vector<Node*> _table;  //存储结点指针的向量!
		size_t _n=0;  //有效元素的个数!默认给0!
	};

	//void test1()
	//{
	//	Hashtable<int, int> ht;
	//	ht.Insert(make_pair(4, 4));
	//	ht.Insert(make_pair(5, 5));
	//	ht.Insert(make_pair(7, 7));



	//	bool ret= ht.Erase(4);
	//	if (ret == true)
	//	{
	//		cout << "删除成功!";
	//	}
	//	std::cout << ret;

	//	int c = 0;
	//}


	//void test2()
	//{
	//	Hashtable<string, string> ht;
	//	ht.Insert(make_pair("string", "字符"));
	//	ht.Insert(make_pair("left", "左边"));
	//	
	//	int c = 0;
	//}
}

2.UnorderedMap

#pragma once


#include"Hash.h"
namespace Zhj
{
	template<class K, class V, class Hash = HashFun<K>>
	class Unordered_Map
	{
		//创建仿函数
		struct MapkeyofT
		{
			//对于Map而言,K就是返回pair的first即可!
			const K& operator()(const pair<K, V>& kv)
			{
				return kv.first;
			}
		};
	public:
		typedef typename Hashbucket::Hashtable<K, pair< const K, V>, MapkeyofT>::iterator iterator;
		pair<iterator,bool > insert(const pair<K,V>&kv)
		{
			return ht1.Insert(kv);
		}

		bool Erase(const K& key)
		{
			return ht1.Erase(key);
		}

		iterator begin()
		{
			return ht1.begin();
		}

		iterator end()
		{
			return ht1.end();
		}

	/*	const_iterator begin()
		{
			return ht1.begin();
		}

		const_iterator end()
		{
			return ht1.end();
		}*/


		V& operator[](const K& key)
		{
			pair<iterator, bool> ret = ht1.Insert(make_pair(key, V()));
			return ret.first->second;
		}

		const V& operator[](const K& key)const
		{
			pair<iterator, bool> ret = ht1.Insert(make_pair(key, V()));
			return ret.first->second;
		}

		Hashbucket::Hashtable<K, pair<const K,V>, MapkeyofT> ht1;
	
	};

	//void test2()
	//{
	//	Unordered_Map<string, string> m1;
	//	m1.insert(make_pair("string", "字符串"));
	//	m1.insert(make_pair("left", "左边"));

	//	for (auto& ch : m1)
	//	{
	//		ch.first += "x";
	//		ch.second += "x";
	//		cout << ch.first << ":" << ch.second << endl;
	//	}
	//	int c = 0;
	//	
	//}


	void test2()
	{
		string arr[] = { "西瓜", "西瓜","香蕉", "苹果", "苹果", "梨", "梨" };
		Unordered_Map<string, int> count_map;
		for (auto& e : arr)
		{
			count_map[e]++;
		}

		for (auto& kv:count_map)
		{
			cout << kv.first << ":" << kv.second << endl;
		}
		cout << endl;
	}
	
}

3.UnorderedSet

#pragma once
#include"Hash.h"

namespace Zhj
{
	template<class K,class Hash=HashFun<K>>
	class Unordered_Set
	{

		//创建仿函数
		struct SetkeyofT
		{
			//对于Set而言,K就是返回K即可!
			const K& operator()(const K& k)
			{
				return k;
			}
		};

	public:

		
		Hashbucket::Hashtable<K, K, SetkeyofT> ht1;
		typedef typename Hashbucket::Hashtable<K, K, SetkeyofT>::const_iterator iterator;
		typedef typename Hashbucket::Hashtable<K, K, SetkeyofT>::const_iterator const_iterator;
		pair<const_iterator, bool> insert(const K& key)
		{
			auto ret = ht1.Insert(key);
			return pair<const_iterator,bool>(const_iterator(ret.first._node, ret.first._pht, ret.first._hashi),ret.second);
		}
		//iterator begin()
		//{
		//	return ht1.begin();
		//}

		//iterator end()
		//{
		//	return ht1.end();
		//}
		
		const_iterator begin()const
		{
			return ht1.begin();
		}

		const_iterator end()const 
		{
			return ht1.end();
		}
	};

	void test()
	{
		Unordered_Set<int> s;
		s.insert(9);
		s.insert(7);
		s.insert(6);
		s.insert(4);
		for (auto& ch : s)
		{
			//ch += 50;
			cout << ch << " ";

		}
		int c = 0;
		cout << endl;
	}
}

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-03-17 19:04:01       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-03-17 19:04:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-03-17 19:04:01       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-03-17 19:04:01       20 阅读

热门阅读

  1. 算法-KMP匹配

    2024-03-17 19:04:01       18 阅读
  2. 【亲测可行】Mac上clion boost库的安装与使用

    2024-03-17 19:04:01       19 阅读
  3. php反序列化及其常见魔术方法及其触发条件

    2024-03-17 19:04:01       19 阅读
  4. mysql备份

    2024-03-17 19:04:01       18 阅读
  5. logrotate 日志文件管理工具介绍和经典案例

    2024-03-17 19:04:01       21 阅读
  6. 【MySQL】GROUP_CONCAT 运用易错点之建立方程

    2024-03-17 19:04:01       23 阅读
  7. kubeadm部署Kubernetes(k8s) 1.23.0高可用集群

    2024-03-17 19:04:01       22 阅读