基本框架
在模拟实现vector之前我们应该对vector有个基本的框架,可以通过对源代码的分析与了解,实现自己的vector。
第一步:现有大致的类模板,类中的成员变量
第二步:构造函数、析构函数、赋值运算符重载函数、拷贝构造函数这些默认函数
第三步:关注push_back(),reserve(),insert()等接口函数
模拟实现vector
namespace my_vector
{
template<class T>
class vector
{
public:
typedef T* iterator;
private:
iterator _start;
iterator _finish;
iterator _end_of_storage;
};
}
设置好一个命名空间,类,以及成员变量。
vector()
:_start(nullptr)
,_finish(nullptr)
,_end_of_sorage(nullptr)
{}
设置一个构造函数,可以选择在初始化变量进行初始化成员变量。
~vector()
{
if (_start)
{
delete[] _start;
_start = _finish = _end_of_storage = nullptr;
}
}
设置一个析构函数,注意这里需要对_start进行判空,如果_start为空,则说明_start是是一空指针,则无法进行析构。
size_t size() const
{
return _finish - _start;
}
设置一个size()函数,用来计算vector的数据个数。
size_t capacity() const
{
return _end_of_storage - _start;
}
设置一个capacity()函数,用来计算vector的容量大小。
void reserve(size_t n)
{
if (capacity() < n)
{
size_t sz = size();
T* tmp = new T[n];
if (_start)
{
//memcpy(tmp, _start, sizeof(T) * sz);
for (size_t i = 0; i < sz; ++i)
{
tmp[i] = _start[i];
}
delete[] _start;
}
_start = tmp;
_finish = _start + sz;
_end_of_storage = _start + n;
}
}
设置一个reserve()函数,可以用来提高容量。这里需要注意的是需要提前知道_start与_finish之间的元素个数,以便设置_finish。
void push_back(const T& x)
{
if (_finish == _end_of_storage)
{
size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2);
reserve(newcapacity);
}
*_finish = x;
++_finish;
}
设置一个push_back()函数,可以用来后增数据。
typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator begin() const
{
return _start;
}
const_iterator end() const
{
return _finish;
}
设置迭代器函数,包括begin()和end(),注意需要存在权限的问题。
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
const T& operator[](size_t pos) const
{
assert(pos < size());
return _start[pos];
}
设置一个下标+[ ]函数,用于寻找在某个位置的元素。
iterator insert(iterator pos, const T& x)
{
assert(pos >= _start && pos <= _finish);
if (_finish == _end_of_storage)
{
size_t len = pos - _start;
size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2);
reserve(newcapacity);
pos = _start + len;
}
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
end--;
}
*pos = x;
++_finish;
return pos;
}
设置一个insert()迭代器,用来插入数据。注意,这里在扩容时会出现迭代器失效的问题,需要注意的是,在使用insert()的函数的时候,以后就不能使用形参迭代器,可能会失效。
iterator erase(iterator pos)
{
assert(pos >= _start && pos < _finish);
iterator it = pos + 1;
while(it != _finish)
{
*(it - 1) = *it;
it++;
}
_finish--;
return pos;
}
设置一个erase()函数,用于删除指定位置的元素。
- 迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层本质上就是一个指针,或者是对指针进行了封装。比如:vector的迭代器就是原生态指针T* 。
因此迭代器失效,实际上就是迭代器底层对应指针所指向的空间被销毁了,而此时使用了一块以及被释放了的空间,造成的后果就是程序崩溃(即继续使用已经失效的迭代器,程序可能会崩溃)。
对于vector可能会导致其迭代器失效的操作有:
1.会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resize,reserve,insert,assign,push_back。当vector扩容时,其底层原理旧空间就会被释放掉,而在使用之前的迭代器时,还是使用的之前未释放前的就空间,所以在对旧迭代器操作时,实际操作的是一块已经被释放的空间,而引起代码运行时崩溃。
【解决办法】:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,需要对迭代器重新赋值。
2.指定位置元素的删除操作erase().
erase删除pos位置元素后,pos位置之后的元素会往前移,没有导致底层空间的改变,理论上来讲迭代器是不会失效的。但是,如果pos位置刚好是最后一个元素,删除之后pos刚好是end的位置,而end位置是,没有元素的,那么pos就会失效。因此删除vector中的任意位置上的元素时,vs就会认为该位置迭代器失效。
3.注意:在Linux环境下,gcc编译器对迭代器的检测并不是非常严格,并没有vs下极端。
上述三个例子总结:SGI STL中,迭代器失效后,代码并不一定会崩溃,但是运行结果肯定不对,如果it不在begin和end范围之内,肯定会崩溃的。
4.与vector类似,string在插入+扩容操作+erase之后,迭代器也会失效。
- 迭代器失效的解决办法:在使用前,对迭代器重新赋值。
void pop_back()
{
erase(_finish - 1);
}
设置一个pop_back()函数,用于尾删数据。
void resize(size_t n, const T& val = T())
{
if (n < size())
{
_finish = _start + n;
}
else
{
reserve(n);
while (_finish != _start + n)
{
*_finish = val;
++_finish;
}
}
}
设置一个resize()函数,可以用来添加单一数据并开辟空间。
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_end_of_storage, v._end_of_storage);
}
vector<T>& operator=(vector<T> v)
{
swap(v);
return *this;
}
设置一个赋值运算符重载函数,用于赋值构造。
vector(const vector<T>& v)
{
_start = new T[v.capacity()];
for (size_t i = 0; i < v.size(); ++i)
{
_start[i] = v._start[i];
}
_finish = _start + v.size();
_end_of_storage = _start + v.capacity();
}
设置一个拷贝构造函数。
注意,这里使用for循环,而并没有使用memcpy的原因是:
1.memcpy是内存的二进制格式拷贝,将一段内存空间中的内容原封不动的拷贝到另外一个内存空间里。
2.如果拷贝的是内置类型的元素,memcpy即高效又不会出错,但是如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。
结论:如果对象中涉及到资源管理时,千万不能使用memcpy进行对象之间的拷贝,因为memcpy是浅拷贝,否则可能会引起内存泄漏甚至程序崩溃。
动态二维数组的理解
构造一个vv动态二维数组,vv中总共有n个元素,每个元素都是vector类型的,每行没有包含任何元素,如果n为5时:
vv中元素填充完成之后:
使用标准库中vector构建动态二维数组时与上图实际上是一致的。
vector的代码展示
#pragma once
#include<iostream>
#include<assert.h>
namespace my_vector
{
template<class T>
class vector
{
public:
typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator begin() const
{
return _start;
}
const_iterator end() const
{
return _finish;
}
vector()
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{}
~vector()
{
if (_start)
{
delete[] _start;
_start = _finish = _end_of_storage = nullptr;
}
}
size_t size() const
{
return _finish - _start;
}
size_t capacity() const
{
return _end_of_storage - _start;
}
void push_back(const T& x)
{
if (_finish == _end_of_storage)
{
size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2);
reserve(newcapacity);
}
*_finish = x;
++_finish;
}
iterator insert(iterator pos, const T& x)
{
assert(pos >= _start && pos <= _finish);
if (_finish == _end_of_storage)
{
size_t len = pos - _start;
size_t newcapacity = (capacity() == 0 ? 4 : capacity() * 2);
reserve(newcapacity);
pos = _start + len;
}
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
end--;
}
*pos = x;
++_finish;
return pos;
}
void reserve(size_t n)
{
if (capacity() < n)
{
size_t sz = size();
T* tmp = new T[n];
if (_start)
{
//memcpy(tmp, _start, sizeof(T) * sz);
for (size_t i = 0; i < sz; ++i)
{
tmp[i] = _start[i];
}
delete[] _start;
}
_start = tmp;
_finish = _start + sz;
_end_of_storage = _start + n;
}
}
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
const T& operator[](size_t pos) const
{
assert(pos < size());
return _start[pos];
}
iterator erase(iterator pos)
{
assert(pos >= _start && pos < _finish);
iterator it = pos + 1;
while(it != _finish)
{
*(it - 1) = *it;
it++;
}
_finish--;
return pos;
}
void pop_back()
{
erase(_finish - 1);
}
void resize(size_t n, const T& val = T())
{
if (n < size())
{
_finish = _start + n;
}
else
{
reserve(n);
while (_finish != _start + n)
{
*_finish = val;
++_finish;
}
}
}
vector(const vector<T>& v)
{
_start = new T[v.capacity()];
for (size_t i = 0; i < v.size(); ++i)
{
_start[i] = v._start[i];
}
_finish = _start + v.size();
_end_of_storage = _start + v.capacity();
}
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_end_of_storage, v._end_of_storage);
}
vector<T>& operator=(vector<T> v)
{
swap(v);
return *this;
}
private:
iterator _start;
iterator _finish;
iterator _end_of_storage;
};
}