【数据结构(邓俊辉)学习笔记】向量02——动态空间管理

1. 概述

介绍动态空间管理策略

2. 静态空间管理缺点

静态空间管理的空间效率难以保证。
在这里插入图片描述
难题可归纳为:
如何才能保证向量的装填因子既不致于超过1,也不致于太接近于0?

3. 动态空间管理

3.1 扩容

3.1.1 如何实现扩容

另申请一个容量更大的数组,并将原数组中的成员集体搬迁至新的空间,释放原数组占用空间。
在这里插入图片描述

3.1.2 扩容算法

结论:新数组的容量总是取作原数组的两倍

template <typename T> void Vector<T>::expand() { //向量空间不足时扩容
   if ( _size < _capacity ) return; //尚未满员时,不必扩容
   if ( _capacity < DEFAULT_CAPACITY ) _capacity = DEFAULT_CAPACITY; //不低于最小容量
   T* oldElem = _elem;  _elem = new T[_capacity <<= 1]; //容量加倍
   for ( Rank i = 0; i < _size; i++ )
      _elem[i] = oldElem[i]; //复制原向量内容(T为基本类型,或已重载赋值操作符'=')
   /*DSA*/ //printf("\n_ELEM [%x]*%d/%d expanded and shift to [%x]*%d/%d\n", oldElem, _size, _capacity/2, _elem, _size, _capacity);
   delete [] oldElem; //释放原空间
}

为何采用容量加倍策略呢?其他策略是否可行?

3.1.3 容量递增策略 VS 容量倍增策略

分析方法:分摊分析 而不是平均分析,对这两种分析情况不清楚可以看复杂度分析

若采用平均分析,则很可能因为所做的概率分布假定与实际不符,而导致不准确的结论。比如若采用通常的均匀分布假设,认为扩容与不扩容事件的概率各半,则会得出该策略效率极低的错误结论。实际上,只要假定这两类事件出现的概率各为常数,就必然导致这种误判。而实际情况是,采用加倍扩容策略后,在其生命期内随着该数据结构的容量不断增加,扩容事件出现的概率将以几何级数的速度迅速趋近于零。对于此类算法和数据结构,唯有借助分摊分析,方能对其性能做出综合的客观评价。

分析要求:参与分摊的操作必须构成和来自一个真实可行的操作序列,而且该序列还必须足够地长。

以可扩充向量为例,可以考查对该结构的连续n次(查询、插入或删除等)操作,将所有操作中用于内部数组扩容的时间累计起来,然后除以n。只要n足够大,这一平均时间就是用于扩容处理的分摊时间成本。

考查最坏的情况,假设在此后需要连续地进行n次insert()操作。

3.1.3.1 容量倍增策略分摊分析

在这里插入图片描述
几何级数不熟悉的看算法分析
1+2 + 4 + … + 2 ∣ l o g 2 ( n − 1 ) ∣ 2^{|log_2(n-1)|} 2log2(n1) = O( 2 ∣ l o g 2 ( n − 1 ) ∣ 2^{|log_2(n-1)|} 2log2(n1)) = O(n)
扩容的均摊分析为O(1)。

3.1.3.2 容量递增策略分摊分析

在这里插入图片描述
对算术级数不熟悉的看算法分析

3.1.3.3 结果对比

在这里插入图片描述

3.2缩容

导致低效率的另一情况是,向量的实际规模可能远远小于内部数组的容量。

3.2.1 动态缩容算法实现

算法思想:

每次删除操作之后,一旦空间利用率已降至某一阈值以下,该算法随即申请一个容量减半的新数组,将原数组中的元素逐一搬迁至其中,最后将原数组所占空间交还操作系统。

这里以25%作为装填因子的下限,但在实际应用中,为避免出现频繁交替扩容和缩容的情况,可以选用更低的阈值,甚至取作0(相当于禁止缩容)。

template <typename T> void Vector<T>::shrink() { //装填因子过小时压缩向量所占空间
   if ( _capacity < DEFAULT_CAPACITY << 1 ) return; //不致收缩到DEFAULT_CAPACITY以下
   if ( _size << 2 > _capacity ) return; //以25%为界
   T* oldElem = _elem; _elem = new T[_capacity >>= 1]; //容量减半
   for ( Rank i = 0; i < _size; i++ ) _elem[i] = oldElem[i]; //复制原向量内容
   delete[] oldElem; //释放原空间
}

3.2.2 动态缩容算法时间复杂度

与expand()操作类似,尽管单次shrink()操作需要线性量级的时间,但其分摊复杂度亦为O(1)。

4. 总结

就单次扩容或缩容操作而言,所需时间的确会高达Ω(n),因此在对单次操作的执行速度极其敏感的应用场合以上策略并不适用,其中缩容操作甚至可以完全不予考虑。

最近更新

  1. TCP协议是安全的吗?

    2024-04-23 12:24:05       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-23 12:24:05       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-23 12:24:05       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-23 12:24:05       20 阅读

热门阅读

  1. CSS基础——1.CSS样式

    2024-04-23 12:24:05       15 阅读
  2. 【后端】python2和python3的语法差异

    2024-04-23 12:24:05       19 阅读
  3. SQL UNION

    2024-04-23 12:24:05       13 阅读
  4. NIO之非阻塞模式

    2024-04-23 12:24:05       12 阅读
  5. 分类算法——集成学习方法之随机森林(六)

    2024-04-23 12:24:05       15 阅读
  6. 多标签与多分类的区别

    2024-04-23 12:24:05       40 阅读
  7. oracle之--动态sql(execute immediate ‘ ‘)

    2024-04-23 12:24:05       11 阅读