HashMap----源码解读

源码分析:
public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable

在类的开头声明了几个常量,以下是较为重要的:

/**
 * 定义初始容量大小为16
 */
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16 
​
/**
 * 定义最大容量为2^30
 */
static final int MAXIMUM_CAPACITY = 1 << 30;
​
/**
 * 定义加载因子,与数组实时容量相乘会得到一个扩容阈值(threshold),当到达这个阈值时,将会进行扩容。
 */
static final float DEFAULT_LOAD_FACTOR = 0.75f;
​
/**
 * 当链表元素增加到8时,转化为红黑树提升查找效率
*/
​
static final int TREEIFY_THRESHOLD = 8;
​
/**
 * 当红黑树元素减少到6时,退化为链表
*/
static final int UNTREEIFY_THRESHOLD = 6;
​
/**
 * 只有当哈希表的总容量至少为64时,才可能将链表转换为红黑树。
*/
static final int MIN_TREEIFY_CAPACITY = 64;

以下是定义的一些成员变量:

/**
 * 这是HashMap存储数据的哈希表,它是一个数组,每个元素是一个链表的头节点或者红黑树的
 */
transient Node<K,V>[] table;
​
/**
 * 这是一个缓存,用于存储HashMap中所有键值对(Entry)的集合视图。
 */
transient Set<Map.Entry<K,V>> entrySet;
​
/**
 * 这个字段表示HashMap中键值对的总数。
 */
transient int size;
​
/**
 * 这个字段记录了HashMap结构上被修改的次数,包括添加、删除操作,或者重新哈希(rehash)等。
 * 它用于实现快速失败(fail-fast)机制,当HashMap在迭代过程中被修改时,会抛出
 */
transient int modCount;
​
/**
这个字段表示HashMap能够容纳的最大元素数量,达到这个数量时,HashMap会进行扩容(resize)。它等于数组的容量乘以加载因子(load factor)。如果哈希表还没有被分配,这个字段可以表示初始数组容量或0,0代表使用默认的初始容量。
 */
int threshold;
​
/**
这个字段是HashMap的加载因子,它决定了HashMap何时进行扩容操作。加载因子是HashMap中元素数量与数组长度的比例。当HashMap中的元素数量超过了capacity * loadFactor时,HashMap会进行扩容。默认的加载因子是0.75,这是一个空间和时间成本之间的折中。
 */
final float loadFactor;

对于链表元素,会将其存储在一个叫Node的内部类中,对于红黑树元素,会被存储与TreeNode内部类中:

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;//hash值
    final K key;//键
    V value;//值
    Node<K,V> next;//指向下一个元素
    ...
}
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
    TreeNode<K,V> parent;// 父节点
    TreeNode<K,V> left;//左子树
    TreeNode<K,V> right;//右子树
    TreeNode<K,V> prev;// 这是一个指向当前节点的前一个节点的引用。这个字段主要用于在删除节点时,能够从双向链表中移除当前节点。由于HashMap中的红黑树节点也是双向链表的一部分,所以这个字段是必要的。
    boolean red;//是否转为红色
    ...
}

在初始化的时候,我们查看其中的一个无参构造:

public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR; // 在调用无参构造,只对加载因子做了初始化,其他都没有初始化。
}

当我们进行插入元素时,我们会调用put方法进行添加元素,传入键值对:

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);//依次参数是
      // 1.对键进行hash(计算键的哈希值以确定它应该存储在哪个桶中)
      // 2.键
      // 3.值
      // 4.是否保留(false时重复会进行覆盖)
      // 5.这个布尔值参数用于LinkedHashMap,它指示在插入后是否需要执行额外的操作。在HashMap中,这个参数通常被忽略,因为它不是用来控制标准HashMap行为的。在LinkedHashMap中,这个参数用于确定是否在插入后移除最旧的条目
}

接着我们进入putVal方法查看:

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    //由于table是成员变量放在堆中,而方法在栈中,所以定义一个局部变量(同样存在于栈中)提高效率
    Node<K,V>[] tab; 
    //指向当前数组位置
    Node<K,V> p; 
    //n为数组容量,i为以hash值与数组长度运算得到的插入位置索引(桶索引)
    int n, i;
    //对tab进行赋值并且判断是否为空,其实就是对我们的数组判断是否为空(还没初始化),调用resize函数进行初始化:
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    //判断在数组中,该位置是否为空,为空直接插入
    if ((p = tab[i = (n - 1) & hash]) == null)
    //将我们的元素插入到数组中。
        tab[i] = newNode(hash, key, value, null);
    //不为空
    else {
        Node<K,V> e; K k;
        //判断是否重复
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
        //重复则将存在的元素赋值给e,后续可以用来更新该节点的值。
            e = p;
        //如果存在的元素的类型是红黑树节点
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        //在原来元素的基础上进行链表插入的操作
        else {
            //这里开始了一个无限循环,binCount用于记录当前桶中的节点数量。循环将遍历链表中的节点,直到找到合适的插入位置。
            for (int binCount = 0; ; ++binCount) {
//在循环内部,首先检查当前节点p的下一个节点e是否为null。如果是null,说明已经到达链表的末尾,可以在这里插入新的节点。
                if ((e = p.next) == null) {
                    //在存在元素上使用尾插法进行插入新元素
                    p.next = newNode(hash, key, value, null);
                    //达到树化阈值,对当前哈希桶转换为红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    //插入超过即break
                    break;
                }
//在遍历链表的过程中,如果找到了一个具有相同哈希值和键的节点,这意味着找到了一个已经存在的键。
//如果键相等(通过==比较或者equals方法),循环会通过break终止。
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                //如果没有找到相等的键,或者还没有到达链表末尾,p会更新为下一个节点e,继续循环。
                p = e;
            }
        }
        //经过上诉操作之后,如果e不为null则说明已经找到了重复元素
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            //判断是否要进行覆盖,因为重复时e指向的是重复元素,此时进行重复元素value的覆盖
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            //这个方法在HashMap类中是空的,用于LinkedHashMap的位置调整,因为有重复元素覆盖则涉及一个插入顺序打乱
            afterNodeAccess(e);
            //返回旧值
            return oldValue;
        }
    }
    ++modCount;
    //大于阈值则调用resize准备扩容
    if (++size > threshold)
        resize();
    //它在节点被插入后调用。这个方法在HashMap类中是空的,但在LinkedHashMap中会被覆盖以维护节点的插入顺序。
    afterNodeInsertion(evict);
    //正常插入返回null
    return null;
}

在resize方法中,由于我们的容量等于零,所以他会执行其中的:

{               
    newCap = DEFAULT_INITIAL_CAPACITY;//给我们的容量赋值默认容量16
    newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);//给我们的阈值赋值为容量乘以加载因子
}
threshold = newThr;//赋值给成员变量
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];//此时才开始初始化存放链表或者红黑树的数组
        table = newTab;//将其赋值给成员变量table
...
return newTab;最后将我们的新数组进行返回。

以上是其中的一种情况,在resize中有三种情况,以下是其他两种:

//当旧容量大于0,此时调用到resize则说明需要进行扩容操作
if (oldCap > 0) {
    //判断旧容量有没有超过最大,超过则设置阈值为Int最大,表示再也不会扩容了。
    if (oldCap >= MAXIMUM_CAPACITY) {
        threshold = Integer.MAX_VALUE;
        return oldTab;
    }
    //开始扩容,让新容量左移一位即为2倍操作,并进行判断新容量有没有超过阈值。
    else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
             oldCap >= DEFAULT_INITIAL_CAPACITY)
        //如果以上判断通过则将新阈值变为旧阈值的两倍
        newThr = oldThr << 1; // double threshold
}
//当旧阈值大于零且不满足旧容量大于零(以上情况),则说明在创建hashMap时进行了初始化容量,当插入元素时会调用resize来到这个if
else if (oldThr > 0) // initial capacity was placed in threshold
    newCap = oldThr;

当扩容之后我们会对对应的成员变量进行赋值,并且让旧数组的元素拷贝到新数组中去:

//阈值更新,即下一次扩容时机
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
//创建新数组
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
//将成员变量table赋值新数组
table = newTab;
//这里判断,只要不是初始化就要快开始数组拷贝
if (oldTab != null) {
    for (int j = 0; j < oldCap; ++j) {
        Node<K,V> e;
        if ((e = oldTab[j]) != null) {
            oldTab[j] = null;
            //只有一个元素
            if (e.next == null)
                newTab[e.hash & (newCap - 1)] = e;
            //树结构节点
            else if (e instanceof TreeNode)
                ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
            //链表结构
            else { // preserve order
                Node<K,V> loHead = null, loTail = null;
                Node<K,V> hiHead = null, hiTail = null;
                Node<K,V> next;
                //低位:落在新容量的(0,旧容量大小)区域
                //高位:落在新容量的(旧容量大小,两倍旧容量)区域
                //先使用其hash值判断它在高位区还是低位区,hash与旧容量相与等于零则说明其在低位。
                //判断后,就可以把j索引下的一整条链表进行复制
                //复制过程就是自己造一条新链表,如落在低位时:
                //先使用lohead将头节点保存,其次用lotail.next在循环中将整条链表进行连接
                //整条链表复制好了,即走完了dowhile,此时再一次判断是高位还是低位(判断高或低有没有为空)不为空则为高或低位。
                //如果是低位直接将头节点插入到新容量数组的j索引处,如果是高位则将头节点插入在新容量(j+旧容量大小)索引处
                do {
                    next = e.next;
                    if ((e.hash & oldCap) == 0) {
                        if (loTail == null)
                            loHead = e;
                        else
                            loTail.next = e;
                        loTail = e;
                    }
                    else {
                        if (hiTail == null)
                            hiHead = e;
                        else
                            hiTail.next = e;
                        hiTail = e;
                    }
                } while ((e = next) != null);
                if (loTail != null) {
                    loTail.next = null;
                    newTab[j] = loHead;
                }
                if (hiTail != null) {
                    hiTail.next = null;
                    newTab[j + oldCap] = hiHead;
                }
            }
        }
    }
}
return newTab;

相关推荐

  1. 大厂HashMap面试

    2024-07-12 01:00:02       37 阅读
  2. HashMap解析

    2024-07-12 01:00:02       35 阅读
  3. HashMap底层面试题

    2024-07-12 01:00:02       36 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-12 01:00:02       101 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-12 01:00:02       109 阅读
  3. 在Django里面运行非项目文件

    2024-07-12 01:00:02       87 阅读
  4. Python语言-面向对象

    2024-07-12 01:00:02       96 阅读

热门阅读

  1. Chromium编译指南2024 Linux篇-解决运行报错信息(六)

    2024-07-12 01:00:02       27 阅读
  2. prototype 和 __proto__的区别

    2024-07-12 01:00:02       28 阅读
  3. Spring-Data-Elasticsearch

    2024-07-12 01:00:02       32 阅读
  4. npm ERR! code ENOTEMPTY npm ERR! syscall rename npm ERR!

    2024-07-12 01:00:02       27 阅读
  5. sizeof()

    2024-07-12 01:00:02       27 阅读
  6. Python 四种字符串格式化方式

    2024-07-12 01:00:02       25 阅读
  7. 存取款系统接口设计

    2024-07-12 01:00:02       24 阅读
  8. SpringBoot 自定义异常返回数据格式

    2024-07-12 01:00:02       27 阅读
  9. ubuntu 安装cups和爱普生打印机

    2024-07-12 01:00:02       22 阅读
  10. 服务器怎么进PE系统?

    2024-07-12 01:00:02       29 阅读
  11. 还在代码中写HttpUtil?是时候说再见啦

    2024-07-12 01:00:02       30 阅读