HashMap
java.util包下面的工具类,键值对存储数据.通过对键值计算hash值,来存储到对应的位置.
jdk1.8中底层使用数组加链表实现.键值对通过一个内部类的Node节点来表示.采用链地址法解决hash冲突,如果一条链上的节点超过给定阈值会变为红黑树.默认为8.
在hashmap中是可以存储空key和value的.如果为空,则位置为0.
声明
hashmap继承了AbstractMap类,实现Map接口和克隆接口.1
2public class HashMap<K,V> extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable
主要内部类
Node 继承Map.Entry
- final int hash; 此节点保存的键值的hash值
- final K key; 此节点的键
- V value; 值
- Node<K,V> next; 下一个节点,主要在有hash冲突的地方指向下一个几点
Node(int hash, K key, V value, Node<K,V> next) 初始化方法
1
2
3public final int hashCode() {
return Objects.hashCode(key) ^ Objects.hashCode(value);
}
这里计算hashCode是用key和value的hash值异或得到.
剩下的是获取键,获取值,设置值,equals等方法,比较简单
KeySet
1 | final class KeySet extends AbstractSet<K> { |
HashIterator
遍历map的迭代器,定义了遍历的基本操作.KeyIterator,ValueIterator和EntryIterator都继承自此类,在实现了一个返回Node的不同值.1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50abstract class HashIterator {
Node<K,V> next; // next entry to return
Node<K,V> current; // current entry
//期望的modcount,在遍历期间不希望有别的线程更改过此map,如果改过,则抛出异常
int expectedModCount; // for fast-fail
int index; // current slot
//初始化,找到第一个不为空的节点
HashIterator() {
expectedModCount = modCount;
Node<K,V>[] t = table;
current = next = null;
index = 0;
if (t != null && size > 0) { // advance to first entry
do {} while (index < t.length && (next = t[index++]) == null);
}
}
public final boolean hasNext() {
return next != null;
}
//返回下一个节点,
final Node<K,V> nextNode() {
Node<K,V>[] t;
//首先返回值应该是下一个要返回的节点
Node<K,V> e = next;
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
if (e == null)
throw new NoSuchElementException();
//这里在继续寻找下一个节点
if ((next = (current = e).next) == null && (t = table) != null) {
do {} while (index < t.length && (next = t[index++]) == null);
}
return e;
}
//移除节点使用外部类的方法移除
public final void remove() {
Node<K,V> p = current;
if (p == null)
throw new IllegalStateException();
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
current = null;
K key = p.key;
removeNode(hash(key), key, null, false, false);
expectedModCount = modCount;
}
}
字段
常量
- DEFAULT_INITIAL_CAPACITY, 默认为16,初始化默认容量大小
- MAXIMUM_CAPACITY, 最大容量大小 ,为 1<<30
- DEFAULT_LOAD_FACTOR, 加载因子. 默认0.75
- TREEIFY_THRESHOLD, 链表树化的阈值,超过这个值,链表转为红黑树.默认为8
- UNTREEIFY_THRESHOLD, 红黑树转为链表的阈值,当红黑树的节点个数小于此值会变为链表.默认为6
- MIN_TREEIFY_CAPACITY, 这个值就是最小的树化table数组的长度,如果数组长度小于这个值,则先不进行树化,先扩容来减少冲突.
具体属性
- Node<K,V>[] table. 用来存放键值对的数组.
- int size; 返回table存放了多少键值对,并不是table的长度
- int modCount. 这个是在迭代的时候才会用到,因为hashMap的迭代器是fast-fail的.用这个值表示在此过程中是否有过改变,有过改变就抛出异常.
- int threshold; 下一个数组长度
- final float loadFactor; 加载因子
主要方法
这里一些简单的get(),set()就不说了,因为很简单.
HashMap(int initialCapacity, float loadFactor)
初始化方法,这里只看这一个.其他的都是通过调用这个方法的.所以能看出来在初始化的时候真正的存数据的表并没有初始化.1
2
3
4
5
6
7
8
9
10
11
12
13
14
15public HashMap(int initialCapacity, float loadFactor) {
//初始化容量小于0,直接抛出异常
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
//如果大于默认的最大容量,则为最大容量
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
//这里就是计算出下一次的table的长度.
this.threshold = tableSizeFor(initialCapacity);
}
tableSizeFor(int cap) 方法
这个方法设计的很巧妙,通过5次移位运算可以返回一个大于等于cap的最小的2的n次方的数1
2
3
4
5
6
7
8
9
10
11
12
13
14
15static final int tableSizeFor(int cap) {
// 减一是为了防止cap本身就为2的n次方
// 这里一个数字首先无符号右移1位,然后在或运算,会将他最高位为1的右边一位也变为1.
// 比如随便来一个数字 为010010111000000...
int n = cap - 1;
n |= n >>> 1;
//经过第一次运算后,很明显为1的最高位和下一位都为1.数字为 01101....
n |= n >>> 2;
//第二次运算之后,这两位1在向右移动两位,现在最高位最少有4个1.为011110....
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
//以此类推,在最后右移16位的时候,最后会导致cap的最高位为1的位置之后的全部为1.很容易就找见了大于等于cap的最小的2的n次方的数
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
hash(Object key)
计算key的hash值,通过高16位与上低16为保证每一位都能够参与运算.1
2
3
4static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict)方法
1 | final V putVal(int hash, K key, V value, boolean onlyIfAbsent, |
resize()
接着看resize()方法,在这里,resize总是将容量大小扩容到2的n次方大小,因为这个样子有利于rehash.还有利于找key在数组中的位置.1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83final Node<K,V>[] resize() {
//保存下来旧的table.
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
//如果旧的容量大于0,并且大于默认最大值也就是1<<30,threshold也就是下一次的要扩容到threshold大小.直接返回
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
//新的容量变为原来的2被,新的threshold也变为原来的2倍,因为有一个tablesizefor()方法,导致hashMap的容量只能是2的n次方
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
//这里是table还没有初始化的时候,等于之前的要扩容大小
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
else {
//如果oldThr也没有制定,则就是默认大小.
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
"rawtypes","unchecked"}) ({
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
//对于表中的没一个位置,复制到新表中
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
//如果这个表中的节点是树的话,就用树的方式来写.
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else {
//如果是链表的话,这里有一个小知识点,因为table的大小只能是2的n次方,所以在rehash的时候在一条链上的节点在rehash后,只能有两个位置,一个是本身i,另一个是i+oldTab.length;
//这里使用两个链表直接遍历所有的在链表上的节点,然后分为两个链表,最后给i和i+oldTab.length位置赋值
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
//如果hash与上旧的长度为0的话,说明这个节点的位置还在原处
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
扩容这里,旧的链表上的节点的位置只可能是i或者i+oldTab.length.为什么呢.举个例子.假如之前的链表长度为16,二进制为10000,现在变为32,就是100000;这个时候如果一个hash值为10的节点分别与16-1(1111)和32-1(11111)进行与运算,那么他们两个就只有可能有一位不一样,就是第5位.所以如果第5为是0,说明和以前的坐标一样,还在原位置,如果为1,则说明坐标位置应该在i+oldTabl.length的位置.
removeNode(int hash, Object key, Object value, boolean matchValue, boolean movable)
移除一个节点.1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43final Node<K,V> removeNode(int hash, Object key, Object value,
boolean matchValue, boolean movable) {
Node<K,V>[] tab; Node<K,V> p; int n, index;
if ((tab = table) != null && (n = tab.length) > 0 &&
(p = tab[index = (n - 1) & hash]) != null) {
//先找到key所在数组中的位置为(n-1)&hash
//保存一个node节点,节点表示的是要删除的节点,p表示要删除的前一个节点.
Node<K,V> node = null, e; K k; V v;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
node = p;
else if ((e = p.next) != null) {
if (p instanceof TreeNode)
node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
else {
do {
if (e.hash == hash &&
((k = e.key) == key ||
(key != null && key.equals(k)))) {
node = e;
break;
}
p = e;
} while ((e = e.next) != null);
}
}
if (node != null && (!matchValue || (v = node.value) == value ||
(value != null && value.equals(v)))) {
//具体删除操作,都能看懂
if (node instanceof TreeNode)
((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
else if (node == p)
tab[index] = node.next;
else
p.next = node.next;
++modCount;
--size;
afterNodeRemoval(node);
return node;
}
}
return null;
}
public boolean containsValue(Object value)
containsValue主要就是遍历表中的节点,如果找到就返回true.1
2
3
4
5
6
7
8
9
10
11
12
13{
Node<K,V>[] tab; V v;
if ((tab = table) != null && size > 0) {
for (int i = 0; i < tab.length; ++i) {
for (Node<K,V> e = tab[i]; e != null; e = e.next) {
if ((v = e.value) == value ||
(value != null && value.equals(v)))
return true;
}
}
}
return false;
}
clear()方法
简单,就是将table中的元素附空值.1
2
3
4
5
6
7
8
9public void clear() {
Node<K,V>[] tab;
modCount++;
if ((tab = table) != null && size > 0) {
size = 0;
for (int i = 0; i < tab.length; ++i)
tab[i] = null;
}
}