Jan 22, 2021

深入理解 Go map

哈希表

几乎所有语言都有哈希表这个数据结构，能够在平均 O(1)，最差 O(n) 的时间复杂度内增删改查元素，Go 语言哈希表的精妙设计使得它几乎不会出现 O(n) 的糟糕情况。这篇文章我就带你从使用到底层由浅入深地探究 Go map 的奥秘，一起作一个不只是会用的 ”大神“。

问题来源于实际，我们先看看这些实际问题：

声明。当我使用 :=，var，make，甚至 new 声明 map 的时候，编译器帮我们做了什么事情，它们有什么区别？
增删改查。使用数组+链表的情况下如何设计才能避免 O(n) 的最差情况？
注意事项。map 的键有什么要求？map 是值类型还是引用类型，函数传参时会有上层影响吗？是并发安全的吗？

还有一个常识是 Go map 的 遍历是随机的，即多次遍历输出的结果不同，这个的原因会在后面提到。

设计方式/数据结构

Go map 实现哈希表使用的是 数组+链表 的形式，也就是使用链地址法解决的哈希冲突。这种方式桶的大小和元素个数之间没有关系，另外还有开放定址法，这是个宽泛的名字，具体包含线性探测法，再哈希法，平方探测法等等。

为了降低 map 操作的时间复杂度，引入了一个负载因子的概念，这个概念在其他实现哈希表这个数据结构的语言里也都有，比如 python 中这个值被定义为 2/3，Java 中是 0.75，这个值评估了哈希表里 实际上最好只存 多少比例的元素，而不是一直等到满载再处理，因为多到一定程度效率可能就低了。在 Go 语言里这个值被定义为 6.5，即每个桶里最多存 6.5 个，包括溢出桶。

当我们在 Go 语言中声明一个 map 的时候，实际上就是创建了一个 hmap 的结构体，它定义在 runtime/map.go 文件下，这个结构体包含了许多信息：map 的大小，桶数量、地址，溢出桶数量、地址等等。哈希表就是实现一个映射关系，给出自变量 x，能够通过平均 O(1) 的时间复杂度方法找到这个元素所对应的因变量 y=f(x) 来对它进行操作。

type hmap struct {
    count     int 		// map的大小，len()的结果就是这个字段值
	flags     uint8		// map的状态，有四个
	B         uint8  	// 桶数量的log_2对数，如B=5，桶数量就是2^5=32
	noverflow uint16 	// 溢出桶的数量
	hash0     uint32 	// 哈希种子

	buckets    unsafe.Pointer // 桶数组的底层地址
	oldbuckets unsafe.Pointer // 旧桶数组的底层地址
	nevacuate  uintptr        // 迁移进度

	extra *mapextra // 溢出桶
}

type mapextra struct {
	overflow    *[]*bmap
	oldoverflow *[]*bmap

	// 指向下一个空闲溢出桶
	nextOverflow *bmap
}

需要注意的是，如果 map 的键值都不包含指针并且是内联的，那么我们就会标注 map 为 ”不含指针类型“，这样就可以避免 GC 扫描 map，从而避免在 map 在过大时由于指针过多造成的 GC 扫描对象过多而缓慢的问题。所以将所有关于溢出桶的指针都放在了 extra 字段中。mapextra 字段保存了与溢出桶相关的信息，overflow 指向当前桶 hmap.buckets 的溢出桶，oldoverflow 指向旧桶 hmap.oldbuckets 的溢出桶。

真正存储数据的地方是 bmap，map 有 2^B 个 bmap，但是每个 bmap 只能存储 8 个键值对，多出来的就要找到一个溢出桶放进去，每个桶的数据结构都是一样的，bmap 结构只有 tophash 字段是因为 map 的 key 和 value 是需要 在编译时计算确定，所以需要在编译时动态构造桶结构。唯一的 tophash 字段是键值经过哈希函数计算后的值高八位。

type bmap struct {
	tophash [bucketCnt]uint8
}

此外，动态运行时构造的 key 和 value 键值对并没有按照 key1/value1、key2/value2、…、keyN/valueN 的方式存储，而是如图形式，是为了避免因为字节对齐造成的内存浪费，也是因为 CPU 从内存中读取数据是每次读取固定大小的块（因为数据总线条数固定），这块内存也并不是连续的，这里不展开说了，总之，如果采用 key1/value1、key2/value2、…、keyN/valueN 的方式，如果 map 是 map[int64]int8 的时候，每个键值对就会由于内存不对齐造成 7 字节的内存浪费，其实也并不一定浪费，现在很多 CPU 也可以读取多块内存然后拼接组合成最终的数据，但是这样性能并不好。这一点在官方源代码里的 bmap 结构体注释中有说明。

初始化

Go 语言初始化 map 的方式有两种，字面量和运行时。

字面量 “:=”

m := map[int]string {
    1: "go",
    2: "lang",
}

几乎所有语言都会提供字面量的方式进行初始化，Go 语言里的字面量初始化是使用了 “:=” 符号，这样来代表创建一个局部变量。Go 语言里的 map 也可以通过这种方式初始化，但是需要注意的是，还有一种初始化方式 var m map[Type]Type ，如果仅仅这样声明后就直接使用 m[key] = value 来写入是会 panic 的，因为没有分配实际内存。

通过这种方式初始化的 map 会调用 maplit 函数来执行具体的创建逻辑：

func maplit(n *Node, m *Node, init *Nodes) {
	a := nod(OMAKE, nil, nil)
	a.Esc = n.Esc
	a.List.Set2(typenod(n.Type), nodintconst(int64(n.List.Len())))
	litas(m, a, init)

	entries := n.List.Slice()

    // ...

	if len(entries) > 25 {
		// 如果数量非常多（指大于25个），就放进数组中循环处理。

		// 构建 [count]Tindex 和 [count]Tvalue
		tk := types.NewArray(n.Type.Key(), int64(len(entries)))
		te := types.NewArray(n.Type.Elem(), int64(len(entries)))
        
        // 后续循环插入，类似
        // for i = 0; i < len(vstatk); i++ {
		//	 map[vstatk[i]] = vstate[i]
		// }
        
        ...
    }

不管是哪种情况，最终都会通过 make 来创建哈希表数据结构并且通过 map[key] = value 的形式插入数据。

运行时 “make”

使用 make 创建 map 时有两种情况，一种是不给出大小，或者大小小于 8 的时候，会调用 makemap_small 来快速初始化一个 map：

func makemap_small() *hmap {
	h := new(hmap)
	h.hash0 = fastrand()
	return h
}

显而易见，这种的方式的 map 是声明在堆上的。除了这种方式之外，map 会通过 makemap64 来将 map 的大小设置为 int32 后再调用 makemap 函数进行创建的主要逻辑：

func makemap(t *maptype, hint int, h *hmap) *hmap {
	mem, overflow := math.MulUintptr(uintptr(hint), t.bucket.size)
	if overflow || mem > maxAlloc {
		hint = 0
	}

	if h == nil {
		h = new(hmap)
	}
	h.hash0 = fastrand()

	B := uint8(0)
	for overLoadFactor(hint, B) {
		B++
	}
	h.B = B

	if h.B != 0 {
		var nextOverflow *bmap
		h.buckets, nextOverflow = makeBucketArray(t, h.B, nil)
		if nextOverflow != nil {
			h.extra = new(mapextra)
			h.extra.nextOverflow = nextOverflow
		}
	}

	return h
}

makemap 函数做了这几件事：

用桶的个数*8，判断内存是否足够分配，会不会溢出，如果会的话就置 0。
声明一个 map 结构体变量，初始化一个随机数用于哈希函数的计算。
用 make 内置函数的第二个参数 hint 判断出需要多少个桶，转换为对数存到 B 中。
如果 B 是 0 的话，就不分配内存，后续用的时候懒加载分配，所以从这里我们也能明白为什么平时说提前给出 map 的大小后续使用速度更快了。如果不是 0，就调用 makeBucketArray 分配底层的桶内存和溢出桶内存。

这里会有一个判断 nextOverflow != nil ，这里就涉及在什么情况下初始化时要提前分配溢出桶，Go 语言是这样解决的：如果 B 大于 4，那么就认为后续使用溢出桶的概率比较大，就会预先分配 2^(B-4) 个溢出桶。然后分配专门用来描述溢出桶的结构 hmap.extra，其中指向下一个溢出桶地址的 nextOverflow 字段就指向分配好的溢出桶首地址。

正常桶和溢出桶的地址是连续的，只是被不同的字段引用而已，如果溢出桶不够用，会调用 runtime/newobject 分配新的溢出桶。直到达到元素数量过多需要全量扩容或者重新哈希等量扩容，这个问题下文会详说。

读写操作

Go 内置数据类型 map 是并发不安全的，也就是说多个 goroutine 同时对 map 执行写入操作会导致程序发生 panic 中断。官方解释说这是因为大多数情况下 map 并不需要并发安全，如果为所有 map 都加上并发操作的特性会使得大多数场景性能下降，为此 Go 在 1.9 版本引入了一种并发安全的 map 类型 sync/map ，留给读者自行探索。

访问

map 的访问有两种形式：

value := m["I'm a Key"]

value, ok := m["I'm a Key"]

第二种方式的第二个返回值是个布尔类型，代表该键在 map 中是否存在，类似于数据库或者其他概念中的 NULL 值，目的是为了不和所有该类型值冲突。两种方式的底层调用分别对应着 runtime/mapaccess1 和 runtime/mapaccess2 ，Go 语言会在 运行时决定 使用哪种方式。

func mapaccess1(t *maptype, h *hmap, key unsafe.Pointer) unsafe.Pointer {
    // ...
	hash := t.hasher(key, uintptr(h.hash0))
	m := bucketMask(h.B)
	b := (*bmap)(add(h.buckets, (hash&m)*uintptr(t.bucketsize)))
    // ...
	top := tophash(hash)
bucketloop:
	for ; b != nil; b = b.overflow(t) {
		for i := uintptr(0); i < bucketCnt; i++ {
			if b.tophash[i] != top {
				if b.tophash[i] == emptyRest {
					break bucketloop
				}
				continue
			}
			k := add(unsafe.Pointer(b), dataOffset+i*uintptr(t.keysize))
			if t.indirectkey() {
				k = *((*unsafe.Pointer)(k))
			}
			if t.key.equal(key, k) {
				e := add(unsafe.Pointer(b), dataOffset+bucketCnt*uintptr(t.keysize)+i*uintptr(t.elemsize))
				if t.indirectelem() {
					e = *((*unsafe.Pointer)(e))
				}
				return e
			}
		}
	}
	return unsafe.Pointer(&zeroVal[0])
}

mapaccess1 的返回值是一个指向目标值的指针，如果不存在的话会返回该类型的零值而不会返回 nil。

依次做了这些事：

通过 map 最开始初始化的哈希种子，用哈希函数计算出该键的哈希值 hash，这里的哈希函数使用了依赖注入的方式，并不固定。
计算桶的位掩码 m，也就是 B-1，用于后续做与运算确定该键位于哪个桶中。
与运算找到桶，桶的首地址+桶序号*桶大小动态计算出目标桶地址 b，取高八位哈希值 tophash，这里是通过位运算的方式取高位的，因为除法代价太高。
最后从桶的第一个 cell 开始，到最后一个溢出桶的最后一个 cell 为止遍历，先比较 tophash，如果一致了就用 tophash 值的下标和 map key 的大小计算出该 key 的偏移，再比较一次，这样可以加速查找，

第二种形式的底层调用是 mapaccess2 ，过程和第一种类似，只是在最后的两个 return 处多返回了一个布尔值：

				// ...
				return e, true
			}
		}
	}
	return unsafe.Pointer(&zeroVal[0]), false

还有一个函数 mapaccessK ，返回的是 map 的 key 和 value，用于 map 的 range 函数遍历，过程类似，不赘述了。

写入

map 的写入操作对应底层 runtime/map.go.mapassign 函数。这个函数的签名如下：

func mapassign(t *maptype, h *hmap, key unsafe.Pointer) unsafe.Pointer

签名中并没有看到写入 key 所对应的 value 值表达式，唯一相关的返回值是一个指向任意类型的指针类型，可能有人就迷惑了，map 写入是依靠这个函数，我都没传 value 怎么写入呢？

答案是写入操作并没有写在标准库源码中，而是在汇编代码中。

...
0x008e 00142 (notify.go:5)      CALL    runtime.mapassign_fast64(SB)
0x0093 00147 (notify.go:5)      MOVQ    24(SP), AX
0x0098 00152 (notify.go:5)      MOVQ    $666, (AX)
...

学习 Go 底层原理时，时常要借助汇编代码一起分析，Go 官方也为我们提供了完整的工具包，其中 go tool compile -S 就十分有用，上面这些信息就是通过这个工具得到的。

mapassign_fast64 是针对不同类型的 key 做出的编译时优化，为了增加效率。

下面看一下这个函数的源码：

func mapassign(t *maptype, h *hmap, key unsafe.Pointer) unsafe.Pointer {
    // 向空map中写入会panic，比如仅仅通过
    // var mp map[int]int
    // mp[1] = 2 // panic!
	if h == nil {
		panic(plainError("assignment to entry in nil map"))
	}
	...
    // 写map时会把flags标志位写位置1，写入时如果检测到已经置1，
    // 说明并发写入，语言不支持，会panic
	if h.flags&hashWriting != 0 {
		throw("concurrent map writes")
	}
	hash := t.hasher(key, uintptr(h.hash0))

    // 这个要在t.hasher之后，因为hasher调用可能panic，导致写入失败，没必要把写入位置1
	h.flags ^= hashWriting

    // 如果还没有桶就new一个
	if h.buckets == nil {
		h.buckets = newobject(t.bucket) // newarray(t.bucket, 1)
	}

again:
	bucket := hash & bucketMask(h.B)	// 与低B位确定在哪个桶
	if h.growing() {	// 这个函数只有一行代码，h.oldbuckets != nil，判断是否迁移完毕
		growWork(t, h, bucket)
	}
	b := (*bmap)(add(h.buckets, bucket*uintptr(t.bucketsize)))// 用首地址+桶编号*单个桶大小定位到目标桶的地址
	top := tophash(hash) // 计算tophash哈希值，用于找到key value

    // 完成了上面的各种判断，才会进行下面双重循环的判断，按照所有桶，每个桶里的8个位，按顺序遍历
	var inserti *uint8
	var insertk unsafe.Pointer
	var elem unsafe.Pointer
bucketloop:
	for {
		for i := uintptr(0); i < bucketCnt; i++ {
			if b.tophash[i] != top {
				if isEmpty(b.tophash[i]) && inserti == nil {
					inserti = &b.tophash[i]
					insertk = add(unsafe.Pointer(b), dataOffset+i*uintptr(t.keysize))
					elem = add(unsafe.Pointer(b), dataOffset+bucketCnt*uintptr(t.keysize)+i*uintptr(t.elemsize))
				}
				if b.tophash[i] == emptyRest {
					break bucketloop
				}
				continue
			}
			k := add(unsafe.Pointer(b), dataOffset+i*uintptr(t.keysize))
			if t.indirectkey() {
				k = *((*unsafe.Pointer)(k))
			}
			if !t.key.equal(key, k) {
				continue
			}
			// already have a mapping for key. Update it.
			if t.needkeyupdate() {
				typedmemmove(t.key, k, key)
			}
			elem = add(unsafe.Pointer(b), dataOffset+bucketCnt*uintptr(t.keysize)+i*uintptr(t.elemsize))
			goto done
		}
		ovf := b.overflow(t)
		if ovf == nil {
			break
		}
		b = ovf
	}

	// Did not find mapping for key. Allocate new cell & add entry.

	// If we hit the max load factor or we have too many overflow buckets,
	// and we're not already in the middle of growing, start growing.
	if !h.growing() && (overLoadFactor(h.count+1, h.B) || tooManyOverflowBuckets(h.noverflow, h.B)) {
		hashGrow(t, h)
		goto again // Growing the table invalidates everything, so try again
	}

	if inserti == nil {
		// The current bucket and all the overflow buckets connected to it are full, allocate a new one.
		newb := h.newoverflow(t, b)
		inserti = &newb.tophash[0]
		insertk = add(unsafe.Pointer(newb), dataOffset)
		elem = add(insertk, bucketCnt*uintptr(t.keysize))
	}

	// store new key/elem at insert position
	if t.indirectkey() {
		kmem := newobject(t.key)
		*(*unsafe.Pointer)(insertk) = kmem
		insertk = kmem
	}
	if t.indirectelem() {
		vmem := newobject(t.elem)
		*(*unsafe.Pointer)(elem) = vmem
	}
	typedmemmove(t.key, insertk, key)
	*inserti = top
	h.count++

done:
	if h.flags&hashWriting == 0 {
		throw("concurrent map writes")
	}
	h.flags &^= hashWriting
	if t.indirectelem() {
		elem = *((*unsafe.Pointer)(elem))
	}
    
    // 返回elem地址，由汇编代码负责执行真正的写入操作
	return elem
}

删除

删除对应的底层函数是 runtime/map.mapdelete ，处理的思路非常相似，也是先判断各种情况，最后进行双重循环定位目标 cell，不再赘述了。

扩容

扩容过程较为复杂，总的来说，扩容分为增量扩容与等量扩容，前者有两种情况触发，一是在桶不够用时，即容量到达扩容因子时，二是在，后者是在桶空间较为稀疏时触发，作用不同。

需要注意的一点是，扩容并不是一次性完成的，而是渐进式的，在每次进行写入操作时搬运一部分元素，主要目的也是为了防止瞬时的性能抖动对整个应用造成影响。

等量扩容

等量扩容的目的是使得桶的数据密度不至于过小，想象一种极端场景，一个哈希表有1个位置，拉链出了100个bucket，但只有一个元素，它在最后一个桶（正常桶+溢出桶）的最后一个位置上，我们每次访问这个元素，都需要从头到尾扫描这n个桶，直到找到这个元素，显而易见，这样效率非常低，所以go语言运行时会动态修改这个大小，进行数据的紧缩，使得数据密度增大增大，既增加了效率，也减少了所需空间。

等量扩容的代码在 xxxxx，

主要做了这些事：

增量扩容

增量扩容的出现场景就是桶不够用，即容量到达了负载因子的限制大小，需要进行扩大，具体与hmap。b的大小有关：

当b《=15时，如果桶大小一旦超过这个值扩容
当b》15，如果桶大小大于2…………15次方就扩容

扩容时由于b的大小+1，所以掩码的低位位数会+1，最高位的0和1会把所有元素分到两个部分，在go中这两部分被命名为 evaluatex，evaluatey，

具体代码放在 xxxx，

总结

Go 语言的 map 使用了数组+链表实现的哈希表，引入了溢出桶的概念以及触发扩容的条件机制来减少桶的扩容，实现了平均 O(1) 的时间复杂度内访问元素，基本不会出现最坏的情况。

访问元素的大致流程时：经过哈希计算后，用低 B 位确定桶位置，高 8 位比对 tophash 找到偏移，再通过偏移找到 key/value，或者执行插入或者新增溢出桶等等逻辑。

不管你使用字面量的方式还是 make 的方式声明 map，都是对应底层的 hmap 结构，获得了一个指向 hmap 的指针，并且 Go 语言针对不给出初始大小的 map 还进行了快速初始化的优化，针对 map 的大小过大（hmap.B 大于4），提前建立溢出桶的优化。

Go 提供了两种方式访问 map 中的元素，可以获得两个返回值，第二个返回值可以忽略，这用于空键值对的判断，类似于数据库中的 NULL，不和任何值冲突。并且 map 的遍历访问是随机的，这是因为每次遍历时会通过 fastrand 生成一个随机数，随机选择一个桶，再随机选择桶中的一个元素，先遍历完该桶，再顺次遍历后续的桶。map 是可以并发访问（指读）的，因为这并不会有任何冲突发生。