33 | 临时对象池sync.Pool

到目前为止，我们已经一起学习了Go语言标准库中最重要的那几个同步工具，这包括非常经典的互斥锁、读写锁、条件变量和原子操作，以及Go语言特有的几个同步工具：

sync/atomic.Value；
sync.Once；
sync.WaitGroup
context.Context。

今天，我们来讲Go语言标准库中的另一个同步工具：sync.Pool。

sync.Pool类型可以被称为临时对象池，它的值可以被用来存储临时的对象。与Go语言的很多同步工具一样，sync.Pool类型也属于结构体类型，它的值在被真正使用之后，就不应该再被复制了。

这里的“临时对象”的意思是：不需要持久使用的某一类值。这类值对于程序来说可有可无，但如果有的话会明显更好。它们的创建和销毁可以在任何时候发生，并且完全不会影响到程序的功能。

同时，它们也应该是无需被区分的，其中的任何一个值都可以代替另一个。如果你的某类值完全满足上述条件，那么你就可以把它们存储到临时对象池中。

你可能已经想到了，我们可以把临时对象池当作针对某种数据的缓存来用。实际上，在我看来，临时对象池最主要的用途就在于此。

sync.Pool类型只有两个方法——Put和Get。Put用于在当前的池中存放临时对象，它接受一个interface{}类型的参数；而Get则被用于从当前的池中获取临时对象，它会返回一个interface{}类型的值。

更具体地说，这个类型的Get方法可能会从当前的池中删除掉任何一个值，然后把这个值作为结果返回。如果此时当前的池中没有任何值，那么这个方法就会使用当前池的New字段创建一个新值，并直接将其返回。

sync.Pool类型的New字段代表着创建临时对象的函数。它的类型是没有参数但有唯一结果的函数类型，即：func() interface{}。

这个函数是Get方法最后的临时对象获取手段。Get方法如果到了最后，仍然无法获取到一个值，那么就会调用该函数。该函数的结果值并不会被存入当前的临时对象池中，而是直接返回给Get方法的调用方。

这里的New字段的实际值需要我们在初始化临时对象池的时候就给定。否则，在我们调用它的Get方法的时候就有可能会得到nil。所以，sync.Pool类型并不是开箱即用的。不过，这个类型也就只有这么一个公开的字段，因此初始化起来也并不麻烦。

举个例子。标准库代码包fmt就使用到了sync.Pool类型。这个包会创建一个用于缓存某类临时对象的sync.Pool类型值，并将这个值赋给一个名为ppFree的变量。这类临时对象可以识别、格式化和暂存需要打印的内容。

var ppFree = sync.Pool{
 New: func() interface{} { return new(pp) },
}

临时对象池ppFree的New字段在被调用的时候，总是会返回一个全新的pp类型值的指针（即临时对象）。这就保证了ppFree的Get方法总能返回一个可以包含需要打印内容的值。

pp类型是fmt包中的私有类型，它有很多实现了不同功能的方法。不过，这里的重点是，它的每一个值都是独立的、平等的和可重用的。

更具体地说，这些对象既互不干扰，又不会受到外部状态的影响。它们几乎只针对某个需要打印内容的缓冲区而已。由于fmt包中的代码在真正使用这些临时对象之前，总是会先对其进行重置，所以它们并不在意取到的是哪一个临时对象。这就是临时对象的平等性的具体体现。

另外，这些代码在使用完临时对象之后，都会先抹掉其中已缓冲的内容，然后再把它存放到ppFree中。这样就为重用这类临时对象做好了准备。

众所周知的fmt.Println、fmt.Printf等打印函数都是如此使用ppFree，以及其中的临时对象的。因此，在程序同时执行很多的打印函数调用的时候，ppFree可以及时地把它缓存的临时对象提供给它们，以加快执行的速度。

而当程序在一段时间内不再执行打印函数调用时，ppFree中的临时对象又能够被及时地清理掉，以节省内存空间。

显然，在这个维度上，临时对象池可以帮助程序实现可伸缩性。这就是它的最大价值。

我想，到了这里你已经清楚了临时对象池的基本功能、使用方式、适用场景和存在意义。我们下面来讨论一下它的一些内部机制，这样，我们就可以更好地利用它做更多的事。

首先，我来问你一个问题。这个问题很可能也是你想问的。今天的问题是：为什么说临时对象池中的值会被及时地清理掉？

这里的典型回答是：因为，Go语言运行时系统中的垃圾回收器，所以在每次开始执行之前，都会对所有已创建的临时对象池中的值进行全面地清除。

问题解析

我在前面已经向你讲述了临时对象会在什么时候被创建，下面我再来详细说说它会在什么时候被销毁。

sync包在被初始化的时候，会向Go语言运行时系统注册一个函数，这个函数的功能就是清除所有已创建的临时对象池中的值。我们可以把它称为池清理函数。

一旦池清理函数被注册到了Go语言运行时系统，后者在每次即将执行垃圾回收时就都会执行前者。

另外，在sync包中还有一个包级私有的全局变量。这个变量代表了当前的程序中使用的所有临时对象池的汇总，它是元素类型为*sync.Pool的切片。我们可以称之为池汇总列表。

通常，在一个临时对象池的Put方法或Get方法第一次被调用的时候，这个池就会被添加到池汇总列表中。正因为如此，池清理函数总是能访问到所有正在被真正使用的临时对象池。

更具体地说，池清理函数会遍历池汇总列表。对于其中的每一个临时对象池，它都会先将池中所有的私有临时对象和共享临时对象列表都置为nil，然后再把这个池中的所有本地池列表都销毁掉。

最后，池清理函数会把池汇总列表重置为空的切片。如此一来，这些池中存储的临时对象就全部被清除干净了。

如果临时对象池以外的代码再无对它们的引用，那么在稍后的垃圾回收过程中，这些临时对象就会被当作垃圾销毁掉，它们占用的内存空间也会被回收以备他用。

以上，就是我对临时对象清理的进一步说明。首先需要记住的是，池清理函数和池汇总列表的含义，以及它们起到的关键作用。一旦理解了这些，那么在有人问到你这个问题的时候，你应该就可以从容地应对了。

不过，我们在这里还碰到了几个新的词，比如：私有临时对象、共享临时对象列表和本地池。这些都代表着什么呢？这就涉及了下面的问题。

知识扩展

问题1：临时对象池存储值所用的数据结构是怎样的？

在临时对象池中，有一个多层的数据结构。正因为有了它的存在，临时对象池才能够非常高效地存储大量的值。

这个数据结构的顶层，我们可以称之为本地池列表，不过更确切地说，它是一个数组。这个列表的长度，总是与Go语言调度器中的P的数量相同。

还记得吗？Go语言调度器中的P是processor的缩写，它指的是一种可以承载若干个G、且能够使这些G适时地与M进行对接，并得到真正运行的中介。

这里的G正是goroutine的缩写，而M则是machine的缩写，后者指代的是系统级的线程。正因为有了P的存在，G和M才能够进行灵活、高效的配对，从而实现强大的并发编程模型。

P存在的一个很重要的原因是为了分散并发程序的执行压力，而让临时对象池中的本地池列表的长度与P的数量相同的主要原因也是分散压力。这里所说的压力包括了存储和性能两个方面。在说明它们之前，我们先来探索一下临时对象池中的那个数据结构。

在本地池列表中的每个本地池都包含了三个字段（或者说组件），它们是：存储私有临时对象的字段private、代表了共享临时对象列表的字段shared，以及一个sync.Mutex类型的嵌入字段。

sync.Pool中的本地池与各个G的对应关系

实际上，每个本地池都对应着一个P。我们都知道，一个goroutine要想真正运行就必须先与某个P产生关联。也就是说，一个正在运行的goroutine必然会关联着某个P。

在程序调用临时对象池的Put方法或Get方法的时候，总会先试图从该临时对象池的本地池列表中，获取与之对应的本地池，依据的就是与当前的goroutine关联的那个P的ID。

换句话说，一个临时对象池的Put方法或Get方法会获取到哪一个本地池，完全取决于调用它的代码所在的goroutine关联的那个P。

既然说到了这里，那么紧接着就会有下面这个问题。

问题 2：临时对象池是怎样利用内部数据结构来存取值的？

临时对象池的Put方法总会先试图把新的临时对象，存储到对应的本地池的private字段中，以便在后面获取临时对象的时候，可以快速地拿到一个可用的值。

只有当这个private字段已经存有某个值时，该方法才会去访问本地池的shared字段。

相应的，临时对象池的Get方法，总会先试图从对应的本地池的private字段处获取一个临时对象。只有当这个private字段的值为nil时，它才会去访问本地池的shared字段。

一个本地池的shared字段原则上可以被任何goroutine中的代码访问到，不论这个goroutine关联的是哪一个P。这也是我把它叫做共享临时对象列表的原因。

相比之下，一个本地池的private字段，只可能被与之对应的那个P所关联的goroutine中的代码访问到，所以可以说，它是P级私有的。

以临时对象池的Put方法为例，它一旦发现对应的本地池的private字段已存有值，就会去访问这个本地池的shared字段。当然，由于shared字段是共享的，所以此时必须受到互斥锁的保护。

还记得本地池嵌入的那个sync.Mutex类型的字段吗？它就是这里用到的互斥锁，也就是说，本地池本身就拥有互斥锁的功能。Put方法会在互斥锁的保护下，把新的临时对象追加到共享临时对象列表的末尾。

相应的，临时对象池的Get方法在发现对应本地池的private字段未存有值时，也会去访问后者的shared字段。它会在互斥锁的保护下，试图把该共享临时对象列表中的最后一个元素值取出并作为结果。

不过，这里的共享临时对象列表也可能是空的，这可能是由于这个本地池中的所有临时对象都已经被取走了，也可能是当前的临时对象池刚被清理过。

无论原因是什么，Get方法都会去访问当前的临时对象池中的所有本地池，它会去逐个搜索它们的共享临时对象列表。

只要发现某个共享临时对象列表中包含元素值，它就会把该列表的最后一个元素值取出并作为结果返回。

从sync.Pool中获取临时对象的步骤

当然了，即使这样也可能无法拿到一个可用的临时对象，比如，在所有的临时对象池都刚被大清洗的情况下就会是如此。

这时，Get方法就会使出最后的手段——调用可创建临时对象的那个函数。还记得吗？这个函数是由临时对象池的New字段代表的，并且需要我们在初始化临时对象池的时候给定。如果这个字段的值是nil，那么Get方法此时也只能返回nil了。

以上，就是我对这个问题的较完整回答。

总结

今天，我们一起讨论了另一个比较有用的同步工具——sync.Pool类型，它的值被我称为临时对象池。

临时对象池有一个New字段，我们在初始化这个池的时候最好给定它。临时对象池还拥有两个方法，即：Put和Get，它们分别被用于向池中存放临时对象，和从池中获取临时对象。

临时对象池中存储的每一个值都应该是独立的、平等的和可重用的。我们应该既不用关心从池中拿到的是哪一个值，也不用在意这个值是否已经被使用过。

要完全做到这两点，可能会需要我们额外地写一些代码。不过，这个代码量应该是微乎其微的，就像fmt包对临时对象池的用法那样。所以，在选用临时对象池的时候，我们必须要把它将要存储的值的特性考虑在内。

在临时对象池的内部，有一个多层的数据结构支撑着对临时对象的存储。它的顶层是本地池列表，其中包含了与某个P对应的那些本地池，并且其长度与P的数量总是相同的。

在每个本地池中，都包含一个私有的临时对象和一个共享的临时对象列表。前者只能被其对应的P所关联的那个goroutine中的代码访问到，而后者却没有这个约束。从另一个角度讲，前者用于临时对象的快速存取，而后者则用于临时对象的池内共享。

正因为有了这样的数据结构，临时对象池才能够有效地分散存储压力和性能压力。同时，又因为临时对象池的Get方法对这个数据结构的妙用，才使得其中的临时对象能够被高效地利用。比如，该方法有时候会从其他的本地池的共享临时对象列表中，“偷取”一个临时对象。

这样的内部结构和存取方式，让临时对象池成为了一个特点鲜明的同步工具。它存储的临时对象都应该是拥有较长生命周期的值，并且，这些值不应该被某个goroutine中的代码长期的持有和使用。

因此，临时对象池非常适合用作针对某种数据的缓存。从某种角度讲，临时对象池可以帮助程序实现可伸缩性，这也正是它的最大价值。

思考题

今天的思考题是：怎样保证一个临时对象池中总有比较充足的临时对象？

请从临时对象池的初始化和方法调用两个方面作答。必要时可以参考fmt包以及demo70.go文件中使用临时对象池的方式。

感谢你的收听，我们下次再见。

戳此查看Go语言专栏文章配套详细代码。

精选留言

虢國技醬

2020-01-09 10:49:03

go1.13对本地池的shared共享列表做了存储结构变更,改为双向链表（在shared的头部存，尾部取），取消锁以提高性能
数字记忆

2019-11-20 11:43:18

这个代码很形象：

package main

import (
"fmt"
"sync"
"time"
)

// 一个[]byte的对象池，每个对象为一个[]byte
var bytePool = sync.Pool{
New: func() interface{} {
b := make([]byte, 1024)
return &b
},
}

func main() {
a := time.Now().Unix()
fmt.Println(a)
// 不使用对象池
for i := 0; i < 1000000000; i++{
obj := make([]byte,1024)
_ = obj
}
b := time.Now().Unix()
fmt.Println(b)
// 使用对象池
for i := 0; i < 1000000000; i++{
obj := bytePool.Get().(*[]byte)
_ = obj
bytePool.Put(obj)
}
c := time.Now().Unix()
fmt.Println(c)
fmt.Println("without pool ", b - a, "s")
fmt.Println("with pool ", c - b, "s")
}

// run时禁用掉编译器优化，才会体现出有pool的优势
// go run -gcflags="-l -N" testSyncPool1.go
到不了的塔

2018-11-17 15:13:30

临时对象池初始化时指定new字段对应的函数返回一个新建临时对象；
临时对象使用完毕时调用临时对象池的put方法，把该临时对象put回临时对象池中。
这样就能保证一个临时对象池中总有比较充足的临时对象。
Stone

2020-07-09 15:29:18

看了一下 1.14 的源码，那个锁现在是全局的了，即一个临时对象池中本地池列表中的所有本地池都共享一个锁，而不是每个本地池都有自己的锁。

作者回复

这么说也不准确。看这行源码：

shared poolChain

poolChain 这个类型的方法会动用原子操作。

再看这行源码：

var allPoolsMu Mutex

allPoolsMu 会保护单一程序中的所有 sync.Pool，而不是某一个 Pool 的本地池。

然而，sync.Pool 只会在获取 P 的 ID 以及查找对应的本地池的时候才会动用 allPoolsMu，而在操作本地池的时候没有用。

所以，综上来看，本地池的操作已经通过更好的设计去掉了互斥锁，改为原子操作，同时仅在必要时（也就是定位本地池时）短暂动用互斥锁。

我没去看新 Pool 的性能测试，但是相信一定又有了不小的性能提升。

2020-07-10 12:12:34
张sir

2019-05-21 11:17:28

还有一个问题，如果多goruntine同时申请临时对象池内资源，所有goruntine都可以同时获取到吗，还是只能有一个goruntine获取到，其它的goruntine都阻塞，直到这个goruntine释放完后才能使用

作者回复

我大概明白你的意思。这篇文章你可能还没有仔细看。

你需要先搞清楚（以下内容在文章里都有）：

在涉及到本地池的 shared 字段的时候会有锁，但是这种锁是分段锁，也就是说，每个本地池都会有自己的锁。

因此，在对应某个 P 的本地池的锁处于锁定状态的时候，所有正试图访问（不论是 Get 还是 Put）这个本地池的 goroutine 都会被阻塞。

一个临时对象池拥有的本地池的数量与 P 的数量相同。所以，即使有 goroutine 因此被阻塞，往往也只是少数。又因为分段锁的缘故，它们被锁住的时间一般也是很短暂的。

当你知道了这些，你就会明白，临时对象池在并发访问方面是很高效的。

再结合我在专栏里揭示的访问步骤和细节，你应该就可以搞懂你问的问题了。

2019-05-21 13:51:30
小罗希冀

2020-10-26 23:02:05

请问一下老师, 如果syn.Pool广泛的应用场景是缓存, 那为什么不直接使用map缓存呢?这样岂不是更方便, 更快捷?

作者回复

你这句话的前后逻辑不通啊，sync.Pool 和 map 是两个东西啊，它们的适用场景完全不一样啊。

sync.Pool 用于缓存“可交换”、“可遗失”的对象。可交换的意思是就是，我用对象 A 也可以，用对象 B 也可以，无所谓。可遗失的意思是，存在里边的对象没了就没了，无所谓，我再创建一个就是了。

map 如果用作缓存的话，其中的元素值是“不可交换”的，通常也是“不可遗失”的（或者说对遗失敏感的）。你思考一下。

2020-10-27 10:33:53
虢國技醬

2019-11-29 14:35:36

二刷
郭星

2020-09-03 17:34:12

"在每个本地池中，都包含一个私有的临时对象和一个共享的临时对象列表。前者只能被其对应的 P 所关联的那个 goroutine 中的代码访问到，而后者却没有这个约束"
对于private只能被当前协程才能访问,其他协程不能访问到private,这个应该怎么测试呢?
import (
"runtime"
"sync"
"testing"
)

type cache struct {
value int
}
func TestShareAndPrivate(t *testing.T) {
p := sync.Pool{}
// 在主协程写入10
p.Put(cache{value: 10})
var wg sync.WaitGroup
wg.Add(1)
go func() {
for i := 0; i < 10; i++ {
p.Put(cache{value: i})
}
wg.Done()
}()
wg.Wait()
wg.Add(1)
go func() {
for true {
v := p.Get()
if v == nil {
break
}
t.Log(v)
}
wg.Done()
}()
wg.Wait()
}
这段代码没有体现出来私有和共享的区别

作者回复

这个测试比较困难，私有临时对象主要是为了加速对象的存取，但是临时对象池**并不保证**返回给我的对象是按照固定顺序的，你可以认为是随机的。

我们也没必要测试，知道有这样一个加速优化就好了。

2020-09-04 11:48:27
越努力丨越幸运

2020-04-19 19:06:28

老师，当一个goroutine在访问某个临时对象池中一个本地池的shared字段时被锁住，此时另外一个goroutine访问临时对象池时，是会跳过这个本地池，去访问其他的本地池，还是说会被阻塞住？

作者回复

不会跳过，但是它用的不是锁，而是原子操作，因为存的都是指针。所以速度会非常快。

2020-04-20 10:50:20
鲲鹏飞九万里

2023-02-19 16:28:09

郝老师您好，你在article70.go 的示例中使用sync.Pool 的作用是啥呢，看不出来。你看：
func main() {
// buf := GetBuffer()
// defer buf.Free()
buf := &myBuffer{delimiter: delimiter}

在main函数中，我用`buf := &myBuffer{delimiter: delimiter}`这行代码代替上面两行代码后，执行的效果是一样的。 article70.go 的示例，为啥要使用 sync.Pool 呢，麻烦老师进一步讲解下

作者回复

你每次从这个 sync.Pool 当中，用 Get 方法获取 Buffer，都会得到一个存在于该池中的、已就绪的 Buffer 实例，而 Put 一个 Buffer 实例，则会把它归还给这个 sync.Pool。这是这里演示的 sync.Pool 的基本用法。

这里为了简单和直观，我就没有划分成两个代码包，你可以想象一下，bufPool 变量、Buffer 接口、myBuffer 结构体、GetBuffer 函数同在某一个代码包里面，而 main 函数则存在于另一个代码包里。如此一来，直接写成 &myBuffer{delimiter: delimiter} ，就等于把内部实现暴露给了外界，这样会在后期造成维护成本的增加，况且 myBuffer 还是包级私有的类型。

这里只是一个简单的演示，演示怎样利用 sync.Pool 存储一些可相互替换的同类对象，以供其他程序来高效的获取（Get）和归还（Put）对象。这个 sync.Pool 就是所谓的对象池，其内部实现得非常高效，用法也很简单，不是吗？我们就不用自己实现对象池了，用现成的就好了。

在这个示例中，还包含了一些“便捷函数”（如 GetBuffer 函数）和“便捷方法”（如 myBuffer 的 Free 方法），以方便外界更容易的使用这类 Buffer。

更具体地说，它隐藏了 bufPool 变量（假设该变量不在 main 函数所在的代码包里），并提供了简单调用一下就能获取一个 Buffer 实例的 GetBuffer 函数，以及用完某个 Buffer 就可以直接在它之上调用的 Free 方法（用于将该 Buffer 实例归还给 bufPool）。

总之，这是一种比较好的实现方式，提供给你们参考用的。

2023-02-19 20:28:38
小袁

2021-02-13 11:26:49

为啥本地池列表长度不是跟M一致，而是跟P一致？

作者回复

因为P是调度的核心啊，起到了衔接M和G的作用。P实际上也是“并发线”的根数，所以：若少于P数量则未充分利用并发机制，若多于P数量则加重了调度器的负担。

2021-02-18 13:16:27
Lywane

2020-03-31 18:12:09

直到看到最近两三章，我才体会到，老师就是在讲源码啊！对着源码学习课程，对着课程学习源码。事半功倍！！
闫飞

2019-07-17 08:20:46

这里存放的临时对象是否是无状态，无唯一标识符的纯值对象? 对象的类型是否都是一样，还是说必须要用户自己做好具体类型的判定?

作者回复

你放在一个池子里的实例最好是一个类型的，要不后面用的时候会很麻烦。

2019-07-18 11:14:13
苏安

2018-10-26 09:00:08

老师，不知道还有几讲，最初的课程大纲有相关的拾遗章节，不知道后续的安排还有没？

作者回复

我会讲完的，放心，预计45讲左右。

2018-11-06 13:28:11
Haij!

2022-08-25 01:06:07

fmt包为了识别、格式化和暂存需要打印的内容，定义了一个名为pp的结构体。调用不同的打印方法时，都需要一个pp的结构体介入逻辑进行处理；如果未使用sync.Pool，则每次均会通过new函数初始化pp类型的变量，这时会频繁申请内存。所以为避免每次需要时都调用pp的new方法申请内存，故基于sync.Pool创建一个临时对象池。当打印操作很活跃时，可以直接从池中获取pp结构体并使用；使用后抹取过程中的信息再存入。一方面可以利用“缓存”特性进行性能提升，避免频繁内存申请分配；另一方面可以借由sync.Pool初始时在运行时系统注册的cleanPool方法，及时清理空间，释放内存。
lesserror

2021-08-21 11:33:35

意外之喜，隔壁专栏鸟窝的《Go 并发编程实战课》对 sync.Pool 有了新的补充，这一讲有困惑的同学可以过去康康。
传说中的成大大

2020-04-16 20:16:26

之前学习 go routine的时候初次了解到这个p以为就是用来调度goroutine的但是今天又讨论到这个p 这个P还关联到了临时对象池，这个临时对象池也涉及到被运行时系统所清理所以我产生了以为这个p时候就是运行时系统呢？

作者回复

你要想了解Go语言的调度器，可与你参考我写的那本《Go并发编程实战》。（因为一句两句说不清楚）

2020-04-19 17:02:52
疯琴

2020-01-02 16:28:14

请问老师，demo70 的 37 行 return 后面没跟东西，是相当于 return nil 么？

作者回复

不是，是返回结果变量err的值。

2020-01-02 20:21:25
来碗绿豆汤

2018-10-28 20:27:12

是不是临时对象池里面最多有2p个临时对象
林嘉裕

2021-12-21 23:48:49

数组可以通过put(arr[:0])清空，如果是map呢？只能通过遍历？

作者回复

你要是真是想清空，重新 Put 一个空的 map 就好了啊，切片的话也可以这样操作。只要这个 map 或者 slice 再没有别的代码引用它了，GC 就会进行回收了。

2021-12-22 12:48:17