你好,我是倪朋飞。
上一节我们学习了 Linux 磁盘 I/O 的工作原理,并了解了由文件系统层、通用块层和设备层构成的 Linux 存储系统 I/O 栈。
其中,通用块层是 Linux 磁盘 I/O 的核心。向上,它为文件系统和应用程序,提供访问了块设备的标准接口;向下,把各种异构的磁盘设备,抽象为统一的块设备,并会对文件系统和应用程序发来的 I/O 请求,进行重新排序、请求合并等,提高了磁盘访问的效率。
掌握了磁盘 I/O 的工作原理,你估计迫不及待想知道,怎么才能衡量磁盘的 I/O 性能。
接下来,我们就来看看,磁盘的性能指标,以及观测这些指标的方法。
磁盘性能指标
说到磁盘性能的衡量标准,必须要提到五个常见指标,也就是我们经常用到的,使用率、饱和度、IOPS、吞吐量以及响应时间等。这五个指标,是衡量磁盘性能的基本指标。
-
使用率,是指磁盘处理I/O的时间百分比。过高的使用率(比如超过80%),通常意味着磁盘 I/O 存在性能瓶颈。
-
饱和度,是指磁盘处理 I/O 的繁忙程度。过高的饱和度,意味着磁盘存在严重的性能瓶颈。当饱和度为 100% 时,磁盘无法接受新的 I/O 请求。
-
IOPS(Input/Output Per Second),是指每秒的 I/O 请求数。
-
吞吐量,是指每秒的 I/O 请求大小。
-
响应时间,是指 I/O 请求从发出到收到响应的间隔时间。
这里要注意的是,使用率只考虑有没有 I/O,而不考虑 I/O 的大小。换句话说,当使用率是 100% 的时候,磁盘依然有可能接受新的 I/O 请求。
这些指标,很可能是你经常挂在嘴边的,一讨论磁盘性能必定提起的对象。不过我还是要强调一点,不要孤立地去比较某一指标,而要结合读写比例、I/O类型(随机还是连续)以及 I/O 的大小,综合来分析。
举个例子,在数据库、大量小文件等这类随机读写比较多的场景中,IOPS 更能反映系统的整体性能;而在多媒体等顺序读写较多的场景中,吞吐量才更能反映系统的整体性能。
一般来说,我们在为应用程序的服务器选型时,要先对磁盘的 I/O 性能进行基准测试,以便可以准确评估,磁盘性能是否可以满足应用程序的需求。
这一方面,我推荐用性能测试工具 fio ,来测试磁盘的IOPS、吞吐量以及响应时间等核心指标。但还是那句话,因地制宜,灵活选取。在基准测试时,一定要注意根据应用程序 I/O 的特点,来具体评估指标。
当然,这就需要你测试出,不同 I/O 大小(一般是 512B 至 1MB 中间的若干值)分别在随机读、顺序读、随机写、顺序写等各种场景下的性能情况。
用性能工具得到的这些指标,可以作为后续分析应用程序性能的依据。一旦发生性能问题,你就可以把它们作为磁盘性能的极限值,进而评估磁盘 I/O 的使用情况。
了解磁盘的性能指标,只是我们I/O性能测试的第一步。接下来,又该用什么方法来观测它们呢?这里,我给你介绍几个常用的I/O性能观测方法。
磁盘I/O观测
第一个要观测的,是每块磁盘的使用情况。
iostat 是最常用的磁盘I/O性能观测工具,它提供了每个磁盘的使用率、IOPS、吞吐量等各种常见的性能指标,当然,这些指标实际上来自 /proc/diskstats。
iostat 的输出界面如下。
# -d -x表示显示所有磁盘I/O的指标
$ iostat -d -x 1
Device r/s w/s rkB/s wkB/s rrqm/s wrqm/s %rrqm %wrqm r_await w_await aqu-sz rareq-sz wareq-sz svctm %util
loop0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
loop1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sda 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sdb 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
从这里你可以看到,iostat 提供了非常丰富的性能指标。第一列的 Device 表示磁盘设备的名字,其他各列指标,虽然数量较多,但是每个指标的含义都很重要。为了方便你理解,我把它们总结成了一个表格。

这些指标中,你要注意:
-
%util ,就是我们前面提到的磁盘I/O使用率;
-
r/s+ w/s ,就是 IOPS;
-
rkB/s+wkB/s ,就是吞吐量;
-
r_await+w_await ,就是响应时间。
在观测指标时,也别忘了结合请求的大小( rareq-sz 和wareq-sz)一起分析。
你可能注意到,从 iostat 并不能直接得到磁盘饱和度。事实上,饱和度通常也没有其他简单的观测方法,不过,你可以把观测到的,平均请求队列长度或者读写请求完成的等待时间,跟基准测试的结果(比如通过 fio)进行对比,综合评估磁盘的饱和情况。
进程I/O观测
除了每块磁盘的 I/O 情况,每个进程的 I/O 情况也是我们需要关注的重点。
上面提到的 iostat 只提供磁盘整体的 I/O 性能数据,缺点在于,并不能知道具体是哪些进程在进行磁盘读写。要观察进程的I/O情况,你还可以使用 pidstat 和 iotop 这两个工具。
pidstat 是我们的老朋友了,这里我就不再啰嗦它的功能了。给它加上 -d 参数,你就可以看到进程的I/O情况,如下所示:
$ pidstat -d 1
13:39:51 UID PID kB_rd/s kB_wr/s kB_ccwr/s iodelay Command
13:39:52 102 916 0.00 4.00 0.00 0 rsyslogd
从pidstat的输出你能看到,它可以实时查看每个进程的I/O情况,包括下面这些内容。
-
用户ID(UID)和进程ID(PID) 。
-
每秒读取的数据大小(kB_rd/s) ,单位是 KB。
-
每秒发出的写请求数据大小(kB_wr/s) ,单位是 KB。
-
每秒取消的写请求数据大小(kB_ccwr/s) ,单位是 KB。
-
块I/O延迟(iodelay),包括等待同步块I/O和换入块I/O结束的时间,单位是时钟周期。
除了可以用 pidstat 实时查看,根据 I/O 大小对进程排序,也是性能分析中一个常用的方法。这一点,我推荐另一个工具, iotop。它是一个类似于 top 的工具,你可以按照 I/O 大小对进程排序,然后找到I/O较大的那些进程。
iotop 的输出如下所示:
$ iotop
Total DISK READ : 0.00 B/s | Total DISK WRITE : 7.85 K/s
Actual DISK READ: 0.00 B/s | Actual DISK WRITE: 0.00 B/s
TID PRIO USER DISK READ DISK WRITE SWAPIN IO> COMMAND
15055 be/3 root 0.00 B/s 7.85 K/s 0.00 % 0.00 % systemd-journald
从这个输出,你可以看到,前两行分别表示,进程的磁盘读写大小总数和磁盘真实的读写大小总数。因为缓存、缓冲区、I/O合并等因素的影响,它们可能并不相等。
剩下的部分,则是从各个角度来分别表示进程的I/O情况,包括线程ID、I/O优先级、每秒读磁盘的大小、每秒写磁盘的大小、换入和等待I/O的时钟百分比等。
这两个工具,是我们分析磁盘 I/O 性能时最常用到的。你先了解它们的功能和指标含义,具体的使用方法,接下来的案例实战中我们一起学习。
小结
今天,我们梳理了 Linux 磁盘 I/O 的性能指标和性能工具。我们通常用IOPS、吞吐量、使用率、饱和度以及响应时间等几个指标,来评估磁盘的 I/O 性能。
你可以用 iostat 获得磁盘的 I/O 情况,也可以用 pidstat、iotop 等观察进程的 I/O 情况。不过在分析这些性能指标时,你要注意结合读写比例、I/O 类型以及 I/O 大小等,进行综合分析。
思考
最后,我想请你一起来聊聊,你碰到过的磁盘 I/O 问题。在碰到磁盘 I/O 性能问题时,你是怎么分析和定位的呢?你可以结合今天学到的磁盘 I/O 指标和工具,以及上一节学过的磁盘 I/O 原理,来总结你的思路。
欢迎在留言区和我讨论,也欢迎把这篇文章分享给你的同事、朋友。我们一起在实战中演练,在交流中进步。
精选留言
2019-01-17 08:26:29
总结:
磁盘性能检测指标:
使用率:磁盘处理I/O的时间百分比,使用率只考虑有没有I/O,不考虑I/O的大小。注意当使用率为100%时,由于可能存在并行I/O,磁盘并不一定饱和,所以磁盘仍然可能接收新的I/O请求
饱和度:磁盘处理I/O的繁忙程度,注意当饱和度为100%时,磁盘不能接收新的I/O请求
吞吐量:每秒I/O请求大小
IOPS:Input/Output Per Second 每秒的I/O请求数
响应时间:I/O请求从发出到收到响应的间隔时间
不孤立比较某项指标,结合读写比例、I/O类型(随机还是连续)以及I/O大小综合分析
例如:随机读写:多关注IOPS
连续读写:多关注吞吐量
服务器选型时,对磁盘I/O性能进行基础测试,使用 fio
磁盘I/O观测:iostat
进程I/O观测:pidstat,iotop
指导:遇到I/O性能时,先通过iostat查看磁盘整体性能,然后用pidstat或iotop定位到具体的进程
疑惑:
对磁盘的使用率和饱和度还是没太理解,比如说磁盘的使用率达到100%,由于并行I/O,不一定饱和了,所以还可能接收新的I/O请求,还希望老师再指点下。
2019-01-16 10:33:44
2019-01-16 08:00:41
2019-04-03 08:57:12
2019-01-21 18:45:05
2019-01-16 08:17:00
之前都没用过fio测试磁盘实际性能,基本都是依赖磁盘型号查官网数据作为依据~
iostat和iotop倒是会经常用,之前有几列输出的内容自己理解有偏差,这下算是纠正过来了💪
2019-01-18 13:32:20
对这句表述有怀疑。
r_await、w_await分别是读、写请求的平均等待时间,二者相加什么都不是。因为a/b + c/d不等于(a+c)/(b+d)。
2019-02-10 21:11:45
2019-01-25
2
"r_await+w_await ,就是响应时间"
对这句表述有怀疑。
r_await、w_await分别是读、写请求的平均等待时间,二者相加什么都不是。因为a/b + c/d不等于(a+c)/(b+d)。
展开
作者回复: 从公式上是这样,但间隔时间相同的时候呢?
man手册解释await是平均等待时间,我理解意思是toal wait time / total req number,跟间隔时间无关
-----------------------------------------------
"r_await、w_await分别是读、写请求的平均等待时间"基于读写的平均等待时间没错,但是结果也是基于一定的时间范围内的,比如说过去1s,过去5s,显然间隔时间无论设置成多少,都是一样的.
即a/t + b/t = (a+b)/t
2019-01-25 11:37:37
对这句表述有怀疑。
r_await、w_await分别是读、写请求的平均等待时间,二者相加什么都不是。因为a/b + c/d不等于(a+c)/(b+d)。
展开
作者回复: 从公式上是这样,但间隔时间相同的时候呢?
man手册解释await是平均等待时间,我理解意思是toal wait time / total req number,跟间隔时间无关
2019-11-15 16:21:19
2019-03-24 21:19:34
2022-09-07 09:06:16
2019-03-24 15:44:36
2019-01-17 16:58:23
2022-11-08 00:02:33
2022-02-17 11:32:36
%util ,就是我们前面提到的磁盘 I/O 使用率;
---------------------------------------
man手册对%util的解释:Percentage of elapsed time during which I/O requests were issued to the device (bandwidth utilization for the device). Device saturation occurs when this value is close to 100%.
向设备发出I/O请求所用的时间百分比(设备的带宽利用率)。当该值接近100%时,设备饱和。
换成公式的话,就是: 请求时间/(请求时间+io处理时间)
2022-02-17 11:30:04
-----------------------------
man手册对%util的解释
2021-09-08 22:49:05
2021-09-02 19:16:34
每秒IO请求数,每秒IO请求大小,这该咋区分
2021-08-29 17:54:33
观测命令。到是让我觉得,可以看一个进程打日志的速率。评估下磁盘容量了。或者优化程序中没必要的日志打印。
还有看打日志多的进程。