Linux服务器的晴雨表——top命令

虽然之前一直在使用top命令，但是并没有像今天这样认真细致总结每条数据代表的含义。

准备

Liunx系统下输入下面这条命令：

top

视图

日常开发中熟悉的视图再次映入眼底：

介绍

视图前五行是当前系统情况整体的统计信息区。

统计信息区

第一行: 任务队列信息

同uptime 命令的执行结果相同，具体参数说明情况如下：

14:04:16 — 当前系统时间
up 145 days, 14:24 — 系统已经运行了145天14小时24分钟（在这期间系统没有重启过）
1 user — 当前有1个用户登录系统
load average: 1.15, 1.42, 1.44 — load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况。
load average数据是每隔5秒钟检查一次活跃的进程数，然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量，结果高于5的时候就表明系统在超负荷运转了。

第二行: Tasks — 任务（进程）

系统现在共有447个进程，其中处于运行中的有1个，445个在休眠（sleep），stoped状态的有0个，zombie状态（僵尸）的有1个。

第三行: cpu状态信息

*40.1%us **— 用户空间占用CPU的百分比（user cpu time*）。
9.7% sy — 内核空间占用CPU的百分比（system cpu time）。
0.0% ni — 改变过优先级的进程占用CPU的百分比（user nice cpu time）
48.9% id — 空闲CPU百分比（idle cpu time）
0.2% wa — IO等待占用CPU的百分比（io wait cpu time）
0.0% hi — 硬中断占用CPU的百分比（hardware irq）
1.0% si — 软中断占用CPU的百分比（software irq）
0.0% st — “窃取时间”仅与虚拟化环境相关。它表示真正的CPU对当前虚拟机不可用的时间-虚拟机管理程序从该VM“偷走”了该CPU（用于运行另一个VM，或用于其自身需求）（steal time）

备注：在这里CPU的使用比率和windows概念不同，需要理解linux系统用户空间和内核空间的相关知识！

第四行: 内存状态

13175904+ total — 物理内存总量（130GB）
52304008 free — 空闲内存总量（52GB）
78647840 used — 使用中的内存总量（78GB）
807188 buffer/cache — 缓存的内存量（807M）

第五行: swap交换分区信息

在Linux中，内存一共分为两块：物理内存和交换区。物理内存是真正的内存，而内存资源毕竟有限，因此当物理内存不够的时候，根据LRU置换算法，那些很长时间没被使用的数据将会被存入交换区。交换区其实是硬盘，并非内存。当交换区存在数据时说明物理内存不够了。
10485756 total — 交换区总量（10GB）
6848920 free — 空闲交换区总量（6GB）
3636836 used — 使用的交换区总量（3GB）
52299332k avail Mem — 虚拟内存总量（3.6GB）

第四行中使用中的内存总量（used）指的是现在系统内核控制的内存数，空闲内存总量（free）是内核还未纳入其管控范围的数量。纳入内核管理的内存不见得都在使用中，还包括过去使用过的现在可以被重复利用的内存，内核并不把这些可被重新使用的内存交还到free中去，因此在linux上free内存会越来越少，但不用为此担心。
如果出于习惯去计算可用内存数，这里有个近似的计算公式：第四行的free + 第四行的buffers + 第五行的avail Mem，按这个公式此台服务器的可用内存。
对于内存监控，在top里我们要时刻监控第五行swap交换分区的used，如果这个数值在不断的变化，说明内核在不断进行内存和swap的数据交换，这是真正的内存不够用了。

进程状态监控

PID — 进程id
USER — 进程所有者
PR — 进程优先级
NI — nice值。负值表示高优先级，正值表示低优先级
VIRT — 进程使用的虚拟内存总量，单位kb。VIRT=SWAP+RES
RES — 进程使用的、未被换出的物理内存大小，单位kb。RES=CODE+DATA
SHR — 共享内存大小，单位kb
S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
%CPU — 上次更新到现在的CPU时间占用百分比
%MEM — 进程使用的物理内存百分比
TIME+ — 进程使用的CPU时间总计，单位1/100秒
COMMAND — 进程名称（命令名/命令行）
实用技巧
多U多核CPU监控
在top基本视图中，按键盘数字“1”，可监控每个逻辑CPU的状况。再按数字键1，就会返回到top基本视图界面。

可以看到，服务器有40个逻辑CPU，但实际上是2个物理cpu。我们通过如下命令查看物理CPU个数：
1
cat /proc/cpuinfo | grep "physical id" | sort | uniq
有几个不一样的physical id就代表有几个物理cpu。
显示完整命令
使用如下命令
1
top -c
即可显示命令名称和完整命令行
总结
可以看出，top虽然简短（容易记住），却“神通广大”，可以帮助我们迅速掌握当前Linux系统运行状况，是一个不可多得的命令，大家日常开发中可以将其作为随身利器乘风破浪，披荆斩棘。

准备

视图

介绍

统计信息区

第一行: 任务队列信息

第二行: Tasks — 任务（进程）

第三行: cpu状态信息

第四行: 内存状态

第五行: swap交换分区信息

进程状态监控

实用技巧

多U多核CPU监控

显示完整命令

总结