【技术创作101训练营】Linux服务器的晴雨表—top命令

时间:2022-07-25
本文章向大家介绍【技术创作101训练营】Linux服务器的晴雨表—top命令,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

虽然之前一直在使用top命令,但是从没有像今天这样认真细致总结每条数据代表的含义。

准备

Liunx系统下输入下面这条命令:

top

视图

日常开发中熟悉的视图再次映入眼底:

介绍

视图前五行是当前系统情况整体的统计信息区。

统计信息区

统计信息区

第一行: 任务队列信息

uptime 命令的执行结果相同,具体参数说明情况如下:

  • 14:04:16 — 当前系统时间
  • up 145 days, 14:24 — 系统已经运行了145天14小时24分钟(在这期间系统没有重启过)
  • 1 user — 当前有1个用户登录系统
  • load average: 1.15, 1.42, 1.44 — load average后面的三个数分别是1分钟、5分钟、15分钟的负载情况。
  • load average数据是每隔5秒钟检查一次活跃的进程数,然后按特定算法计算出的数值。如果这个数除以逻辑CPU的数量,结果高于5的时候就表明系统在超负荷运转了。

第二行: Tasks — 任务(进程)

系统现在共有447个进程,其中处于运行中的有1个,445个在休眠(sleep),stoped状态的有0个,zombie状态(僵尸)的有1个。

第三行: cpu状态信息

  • 40.1%us — 用户空间占用CPU的百分比(user cpu time)。
  • 9.7% sy — 内核空间占用CPU的百分比(system cpu time)。
  • 0.0% ni — 改变过优先级的进程占用CPU的百分比(user nice cpu time
  • 48.9% id — 空闲CPU百分比(idle cpu time
  • 0.2% wa — IO等待占用CPU的百分比(io wait cpu time
  • 0.0% hi — 硬中断占用CPU的百分比(hardware irq
  • 1.0% si — 软中断占用CPU的百分比(software irq
  • 0.0% st — “窃取时间”仅与虚拟化环境相关。它表示真正的CPU对当前虚拟机不可用的时间-虚拟机管理程序从该VM“偷走”了该CPU(用于运行另一个VM,或用于其自身需求)(steal time) 备注:在这里CPU的使用比率和windows概念不同,需要理解linux系统用户空间和内核空间的相关知识!

第四行: 内存状态

  • 13175904+ total — 物理内存总量(130GB)
  • 52304008 free — 空闲内存总量(52GB)
  • 78647840 used — 使用中的内存总量(78GB)
  • 807188 buffer/cache — 缓存的内存量 (807M)第五行: swap交换分区信息 在Linux中,内存一共分为两块:物理内存 和 交换区。物理内存是真正的内存,而内存资源毕竟有限,因此当物理内存不够的时候,根据LRU置换算法,那些很长时间没被使用的数据将会被存入交换区。交换区其实是硬盘,并非内存。当交换区存在数据时说明物理内存不够了。
  • 10485756 total — 交换区总量(10GB)
  • 6848920 free — 空闲交换区总量(6GB)
  • 3636836 used — 使用的交换区总量(3GB)
  • 52299332k avail Mem — 虚拟内存总量(3.6GB)

第四行中使用中的内存总量(used)指的是现在系统内核控制的内存数,空闲内存总量(free)是内核还未纳入其管控范围的数量。纳入内核管理的内存不见得都在使用中,还包括过去使用过的现在可以被重复利用的内存,内核并不把这些可被重新使用的内存交还到free中去,因此在linux上free内存会越来越少,但不用为此担心。

如果出于习惯去计算可用内存数,这里有个近似的计算公式:第四行的free + 第四行的buffers + 第五行的avail Mem,按这个公式此台服务器的可用内存。

对于内存监控,在top里我们要时刻监控第五行swap交换分区的used,如果这个数值在不断的变化,说明内核在不断进行内存和swap的数据交换,这是真正的内存不够用了。

进程状态监控

  • PID — 进程idcat /proc/cpuinfo | grep "physical id" | sort | uniq
    有几个不一样的physical id就代表有几个物理cpu。显示完整命令使用如下命令top -c即可显示命令名称和完整命令行
  • USER — 进程所有者
  • PR — 进程优先级
  • NI — nice值。负值表示高优先级,正值表示低优先级
  • VIRT — 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
  • RES — 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
  • SHR — 共享内存大小,单位kb
  • S — 进程状态。D=不可中断的睡眠状态 R=运行 S=睡眠 T=跟踪/停止 Z=僵尸进程
  • %CPU — 上次更新到现在的CPU时间占用百分比
  • %MEM — 进程使用的物理内存百分比
  • TIME+ — 进程使用的CPU时间总计,单位1/100秒
  • COMMAND — 进程名称(命令名/命令行)实用技巧多U多核CPU监控
  • 在top基本视图中,按键盘数字“1”,可监控每个逻辑CPU的状况。再按数字键1,就会返回到top基本视图界面。
    可以看到,服务器有40个逻辑CPU,但实际上是2个物理cpu。我们通过如下命令查看物理CPU个数:

总结

可以看出,top虽然简短(容易记住),却“神通广大”,可以帮助我们迅速掌握当前Linux系统运行状况,是一个不可多得的命令,大家日常开发中可以将其作为随身利器乘风破浪,披荆斩棘。