您的位置:首页 > 运维架构 > Linux

在LINUX中性能测试监控中常用的TOP命令中,部分字段代表的真正含义

2015-01-12 11:54 731 查看
在项目性能测试的中,经常需要监控服务器,DB服务器的各项计算器,其中在LINUX下我们最常用的命令实时查看命令TOP,用的最多,但真正对这一命令的各项值,确又了解甚微,甚至根本不知道这些值所代表的含义,及是如何得出来的:

在谷哥一些资料后,将其各项的字段所代表的含义及其来源,以做为记录:

在TOP命令中有一行CPU的中信息:us,sy,ni,wa,si,hi,st,其中us,sy,是CPU是用户态使用的CPU时间百分比,sy是系统使用CPU时间的百分比,ni是用做nice加权的进程分配用户态使用CPU时间的百分比,wa是CPU等待硬盘写入完成时间的百分比,hi是硬中断消耗时间百分比,si是软中断消耗时间的百分比,ST是虚拟机偷取时间的百分比,这些百分比的来源如下:



将文件从磁盘的src位置拷贝到磁盘的dst位置。文件会从src先读取进入到内核空间,然后再读取到用户空间,然后拷贝数据到用户空间的buf上,再通过用户空间,内核空间,数据才到磁盘的dst上。

所以从上面这个程序来看,cpu消耗在kernel space的时候就是sy(系统态使用的cpu百分比),cpu消耗在user space的时候就是us(用户态使用的cpu百分比)。

如果程序都没什么问题,那么是没有hi和si的,但是实际上有个硬中断和软中断的概念。比如硬中断,cpu在执行程序的时候,突然外设硬件(比如硬盘出现问题了)机器需要立刻通知cpu进行现场保存工作。这个时候会cpu会出现上下文切换。就是cpu会有一部分时间会被硬中断占用了,这个时间就是hi。相类似,si是软中断的cpu占用时间,软中断是由软件的指令方式触发的。

ni是nice的意思,nice是什么呢,每个linux进程都有个优先级,优先级高的进程有优先执行的权利,这个叫做pri。进程除了优先级外,还有个优先级的修正值。即比如你原先的优先级是20,然后修正值为-2,那么你最后的进程优先级为18。这个修正值就叫做进程的nice值。

wa指的是CPU等待磁盘写入完成的时间,就是说前提是要进行IO操作,在进行IO操作的时候,CPU等待时间。比如上面那个程序,最后一步,从系统空间到dst硬盘空间的时候,如果程序是阻塞的,那么这个时候cpu就要等待数据写入磁盘才能完成写操作了。所以这个时候cpu等待的时间就是wa。

st的名字很生动,偷取。。。是专门对虚拟机来说的,一台物理是可以虚拟化出几台虚拟机的。在其中一台虚拟机上用top查看发现st不为0,就说明本来有这么多个cpu时间是安排给我这个虚拟机的,但是由于某种虚拟技术,把这个cpu时间分配给了其他的虚拟机了。这就叫做偷取。

剩下的id就是除了上面那么多cpu处理上下文以外的cpu时间片。当然在这些时间片上,cpu是空闲的。

dstat命令

可以查看相应的字段的数据统计

%mem 内存使用率

virt 是虚拟内存

res是常驻内存

shr是共享内存

op命令下按f键可以看到详细说明

* A: PID = Process Id

* E: USER = User Name

* H: PR = Priority

* I: NI = Nice value

* O: VIRT = Virtual Image (kb)

* Q: RES = Resident size (kb)

* T: SHR = Shared Mem size (kb)

* W: S = Process Status

* K: %CPU = CPU usage

* N: %MEM = Memory usage (RES)

* M: TIME+ = CPU Time, hundredths

b: PPID = Parent Process Pid

c: RUSER = Real user name

d: UID = User Id

f: GROUP = Group Name

g: TTY = Controlling Tty

j: P = Last used cpu (SMP)

p: SWAP = Swapped size (kb)

l: TIME = CPU Time

r: CODE = Code size (kb)

s: DATA = Data+Stack size (kb)

u: nFLT = Page Fault count

v: nDRT = Dirty Pages count

y: WCHAN = Sleeping in Function

z: Flags = Task Flags <sched.h>

* X: COMMAND = Command name/line

top命令下要查看某个用户启动的进程:先输入u,然后输入用户名,再回车

VIRT:virtual memory usage。Virtual这个词很神,一般解释是:virtual adj.虚的, 实质的, [物]有效的, 事实上的。到底是虚的还是实的?让Google给Define之后,将就明白一点,就是这东西还是非物质的,但是有效果的,不发生在真实世界的,发生在软件世界的等等。这个内存使用就是一个应用占有的地址空间,只是要应用程序要求的,就全算在这里,而不管它真的用了没有。写程序怕出错,又不在乎占用的时候,多开点内存也是很正常的。

RES:resident memory usage。常驻内存。这个值就是该应用程序真的使用的内存,但还有两个小问题,一是有些东西可能放在交换盘上了(SWAP),二是有些内存可能是共享的。

SHR:shared memory。共享内存。就是说这一块内存空间有可能也被其他应用程序使用着;而Virt - Shr似乎就是这个程序所要求的并且没有共享的内存空间。

DATA:数据占用的内存。如果top没有显示,按f键可以显示出来。这一块是真正的该程序要求的数据空间,是真正在运行中要使用的。

============================================

top里面描述进程内存使用量的数据来源于/proc/$pid/statm这个文件。通过观察kernel的代码就能弄清楚SHR,VIRT和RES这些数值的具体含义。

Linux通过一个叫做 task_statm 的函数来返回进程的内存使用状况

int task_statm(struct mm_struct *mm, int *shared, int *text,

int *data, int *resident)

{

*shared = get_mm_counter(mm, file_rss);

*text = (PAGE_ALIGN(mm->end_code) - (mm->start_code & PAGE_MASK))

>> PAGE_SHIFT;

*data = mm->total_vm - mm->shared_vm;

*resident = *shared + get_mm_counter(mm, anon_rss);

return mm->total_vm;

}

上面的代码中shared就是page cache里面实际使用了的物理内存的页数,text是代码所占用的页

数,data是总虚拟内存页数减去共享的虚拟内存页数,resident是所有在使用的物理内存的页

数。最后返回的mm->total_vm是进程虚拟内存的寻址空间大小。

函数get_mm_counter并不会做什么计算,它的功能是保证数值读取的原子性。

上面的数值最后会通过 procfs输出 到/proc/$pid/statm中去。他们与top显示的数值对应关系如下。

SHR: shared

RES: resident

VIRT: mm->total_vm

CODE: code

DATA: data

=======================================

o: VIRT (Virtual Image) - 进程使用的总虚拟内存 (virtual memory) 大小,包括进程的程序码、资料和共享程序库再加上被置换 (swap out) 的空间。VIRT = SWAP + RES

p: SWAP (Swapped size) - 进程被置换的虚拟内存空间大小。

q: RES (Resident size) - 进程非被置换的实体内存大小。RES = CODE + DATA

r: CODE' (Code size) - 进程的程序码在实体内存佔用空间大小,亦叫作 text resident set (TRS)。

s: DATA (Data+Stack size) - 进程佔用实体内存中的非程序码部份大小,亦叫作 data resident set (DRS)。

t: SHR (Shared Mem size) - 进程使用的共享内存大小,即可以和其他进程共享的内存空间。

n: %MEM (Memory usage) - 进程佔用实体内存大小对系统总实体内存大小的比例,以百分比显示。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: