您的位置：首页 > 运维架构 > Linux

linux下如何获取cpu的利用率

2015-12-25 09:46 429 查看

"proc文件系统是一个伪文件系统，它只存在内存当中，而不占用外存空间。它以文件系统的方式为访问系统内核数据的操作提供接口。用户和应用程序可以通过proc得到系统的信息，并可以改变内核的某些参数。"

这里将介绍如何从/proc文件系统中获取与防火墙相关的一些性能参数，以及如何通过/proc文件系统修改内核的相关配置。

1、从/proc文件系统获取相关的性能参数

cpu使用率： /proc/stat

内存使用情况： /proc/meminfo

网络负载信息： /proc/net/dev

相应的计算方法：(摘自：什么是proc文件系统，见参考资料)

（1）处理器使用率

（2）内存使用率

（3）流入流出数据包

（4）整体网络负载

这些数据分别要从/proc/stat、/proc/net/dev、/proc/meminfo三个文件中提取。如里有问题或对要提取的数据不太清楚，可以使用man proc来查看proc文件系统的联机手册。

（1）处理器使用率

这里要从/proc/stat中提取四个数据：用户模式（user）、低优先级的用户模式（nice）、内核模式（system）以及空闲的处理器时间（idle）。它们均位于/proc/stat文件的第一行。CPU的利用率使用如下公式来计算。

CPU利用率 = 100 *（user + nice + system）/（user + nice + system + idle）

（2）内存使用率

这里需要从/proc/meminfo文件中提取两个数据，当前内存的使用量(cmem)以及内存总量(amem)。

内存使用百分比 = 100 * (cmem / umem)

（3）网络利用率

为了得到网络利用率的相关数据，需要从/proc/net/dev文件中获得两个数据：从本机输出的数据包数，流入本机的数据包数。它们都位于这个文件的第四行。

性能收集程序开始记录下这两个数据的初始值，以后每次获得这个值后均减去这个初始值即为从集群启动开始从本节点通过的数据包。

利用上述数据计算出网络的平均负载，方法如下：

平均网络负载 = (输出的数据包+流入的数据包) / 2

2. 通过/proc文件系统调整相关的内核配置

允许ip转发 /proc/sys/net/ipv4/ip_forward

禁止ping /proc/sys/net/ipv4/icmp_echo_ignore_all

可以在命令行下直接往上述两个“文件”里头写入"1"来实现相关配置，如果写入"0"将取消相关配置。不过在系统重启以后，这些配置将恢复默认设置，所以，如果想让这些修改生效，可以把下面的配置直接写入/etc/profile文件，或者其他随系统启动而执行的程序文件中。

echo 1 > /proc/sys/net/ipv4/ip_forward

echo 1 > /proc/sys/net/ipv4/icmp_echo_ignore_all

如果需要获取其他的性能参数，或者需要对内核进行更多的配置，可以参考下面链接中的proc文件系统介绍，也可以直接通过man proc查看相关的信息。

参考资料和相关链接

[1] 什么是proc文件系统

http://blog.chinaunix.net/u1/37836/showart_304248.html

[2] Linux下如何获取cpu的使用率

http://topic.csdn.net/t/20060701/23/4855045.html

[3] Exploring the /proc/net/ Directory

http://www.linuxdevcenter.com/pub/a/linux/2000/11/16/LinuxAdmin.html?page=1

[4] /proc/net introduction

http://www.redhat.com/docs/manuals/enterprise/RHEL-4-Manual/en-US/Reference_Guide/s2-proc-dir-net.html

[5] 使用ulimit和proc去调整系统参数

http://www.linuxfly.org/post/73.htm

注：文件里面是一个增量，每过一个时间间隔对应的项使用了CPU都会有增加，要算百分比，得用上上一次的状态值.

这里计算cpu使用率是有问题的，需要使用上一状态的值来计算。

elf 发表于 2007-11-16 09:06

正确的计算方法是，等上一个时间：

1、记录某个时刻cpu的使用情况

2、等上一个时间段

3、再记录此刻的cpu使用情况

4、计算总的时间片

把第一次的所有cpu使用情况求和，得到j1

把第二次的所有cpu使用情况求和，得到j2

j2-j1得到这个时间段的所有时间片

即total=j2-j1=第二次的所有列的和-第一次的所有列的和

5、计算idle时间

idle对应第五列的数据，用第二次的减去第一次的即可

idle=第二次的第五列-第一次的第五列

6、计算cpu使用率

rate=(total-idle)/total

见：http://oss.lzu.edu.cn/blog/article.php?tid_1379.html

我们在搞性能测试的时候，对后台服务器的CPU利用率监控是一个常用的手段。服务器的CPU利用率高，则表明服务器很繁忙。如果前台响应时间越来越大，而后台CPU利用率始终上不去，说明在某个地方有瓶颈了，系统需要调优。这个是即使不懂技术的人都容易理解的事情。

上面理解对吗？我个人觉得不十分准确。这个要看后台你测试的进程是什么类型的。如果是计算密集型的进程，当前端压力越来越大的时候，很容易把CPU利用率打上去。但是如果是I/O网络密集型的进程，即使客户端的请求越来越多，但是服务器CPU不一定能上去，这个是你要测试的进程的自然属性决定的。

什么是CPU利用率呢？在Linux/Unix下，CPU利用率分为用户态，系统态和空闲态，分别表示CPU处于用户态执行的时间，系统内核执行的时间，和空闲系统进程执行的时间。从计算机加电开始，CPU就一直忙个不停，所以CPU的利用率始终是100%。当没有用户进程需要执行的时候，CPU就执行系统缺省的空闲进程。我们所指的CPU利用率是指CPU执行非系统空闲进程的时间 / CPU总的执行时间。

在Linux的内核中，有一个全局变量：Jiffies。 Jiffies代表时间。它的单位随硬件平台的不同而不同。系统里定义了一个常数HZ，代表每秒种最小时间间隔的数目。这样jiffies的单位就是 1/HZ。Intel平台jiffies的单位是1/100秒，这就是系统所能分辨的最小时间间隔了。每个CPU时间片，Jiffies都要加1。 CPU的利用率就是用执行用户态+系统态的Jiffies除以总的Jifffies来表示。

在Linux系统中，CPU利用率的计算来源在/proc/stat文件，这个文件的头几行记录了每个CPU的用户态，系统态，空闲态等状态下的不同的Jiffies，常用的监控软件就是利用/proc/stat里面的这些数据来计算CPU的利用率的。

包含了所有CPU活动的信息，该文件中的所有值都是从系统启动开始累计到当前时刻。

/proc/stat/

[work@builder ~]$ cat /proc/stat

cpu 432661 13295 86656 422145968 171474 233 5346

cpu0 123075 2462 23494 105543694 16586 0 4615

cpu1 111917 4124 23858 105503820 69697 123 371

cpu2 103164 3554 21530 105521167 64032 106 334

cpu3 94504 3153 17772 105577285 21158 4 24

intr 1065711094 1057275779 92 0 6 6 0 4 0 3527 0 0 0 70 0 20 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7376958 0 0 0 0 0 0 0 1054602 0 0 0 0 0 0 0 30 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0

ctxt 19067887

btime 1139187531

processes 270014

procs_running 1

procs_blocked 0

输出解释

CPU 以及CPU0、CPU1、CPU2、CPU3每行的每个参数意思（以第一行为例）为：

参数解释

user (432661) 从系统启动开始累计到当前时刻，用户态的CPU时间（单位：jiffies），不包含 nice值为负进程。1jiffies=0.01秒

nice (13295) 从系统启动开始累计到当前时刻，nice值为负的进程所占用的CPU时间（单位：jiffies）

system (86656) 从系统启动开始累计到当前时刻，核心时间（单位：jiffies）

idle (422145968) 从系统启动开始累计到当前时刻，除硬盘IO等待时间以外其它等待时间（单位：jiffies）

iowait (171474) 从系统启动开始累计到当前时刻，硬盘IO等待时间（单位：jiffies），

irq (233) 从系统启动开始累计到当前时刻，硬中断时间（单位：jiffies）

softirq (5346) 从系统启动开始累计到当前时刻，软中断时间（单位：jiffies）

CPU时间=user+system+nice+idle+iowait+irq+softirq

“intr”这行给出中断的信息，第一个为自系统启动以来，发生的所有的中断的次数；然后每个数对应一个特定的中断自系统启动以来所发生的次数。

“ctxt”给出了自系统启动以来CPU发生的上下文交换的次数。

“btime”给出了从系统启动到现在为止的时间，单位为秒。

“processes (total_forks) 自系统启动以来所创建的任务的个数目。

“procs_running”：当前运行队列的任务的数目。

“procs_blocked”：当前被阻塞的任务的数目。

那么CPU利用率的计算方法：可以使用取两个采样点，计算其差值的办法。

(idle2-idle1)/cpu2-cpu1

附改进过后的shell

1 #!/bin/sh
2
3 #功能：计算CPU的利用率,选取采样点
4 #计算公式：
5 #方法1：cpu usage=(idle2-idle1)/(cpu2-cpu1)*100
6 #方法2: cpu usage=[(user_2 +sys_2+nice_2) - (user_1 + sys_1+nice_1)]/(total_2 - total_1)*100
7 #方法3:(本脚本采用)
8 #total_0=USER[0]+NICE[0]+SYSTEM[0]+IDLE[0]+IOWAIT[0]+IRQ[0]+SOFTIRQ[0]
9 #total_1=USER[1]+NICE[1]+SYSTEM[1]+IDLE[1]+IOWAIT[1]+IRQ[1]+SOFTIRQ[1]
10 #cpu usage=(IDLE[0]-IDLE[1]) / (total_0-total_1) * 100
11
12 ##echo user nice system idle iowait irq softirq
13 CPULOG_1=$(awk '/\<cpu\>/{print $2" "$3" "$4" "$5" "$6" "$7" "$8}' /proc/stat)
14 SYS_IDLE_1=$(echo $CPULOG_1 | awk '{print $4}')
15 Total_1=$(echo $CPULOG_1 | awk '{print $1+$2+$3+$4+$5+$6+$7}')
16
17 sleep 5
18
19 CPULOG_2=$(awk '/\<cpu\>/{print $2" "$3" "$4" "$5" "$6" "$7" "$8}' /proc/stat)
20 SYS_IDLE_2=$(echo $CPULOG_2 | awk '{print $4}')
21 Total_2=$(echo $CPULOG_2 | awk '{print $1+$2+$3+$4+$5+$6+$7}')
22
23 SYS_IDLE=`expr $SYS_IDLE_2 - $SYS_IDLE_1`
24
25 Total=`expr $Total_2 - $Total_1`
26
27 #method 1
28 #SYS_USAGE=`expr $SYS_IDLE/$Total*100 |bc -l`
29 #SYS_Rate=`expr 100-$SYS_USAGE |bc -l`
30
31 #method2
32 tmp_rate=`expr 1-$SYS_IDLE/$Total | bc -l`
33 SYS_Rate=`expr $tmp_rate*100 | bc -l`
34
35 #display
36 Disp_SYS_Rate=`expr "scale=3; $SYS_Rate/1" |bc`
37 echo $Disp_SYS_Rate%

想获取一下目标机运行时linux系统的硬件占用情况，写了这几个小程序，以后直接用了。

方法就是读取proc下的文件来获取了。 cpu使用率： /proc/stat ，内存使用情况： /proc/meminfo

看程序：

typedef struct PACKED //定义一个cpu occupy的结构体

{

char name[20]; //定义一个char类型的数组名name有20个元素

unsigned int user; //定义一个无符号的int类型的user

unsigned int nice; //定义一个无符号的int类型的nice

unsigned int system;//定义一个无符号的int类型的system

unsigned int idle; //定义一个无符号的int类型的idle

}CPU_OCCUPY;

typedef struct PACKED //定义一个mem occupy的结构体

{

char name[20]; //定义一个char类型的数组名name有20个元素

unsigned long total;

char name2[20];

unsigned long free;

}MEM_OCCUPY;

get_memoccupy (MEM_OCCUPY *mem) //对无类型get函数含有一个形参结构体类弄的指针O

{

FILE *fd;

int n;

char buff[256];

MEM_OCCUPY *m;

m=mem;

fd = fopen ("/proc/meminfo", "r");

fgets (buff, sizeof(buff), fd);

fgets (buff, sizeof(buff), fd);

fgets (buff, sizeof(buff), fd);

fgets (buff, sizeof(buff), fd);

sscanf (buff, "%s %u %s", m->name, &m->total, m->name2);

fgets (buff, sizeof(buff), fd); //从fd文件中读取长度为buff的字符串再存到起始地址为buff这个空间里

sscanf (buff, "%s %u", m->name2, &m->free, m->name2);

fclose(fd); //关闭文件fd

}

int cal_cpuoccupy (CPU_OCCUPY *o, CPU_OCCUPY *n)

{

unsigned long od, nd;

unsigned long id, sd;

int cpu_use = 0;

od = (unsigned long) (o->user + o->nice + o->system +o->idle);//第一次(用户+优先级+系统+空闲)的时间再赋给od

nd = (unsigned long) (n->user + n->nice + n->system +n->idle);//第二次(用户+优先级+系统+空闲)的时间再赋给od

id = (unsigned long) (n->user - o->user); //用户第一次和第二次的时间之差再赋给id

sd = (unsigned long) (n->system - o->system);//系统第一次和第二次的时间之差再赋给sd

if((nd-od) != 0)

cpu_use = (int)((sd+id)*10000)/(nd-od); //((用户+系统)乖100)除(第一次和第二次的时间差)再赋给g_cpu_used

else cpu_use = 0;

//printf("cpu: %u/n",cpu_use);

return cpu_use;

}

get_cpuoccupy (CPU_OCCUPY *cpust) //对无类型get函数含有一个形参结构体类弄的指针O

{

FILE *fd;

int n;

char buff[256];

CPU_OCCUPY *cpu_occupy;

cpu_occupy=cpust;

fd = fopen ("/proc/stat", "r");

fgets (buff, sizeof(buff), fd);

sscanf (buff, "%s %u %u %u %u", cpu_occupy->name, &cpu_occupy->user, &cpu_occupy->nice,&cpu_occupy->system, &cpu_occupy->idle);

fclose(fd);

}

int main()

{

CPU_OCCUPY cpu_stat1;

CPU_OCCUPY cpu_stat2;

MEM_OCCUPY mem_stat;

int cpu;

//获取内存

get_memoccupy ((MEM_OCCUPY *)&mem_stat);

//第一次获取cpu使用情况

get_cpuoccupy((CPU_OCCUPY *)&cpu_stat1);

sleep(10);

//第二次获取cpu使用情况

get_cpuoccupy((CPU_OCCUPY *)&cpu_stat2);

//计算cpu使用率

cpu = cal_cpuoccupy ((CPU_OCCUPY *)&cpu_stat1, (CPU_OCCUPY *)&cpu_stat2);

return 0;

}

我们在搞性能测试的时候，对后台服务器的CPU利用率监控是一个常用的手段。服务器的CPU利用率高，则表明服务器很繁忙。如果前台响应时间越来越大，而后台CPU利用率始终上不去，说明在某个地方有瓶颈了，系统需要调优。这个是即使不懂技术的人都容易理解的事情。

上面理解对吗？我个人觉得不十分准确。这个要看后台你测试的进程是什么类型的。如果是计算密集型的进程，当前端压力越来越大的时候，很容易把CPU 利用率打上去。但是如果是I/O网络密集型的进程，即使客户端的请求越来越多，但是服务器CPU不一定能上去，这个是你要测试的进程的自然属性决定的。比较常见的就是，大文件频繁读写的cpu开销远小于小文件频繁读写的开销。因为在I/O吞吐量一定时，小文件的读写更加频繁，需要更多的cpu来处理I/O 的中断。

在Linux/Unix下，CPU利用率分为用户态，系统态和空闲态，分别表示CPU处于用户态执行的时间，系统内核执行的时间，和空闲系统进程执行的时间。平时所说的CPU利用率是指：CPU执行非系统空闲进程的时间 / CPU总的执行时间。

在Linux的内核中，有一个全局变量：Jiffies。 Jiffies代表时间。它的单位随硬件平台的不同而不同。系统里定义了一个常数HZ，代表每秒种最小时间间隔的数目。这样jiffies的单位就是 1/HZ。Intel平台jiffies的单位是1/100秒，这就是系统所能分辨的最小时间间隔了。每个CPU时间片，Jiffies都要加1。 CPU的利用率就是用执行用户态+系统态的Jiffies除以总的Jifffies来表示。

在Linux系统中，可以用/proc/stat文件来计算cpu的利用率(详细的解释可参考：http: //www.linuxhowtos.org/System/procstat.htm)。这个文件包含了所有CPU活动的信息，该文件中的所有值都是从系统启动开始累计到当前时刻。

如：

1.[sailorhzr@builder ~]$ cat /proc/stat

2.cpu 432661 13295 86656 422145968 171474 233 5346

3.cpu 0 123075 2462 23494 105543694 16586 0 4615

4.cpu 1 111917 4124 23858 105503820 69697 123 371

5.cpu 2 103164 3554 21530 105521167 64032 106 334

6.cpu 3 94504 3153 17772 105577285 21158 4 24

7.intr 1065711094 1057275779 92 0 6 6 0 4 0 3527 0 0 0 70 0 20 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 7376958 0 0 0 0 0 0 0 1054602 0 0 0 0 0 0 0 30 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

8.ctxt 19067887

9.btime 1139187531

10.processes 270014

11.procs_running 1

12.procs_blocked 0

13.

输出解释

CPU 以及CPU0、CPU1、CPU2、CPU3每行的每个参数意思（以第一行为例）为：

参数

解释

user (432661)

nice (13295)

system (86656)

idle (422145968)

iowait (171474)

irq (233)

softirq (5346)

从系统启动开始累计到当前时刻，用户态的CPU时间（单位：jiffies），不包含 nice值为负进程。1jiffies=0.01秒

从系统启动开始累计到当前时刻，nice值为负的进程所占用的CPU时间（单位：jiffies）

从系统启动开始累计到当前时刻，核心时间（单位：jiffies）

从系统启动开始累计到当前时刻，除硬盘IO等待时间以外其它等待时间（单位：jiffies）

从系统启动开始累计到当前时刻，硬盘IO等待时间（单位：jiffies），

从系统启动开始累计到当前时刻，硬中断时间（单位：jiffies）

从系统启动开始累计到当前时刻，软中断时间（单位：jiffies）

CPU时间=user+system+nice+idle+iowait+irq+softirq

“intr”这行给出中断的信息，第一个为自系统启动以来，发生的所有的中断的次数；然后每个数对应一个特定的中断自系统启动以来所发生的次数。

“ctxt”给出了自系统启动以来CPU发生的上下文交换的次数。

“btime”给出了从系统启动到现在为止的时间，单位为秒。

“processes (total_forks) 自系统启动以来所创建的任务的个数目。

“procs_running”：当前运行队列的任务的数目。

“procs_blocked”：当前被阻塞的任务的数目。

那么CPU利用率可以使用以下两个方法。先取两个采样点，然后计算其差值：

1.cpu usage=(idle 2 -idle 1 )/(cpu 2 -cpu 1 )* 100

2.cpu usage=[(user_ 2 +sys_ 2 +nice_ 2 ) - (user_ 1 + sys_ 1 +nice_ 1 )]/(total_ 2 - total_ 1 )* 100

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航