您的位置:首页 > 理论基础 > 计算机网络

linux系统CPU,内存,磁盘,网络流量监控脚本

2015-07-26 03:53 881 查看
前序

1,#cat /proc/stat/ 信息包含了所有CPU活动的信息,该文件中的所有值都是从系统启动开始累积到当前时刻

2,#vmstat –s 或者#vmstat 虚拟内存统计

3, #cat /proc/loadavg 从系统启动开始到当前累积时刻

4, #uptime 系统运行多长时间

5, #mpstat CPU的一些统计信息

6, #

一,linux系统CPU,内存,磁盘,网络流量监控脚本

[作者:佚名来源:不详时间:2010-7-6 【我来说两句大中小】  cme.sh网络流量监控使用

  [root@china213
~]# cd /bin

  [root@china213
bin]# ./cme.sh

  cpu
99

  disk
39

  mem
38

  nic
19855 33 0

  [root@china213
bin]#

  CPU剩余率,磁盘剩余率,内存剩余率,以及网卡接收的bps,pps和dps(丢包)

  把下面内容用vi命令写入到cme.sh中[root@china213
bin]# vi cme.sh,同时用[root@china213
bin]# chmod +x cme.sh增加可执行权限

  注意:shell文件开头必须以#!/bin/sh开始,在window中保存成cme.sh上传的时候会执行不了,可能是文件头的问题。

  ==============================不要把这行分各符放到cme.sh文件中=========================================

#!/bin/sh

eth="eth0 eth1 "

function get_eth_info()

{

name=$1

cat /proc/net/dev | awk
-F ':' '{if(NR>2)print $1" "$2" "$9"
"$10}' | awk '{print$1" "$2" "$3" "$5}'
| while \

read line

do

# echo $line

data=`echo $name"
"$line | awk '{if($1==$2)print $3" "$4" "$5}'`

if ! [ -z "$data"
]

then

echo $data

fi

done

}

function sum_eth()

{

rm -fr 12321.txt

for name in $eth

do

ret=`get_eth_info
$name`

#echo $ret | awk
'{bps+=$0;pps+$1;dps+=$2;print bps" "pps" "dps}'

echo $ret >>
12321.txt

done

cat 12321.txt | awk
'BEGIN{bps=0;pps=0;dps=0} {bps+=$1;pps+=$2;dps+=$3}END{print bps"
"pps" "dps}'

}

flow=`sum_eth`

disk=`df | awk
'BEGIN{total=0;avl=0;used=0;}NR > 1
{total+=$2;used+=$3;avl+=$4;}END{printf"%d",
avl/total*100}'`

#top -b -n 1 | grep -w
Mem | awk '{print"tot_mem: "$2" used_mem: "
$4 " free_mem: "$6" left:"$6/$2"%"}'

mem=`top -b -n 1 | grep
-w Mem | awk '{printf"%d",$6/$2*100}'`

#top -b -n 1 | grep -w
Cpu | awk '{print"cpu: "$5}' | awk -F '%' {print$1}

cpu=`top -b -n 1 | grep
-w Cpu | awk '{print$5}' | awk -F '%' '{printf"%d",$1}'`

tm=`date +%s`

if ! [ -f "flow.txt"
]

then

echo $tm" "$flow
>flow.txt

sleep 1

tm=`date +%s`

flow=`sum_eth`

fi

old_flow=`cat flow.txt`

new_flow=`echo $tm
$flow`

echo $new_flow
>flow.txt

#echo $old_flow

#echo $new_flow

final_flow=`echo
$old_flow $new_flow | awk '{dif_tm=$5-
$1;dif_byte=$6-$2;dif_pkt=$7-$3;dif_dpkt=$8-$4;printf"%d %d %
d",dif_byte*8/dif_tm, dif_pkt/dif_tm, dif_dpkt/dif_tm}'`

#final_flow=`echo
$old_flow $new_flow | awk '{print$0}'`

echo "cpu "$cpu

echo "disk "$disk

echo "mem "$mem

echo "nic
"$final_flow

二,监控CPU进程的CPU使用率

例如:mysqld

脚本:

1,获取某个进程的使用率

[root@test testCPU]#
cat topmysql.sh

#!/bin/bash

top -n 1 >
/root/testCPU/topmysql.log

if grep -q mysqld
/root/testCPU/topmysql.log

then cpu=`grep "mysqld"
/root/testCPU/topmysql.log | gawk '{print $9}'`

echo $cpu

else

echo "0"

fi

exit

[root@test testCPU]#

2,获取cpu使用率

[root@test home]# cat
getCPU.sh


#!/bin/sh

awk '$0 ~/cpu[0-9]/'
/proc/stat | while read line

do

echo "$line"
| awk '{total=$2+$3+$4+$5+$6+$7+$8;free=$5;\

print$1"
Free "free/total*100"%",\

"Used
" (total-free)/total*100"%"}'

done

[root@test home]#
./getCPU.sh

cpu0 Free 90.0662% Used
9.93379%

[root@test home]#

3,监控进程占用cpu最高的前几个进程

[root@test testCPU]# cat
pscpu.sh

#!/bin/bash

time=`date +%m%d%T`

ps aux|head -1;ps aux|grep
-v PID|sort -rn -k +3|head -3 >
/root/testCPU/pscpu$time.log

[root@test testCPU]#

# linux
取进程占用
cpu
最高的前10个进程
#ps
aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head

取进程占用CPU最高的前五个进程

或者#
ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head -5

# linux
取进程占用
内存(MEM)最高的前10个进程
#ps
aux|head -1;ps aux|grep -v PID|sort -rn -k +4|head

####################################

Linux
进程管理命令详解(pstop

1, ps命令

作用:ps命令主要查看系统中进程的状态。

格式:ps
【选项】

主要选项如下。

-A:显示系统中所有进程的信息。
-e:显示所有进程的信息。
-f:显示进程的所有信息。
-l:以长格式显示进程信息。
-r:只显示正在运行的进程。
-u:显示面向用户的格式(包括用户名、CPU及内存使用情况等信息)。
-x:显示所有非控制终端上的进程信息。
-p:显示由进程ID指定的进程的信息。
-t:显示指定终端上的进程的信息。

说明:要对进程进行监测和控制,首先要了解当前进程的情况,也就是需要查看当前进程。ps命令就是最基本、也是非常强大的进程查看命令。根据显示的信息可以确定哪个进程正在运行、哪个进程被挂起、进程已运行了多久、进程正在使用的资源、进程的相对优先级,以及进程的标志号(PID)。所有这些信息对用户都很有用,对于系统管理员来说更为重要。使用"ps
-aux"命令可以获得终端上所有用户的有关进程的所有信息,下面结合图讲解进程的基本信息。

root@Linux ~]# ps
-aux
USER PID %CPU %MEM
VSZ RSS TTY STAT START
TIME COMMAND
root
1 0.0 0.0 2064 624 ?
Ss Sep27 0:03 init
[3]

root 2 0.0
0.0 0 0
? S< Sep27
0:03 [migration/0]
root
3 0.0 0.0 0 0
? SN Sep27
0:00 [ksoftirqd/0]
root
4 0.0 0.0 0 0
? S< Sep27
0:00 [watchdog/0]
root
5 0.0 0.0 0 0
? S< Sep27
0:04 [migration/1]
root
6 0.0 0.0 0 0
? SN Sep27
0:00 [ksoftirqd/1]
root
7 0.0 0.0 0 0
? S< Sep27
0:00 [watchdog/1]
root
8 0.0 0.0 0 0
? S< Sep27
0:05 [migration/2]
root
9 0.0 0.0 0 0
? SN Sep27
0:00 [ksoftirqd/2]
root
10 0.0 0.0 0 0
? S< Sep27
0:00 [watchdog/2]

图中第二行代码中,USER表示启动进程用户。PID表示进程标志号。%CPU表示运行该进程占用CPU的时间与该进程总的运行时间的比例。%MEM表示该进程占用内存和总内存的比例。VSZ表示占用的虚拟内存大小,以KB为单位。RSS为进程占用的物理内存值,以KB为单位。TTY表示该进程建立时所对应的终端,"?"表示该进程不占用终端。STAT表示进程的运行状态,包括以下几种代码:D,不可中断的睡眠;R,就绪(在可运行队列中);S,睡眠;T,被跟踪或停止;Z,终止(僵死)的进程,Z不存在,但暂时无法消除;W,没有足够的内存分页可分配;<高优先序的进程;N,低优先序的进程;L,有内存分页分配并锁在内存体内(实时系统或I/O)。START为进程开始时间。TIME为执行的时间。COMMAND是对应的命令名。
应用实例如下。
在进行系统维护时,如果CPU负载突然增加,而又不知道是哪一个进程造成的情况。使用命令:

#ps aux | sort +3n

因为%CPU选项在第三列,所以sort选3作为参数,+表示升序输出结果
.

2.top命令top命令用来显示系统当前的进程状况。
格式:top
[选项]
主要选项如下。

d:指定更新的间隔,以秒计算。
q:没有任何延迟的更新。如果使用者有超级用户,则top命令将会以最高的优先序执行。
c:显示进程完整的路径与名称。
S:累积模式,会将已完成或消失的子进程的CPU时间累积起来。
s:安全模式。
i:不显示任何闲置(Idle)或无用(Zombie)的进程。
n:显示更新的次数,完成后将会退出top。

说明:top命令和ps命令的基本作用是相同的,都显示系统当前的进程状况。但是top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态。这里结合图来说明它给出的信息。

top - 15:01:27 up 48 days,
20:31, 3 users, load average: 0.08, 0.12, 0.42
Tasks: 174 total,
1 running, 171 sleeping, 0 stopped, 2
zombie
Cpu(s): 0.0%us, 0.1%sy, 0.0%ni, 99.6%id, 0.3%wa, 0.0%hi,
0.0%si, 0.0%st
Mem: 2075312k total, 1996848k used,
78464k free, 179360k buffers
Swap: 4128760k
total, 68k used, 4128692k free,
1298736k cached

PID USER
PR NI VIRT RES SHR S %CPU %MEM TIME+
COMMAND

9013 root 15 0 2328
1056 796 R 0.3 0.1 0:00.02
top

1 root 15
0 2064 624 536 S 0.0 0.0 0:03.80
init

2 root RT -5
0 0 0 S 0.0 0.0
0:03.88
migration/0

3 root 36 19
0 0 0 S 0.0 0.0
0:00.04
ksoftirqd/0

4 root RT -5
0 0 0 S 0.0 0.0
0:00.00
watchdog/0

5 root RT -5
0 0 0 S 0.0 0.0
0:04.06
migration/1

6 root 34 19
0 0 0 S 0.0 0.0
0:00.05
ksoftirqd/1

7 root RT -5
0 0 0 S 0.0 0.0
0:00.00
watchdog/1

8 root RT -5
0 0 0 S 0.0 0.0
0:05.96
migration/2

9 root 34 19
0 0 0 S 0.0 0.0
0:00.04
ksoftirqd/2

10 root RT -5
0 0 0 S 0.0 0.0
0:00.00
watchdog/2

11 root RT -5
0 0 0 S 0.0 0.0
0:02.98
migration/3

12 root 34 19
0 0 0 S 0.0 0.0
0:00.09 ksoftirqd/3

在图中,第一行表示的项目依次为当前时间、系统启动时间、当前系统登录用户数目、平均负载。第二行显示的是所有启动的、目前运行的、挂起(Sleeping)的和无用(Zombie)的进程。第三行显示的是目前CPU的使用情况,包括系统占用的比例、用户使用比例、闲置(Idle)比例。第四行显示物理内存的使用情况,包括总的可以使用的内存、已用内存、空闲内存、缓冲区占用的内存。第五行显示交换分区的使用情况,包括总的交换分区、使用的、空闲的和用于高速缓存的交换分区。第六行显示的项目最多,下面列出了详细解释。
PID(Process
ID):进程标志号,是非零正整数。USER:进程所有者的用户名。PR:进程的优先级别。NI:进程的优先级别数值。VIRT:进程占用的虚拟内存值。RES:进程占用的物理内存值。SHR:进程使用的共享内存值。STAT:进程的状态,其中S表示休眠,R表示正在运行,Z表示僵死状态,N表示该进程优先值是负数。%CPU:该进程占用的CPU使用率。%MEM:该进程占用的物理内存和总内存的百分比。TIME:该进程启动后占用的总的CPU时间。COMMAND:进程启动的启动命令名称,如果这一行显示不下,进程会有一个完整的命令行。top命令使用过程中,还可以使用一些交互的命令来完成其他参数的功能。这些命令是通过快捷键启动的。

<空格>:立刻刷新。
P:根据CPU使用大小进行排序。
T:根据时间、累计时间排序。
q:退出top命令。
m:切换显示内存信息。
t:切换显示进程和CPU状态信息。
c:切换显示命令名称和完整命令行。
M:根据使用内存大小进行排序。
W:将当前设置写入~/.toprc文件中。这是写top配置文件的推荐方法。

可以看到,top命令是一个功能十分强大的监控系统的工具,对于系统管理员而言尤其重要。但是,它的缺点是会消耗很多系统资源。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: