您的位置:首页 > 运维架构 > Linux

实用监控Linux工具总结

2012-06-16 15:37 441 查看


CPU情况

物理CPU个数

cat /proc/cpuinfo | grep "physical id"|sort|uniq|wc –l
每个物理CPU中的core个数

cat /proc/cpuinfo |grep "cpu cores" |uniq
逻辑CPU个数

cat /proc/cpuinfo|grep "processor"|wc -l


内存情况

free -m #-m的意思是用M来做单位显示内容

total used free shared buffers cached

Mem: 1978 1000 978 0 697 114

-/+ buffers/cache: 189 1789

Swap: 5997 0 5997

Total:内存总数,即1979MB
Used:已经使用的内存数,即1000MB
Free:空闲的内存数,即978MB
Shared:当前已经废弃不用,总是0
Buffers:缓存内存数,即697MB
Cached:缓存内存数,即421MB
- buffers/cache:used内存数,即189M
+ buffers/cache:free内存数,即1789M


硬盘情况

1. 查看分区信息

fdisk -l

Disk /dev/sda: 500.1 GB, 500107862016 bytes

255 heads, 63 sectors/track, 60801 cylinders

Units = cylinders of 16065 * 512 = 8225280 bytes

Sector size (logical/physical): 512 bytes / 512 bytes

I/O size (minimum/optimal): 512 bytes / 512 bytes

Disk identifier: 0x00062ae4

Device Boot Start End Blocks Id System

/dev/sda1 * 1 60037 482241536 83 Linux

/dev/sda2 60037 60802 6141953 5 Extended

/dev/sda5 60037 60802 6141952 82 Linux swap / Solaris

2.查看文件系统的磁盘空间占用情况

Df -h

Filesystem Size Used Avail Use% Mounted on

/dev/sda1 453G 48G 383G 12% /

none 984M 188K 984M 1% /dev

none 990M 164K 990M 1% /dev/shm

none 990M 104K 990M 1% /var/run

none 990M 0 990M 0% /var/lock

3.查看文件夹大小

Du –sh /root

50M
/root


平均负载

基本概念:特定时间间隔内运行队列中平均进程数可以反映系统的繁忙程度。

11:48:10 up 4:21, 1 user, load average: 0.00, 0.00, 0.00

它表示过去的1分钟、5分钟和15分钟内进程队列中的平均进程数。

如果每个CPU当前的活动进程不大于3,则系统良好
如果每个CPU当前的活动进程不大于4,则可以接受
如果每个CPU当前的活动进程大于5,则系统性能问题严重
结合vmstat ,如果r经常大于3或4,且id经常少于50,则表示CPU负荷很重。


vmstat

procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----

r b swpd free buff cache si so bi bo in cs us sy id wa

0 0 0 1001344 714636 117160 0 0 30 3 12 11 0 0 99 1

0 0 0 1001336 714636 117144 0 0 0 4 33 32 0 0 100 0

0 0 0 1001336 714636 117144 0 0 0 0 24 12 0 0 100 0

0 0 0 1001336 714636 117144 0 0 0 0 20 12 0 0 100 0

proc

R:等待运行的进程数。
B:处于非中断睡眠状态的进程数。
W:被交换出去的可运行进程数。

Memory

Swpd:虚拟内存使用情况,单位KB
free:空闲的内存,单位KB
buff:被用来作为缓存的内存数,单位kb

swap

si:从磁盘交换到内存的交换页数量,单位为KB
so:从内存交换到磁盘的交换页数量,单位为KB

io

bi:发送到块设备的块数,单位为块
bo:从块设备接到的块数,单位为块

system

in:每秒的中断数,包括时钟中断
cs:每秒的环境上下文的切换次数

cpu

us:CPU使用时间
sy:CPU系统使用时间
id:闲置时间

标准情况下r和b值应该为

R<5 b约等于0
R经常大于3或4,且id经常少于50,表示CPU负荷很重。
Bi、bo长期不等于0,表示内存不足。
Disk经常不等于0,且b中的队列大于2或3,表示io性能不好。


查看系统32位或64位

file /sbin/init

/sbin/init: ELF 32-bit LSB shared object, Intel 80386, version 1 (SYSV), dynamically linked (uses shared libs), for GNU/Linux 2.6.15, stripped

表示系统是32位。


查看Linux发行版相关信息

lsb_release -a

No LSB modules are available.

Distributor ID: Ubuntu

Description: Ubuntu 10.10

Release: 10.10

Codename: maverick


查看端口是否被占用

lsof -i:80

COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME

apache2 1217 root 4u IPv6 8171 0t0 TCP *:www (LISTEN)

apache2 1263 www-data 4u IPv6 8171 0t0 TCP *:www (LISTEN)

apache2 1264 www-data 4u IPv6 8171 0t0 TCP *:www (LISTEN)

apache2 1265 www-data 4u IPv6 8171 0t0 TCP *:www (LISTEN)

apache2 1266 www-data 4u IPv6 8171 0t0 TCP *:www (LISTEN)

apache2 1267 www-data 4u IPv6 8171 0t0 TCP *:www (LISTEN)

apache2 1662 www-data 4u IPv6 8171 0t0 TCP *:www (LISTEN)


服务器进程

Ps -axu 获取终端上所有用户的有关进程

Ps -axu | apache ,特定进程

USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND

USER:启动进程用户
PID:进程标识号
CPU:表示运行该进程占用CPU的时间与该进程总的运行时间之比。
MEM:表示该进程占用内存与总内存之比。
VSZ:表示占用的虚拟内存大小,以KB为单位
RSS:为进程占用的物理内存值,以KB为单位
TTY:表示该进程建立时所对应的终端,“?”表示该进程不占用终端
STAT
D,不可中断的睡眠 R 就绪(可运行队列中) S,睡眠 T,被跟踪或停止 Z 终止(僵尸)进程,即进程不存在,却暂时无法消除,W,没有足够的内存页可分配 N,低优先级进程 L,有内存页分配并锁在内存体。
START:进程开始时间
TIME:执行时间
COMMAND,对应的命令名


Top命令

top - 13:03:19 up 5:36, 1 user, load average: 0.15, 0.05, 0.01

Tasks: 134 total, 1 running, 133 sleeping, 0 stopped, 0 zombie

Cpu(s): 0.0%us, 0.2%sy, 0.0%ni, 99.0%id, 0.8%wa, 0.0%hi, 0.0%si, 0.0%st

Mem: 2026372k total, 1027336k used, 999036k free, 715068k buffers

Swap: 6141948k total, 0k used, 6141948k free, 120736k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

1899 root 20 0 2624 1124 840 R 0 0.1 0:00.09 top

1 root 20 0 2876 1740 1240 S 0 0.1 0:00.45 init

2 root 20 0 0 0 0 S 0 0.0 0:00.00 kthreadd

3 root 20 0 0 0 0 S 0 0.0 0:00.03 ksoftirqd/0

4 root RT 0 0 0 0 S 0 0.0 0:00.00 migration/0

5 root RT 0 0 0 0 S 0 0.0 0:00.00 watchdog/0

6 root RT 0 0 0 0 S 0 0.0 0:00.00 migration/1

load average: 0.15, 0.05, 0.01

系统负载,即任务队列的平均长度。

三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值。

Tasks: 134 total进程总数

1 running正在运行的进程数

133 sleeping睡眠的进程数

0 stopped停止的进程数

0 zombie僵尸进程数

Cpu(s): 0.0% us用户空间占用CPU百分比

0.0% sy内核空间占用CPU百分比

0.0% ni用户进程空间内改变过优先级的进程占用CPU百分比

98.7% id空闲CPU百分比

0.0% wa等待输入输出的CPU时间百分比

0.0% hi

0.0% si

Mem: 2026372k total 物理内存总量

1027336k used 使用的物理内存总量

999036k free 空闲内存总量

715068k buffers 用作内核缓存的内存量

Swap: 6141948k total 交换区总量

0k used 使用的交换区总量

6141948k free 空闲交换区总量

120736k cached 缓冲的交换区总量。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: