您的位置：首页 > 运维架构

使用w查看系统负载、vmstat命令、top命令、sar命令、nload命令

2017-10-29 19:36 791 查看

使用w查看系统负载

系统平均负载被定义为在特定时间间隔内运行队列中的平均进程数

如果一个进程满足以下条件则其就会位于运行队列中：
它没有在等待I/O操作的结果
它没有主动进入等待状态(也就是没有调用'wait')
没有被停止(例如：等待终止)

1、直接输出w
[root@centos7 ~]# w
第一行 15:02:01 up 25 min, 3 users, load average: 0.00, 0.01, 0.04
第二行 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
第三行 root tty1 14:36 25:05 0.01s 0.01s -bash
第四行 root pts/0 192.168.100.100 14:37 23:05 9.18s 9.17s top
第五行 root pts/1 192.168.100.100 15:01 1.00s 0.04s 0.02s w

第一行：当前系统时间，up 25min：启动25分钟；3 users：目前登录几个用户；load average：系统负载：1分钟 5分钟 15分钟和cpu有关系，单位时间内使用cpu活动的进程有多少个，最理想的状态：cpu个数（逻辑cpu，不是物理cpu），即负载值不超过1（cpu个数），一分钟查看的数字最能体现当前负载情况
[root@centos7 ~]# cat /proc/cpuinfo
processor: 0
0：表示一颗，1表示两颗

2、uptime和w一样
[root@centos7 ~]# uptime
15:13:28 up 37 min, 4 users, load average: 0.00, 0.01, 0.04

vmstat命令
什么原因导致cpu不正常了，系统的瓶颈在哪里，通过vmstat查看

[root@centos7 ~]# vmstat
进程内存交换分区磁盘IO 系统 cpu
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
2 0 0 245120 948 120364 0 0 37 4 38 64 0 1 99 0 0

每一秒显示一次，只需要显示5次
[root@centos7 ~]# vmstat 1 5

只需要关注：r：有多少个进程处于run状态；1个cpu处理10个进程；那么cpu轮流排队处理进程，只要排队就是r的状态；当这个值超过了CPU数目，就会出现CPU瓶颈了；
如果运行队列过大，表示你的CPU很繁忙，一般会造成CPU使用率很高。b：阻塞的进程；被网络，硬盘显示处理等待状态，卡死了，block；有多少个进程在等待
swapd：当数字不停变换，表示内存不够；
如果大于0，表示你的机器物理内存不足了，如果不是程序内存泄露的原因，那么你该升级内存了或者把耗内存的任务迁移到其他机器。si：有多少kb数据从swap进入到内存中
so：有多少从内存出来的到swap
bi：从磁盘读，判断磁盘读
bo：从磁盘写，判断磁盘写
us：用户占用cpu，比如mysql,http，表示用户态的资源，长时间大于50，表示资源不够，一共是100
sy：系统态

id：空闲的
us+sy+id=100
wa：等待cpu的百分百，有多少进程在等待，这列很大表示cpu不够用

top命令
查看系统具体哪个进程使用情况
默认3秒显示一次动态的刷新
Tasks: 350 total, 2 running, 348 sleeping, 0 stopped, 0 zombie
总共的任务 2个在运行 348在休眠停止主进程不存在，只有子进程运行
cpu最高的在前面；按P用cpu排序

mem:按M排序
top -bn1：一次性的把top列出来
top -c：更加详细的command显示
kill -9 PID

sar命令
监控系统状态
1、yum install -y sysstat
/var/log/sa/sa29 每隔一段时间生成的日志
[root@centos7 ~]# sar -n DEV -f /var/log/sa/sa29 （这个是二进制文件）查看当天的日志，也可以一个月内的日志
可以直接cat sar -n DEV -f /var/log/sa/sar29
2、监控网卡流量
-n （network）:网卡设备
1:表示1秒查看一次

[root@centos7 ~]# sar -n DEV 1
第一列：时间

第二列：网卡名称
第三列（rxpck/s）：每秒接收的数据包大小；几千是正常的，上万就得关注了
第四列（txpck/s）：每秒发送的数据包大小
rxkB/s txkB/s ：接收到的数据流量和发送的数据流量,单位是kB/s
rxcmp/s txcmp/s rxmcst/s：没什么意义

Linux 3.10.0-327.el7.x86_64 (centos7) 10/29/2017 _x86_64_(1 CPU)

07:09:44 PM IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s
07:09:45 PM eno16777736 1.01 1.01 0.06 0.17 0.00 0.00 0.00
07:09:45 PM lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00

07:09:45 PM IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s
07:09:46 PM eno16777736 1.00 1.00 0.06 0.37 0.00 0.00 0.00
07:09:46 PM lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00

3、查看系统负载
[root@centos7 ~]# sar -q 1 5
runq-sz：运行队列的长度（等待运行的进程数）。
plist-sz：进程列表中进程（processes）和线程（threads）的数量。
ldavg-1：最后 1 分钟的系统平均负载（System load average）。
ldavg-5：过去 5 分钟的系统平均负载。
ldavg-15：过去 15 分钟的系统平均负载。
12:16:41 PM runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15
12:16:44 PM 0 147 0.00 0.01 0.00
12:16:47 PM 0 147 0.00 0.01 0.00
12:16:50 PM 0 147 0.00 0.01 0.00
Average: 0 147 0.00 0.01 0.00

4、监控cpu
[root@test fc]# sar -u 1 3
%usr：用户进程消耗的 CPU 时间百分比。%nice: 运行正常进程消耗的 CPU 时间百分比。%system：系统进程消耗的 CPU 时间百分比。%iowait： I/O 等待所占 CPU 时间百分比。%idle： CPU 空闲状态的时间百分比。Linux 2.6.32-573.el6.x86_64 (test) 11/02/2017 _x86_64_ (4 CPU)
12:09:50 PM CPU %user %nice %system %iowait %steal %idle
12:09:51 PM all 0.00 0.00 0.25 0.00 0.00 99.75
12:09:52 PM all 0.00 0.00 0.00 0.00 0.00 100.00
12:09:53 PM all 0.00 0.00 0.25 0.00 0.00 99.75
Average: all 0.00 0.00 0.17 0.00 0.00 99.83
总结：在所有的显示中，我们应主要注意%iowait和%idle， %iowait的值过高，表示硬盘存在 I/O 瓶颈， %idle值高，表示 CPU 较空闲，如果%idle值高但系统响应慢时，有可能是 CPU 等待分配内存，此时应加大内存容量。 %idle 值如果持续低于 10，那么系统的 CPU 处理能力相对较低，表明系统中最需要解决的资源是 CPU。

5、IO传输速率的监控

[root@test fc]# sar -b 3 3
Linux 2.6.32-573.el6.x86_64 (test) 11/02/2017 _x86_64_ (4 CPU)
tps：每秒钟物理设备的 I/O 传输总量。
rtps：每秒钟从物理设备读入的数据总量。
wtps：每秒钟向物理设备写入的数据总量。
bread/s：每秒钟从物理设备读入的数据量，单位为块/s。
bwrtn/s：每秒钟向物理设备写入的数据量，单位为块/s。
12:14:15 PM tps rtps wtps bread/s bwrtn/s
12:14:18 PM 0.00 0.00 0.00 0.00 0.00
12:14:21 PM 0.00 0.00 0.00 0.00 0.00
12:14:24 PM 0.00 0.00 0.00 0.00 0.00
Average: 0.00 0.00 0.00 0.00 0.00

总结：
要判断系统瓶颈问题，有时需几个 sar 命令选项结合起来
怀疑 CPU 存在瓶颈，可用 sar -u 和 sar -q 等来查看
怀疑内存存在瓶颈，可用 sar -B、 sar -r 和 sar -W 等来查看
怀疑 I/O 存在瓶颈，可用 sar -b、 sar -u 和 sar -d 等来查看

nload命令
1、[root@centos7 ~]# yum install epel-release
2、[root@centos7 ~]# yum install nload
3、[root@centos7 ~]# nload
可以查看当前的，平均的，最大的，最小的，总共的带宽

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： Linux 基础

相关文章推荐

新的分享

章节导航