您的位置:首页 > 大数据 > 人工智能

AIX学习笔记1-常用命令解读-AIX系统运行状态

2014-05-26 10:36 337 查看
影响系统性能的因素主要有CPU、内存、IO和网络资源。要了解一个主机首要的就是对这几项的了解。

CPU(Central Processing Unit),查询系统中CPU的数量和速度

#lsdev -Cc processor | grep Available

#lsattr -El proc

shenji_db#[/]lsdev -Cc processor | grep Available
proc0 Available 00-00 Processor
proc2 Available 00-02 Processor
proc4 Available 00-04 Processor
proc6 Available 00-06 Processor
proc8 Available 00-08 Processor
proc10 Available 00-10 Processor
proc12 Available 00-12 Processor
proc14 Available 00-14 Processor
proc16 Available 00-16 Processor
proc18 Available 00-18 Processor

shenji_db#[/]lsattr -El proc0
frequency 2101896000 Processor Speed False
smt_enabled true Processor SMT enabled False
smt_threads 2 Processor SMT threads False
state enable Processor state False
type PowerPC_POWER5 Processor type False
内存--系统中配置的内存容量

#lsattr –El mem0
shenji_db#[/]lsattr -El mem0
goodsize 8192 Amount of usable physical memory in Mbytes False
size 8192 Total amount of physical memory in Mbytes False
I/O

磁盘的数量和类型

#lsdev -Cc disk

数据在磁盘上的分布

#lspv
shenji_db#[/]lsdev -Cc disk
hdisk0 Available 0F-08-00-8,0 16 Bit LVD SCSI Disk Drive
hdisk1 Available 0J-08-00-8,0 16 Bit LVD SCSI Disk Drive
hdisk2 Available 0E-08-02 MPIO Other FC SCSI Disk Drive
hdisk20 Available 0E-08-02 Hitachi Disk Array (Fibre)

shenji_db#[/]lspv
hdisk0 00c139ae9f703b91 rootvg active
hdisk1 00c139ae829da350 rootvg active
hdisk2 none None
hdisk20 00c139ae26fbe9a3 datavg active

网络资源

网卡的带宽,当前工作的速度

#entstat -d ent0
shenji_db#[/]entstat -d en1
-------------------------------------------------------------
ETHERNET STATISTICS (en1) :
Device Type: 10/100/1000 Base-TX PCI-X Adapter (14106902)
Hardware Address: 00:11:25:c0:74:70
Elapsed Time: 268 days 10 hours 11 minutes 28 seconds

Transmit Statistics: Receive Statistics:
-------------------- -------------------
Packets: 9518076 Packets: 311188023
Bytes: 13389539446 Bytes: 36785395235
Interrupts: 0 Interrupts: 258320479
Transmit Errors: 0 Receive Errors: 0
Packets Dropped: 0 Packets Dropped: 0
Bad Packets: 0
Max Packets on S/W Transmit Queue: 39
S/W Transmit Queue Overflow: 0
Current S/W+H/W Transmit Queue Length: 1

Broadcast Packets: 36877 Broadcast Packets: 285607858
Multicast Packets: 0 Multicast Packets: 12241439
No Carrier Sense: 0 CRC Errors: 0
DMA Underrun: 0 DMA Overrun: 0
Lost CTS Errors: 0 Alignment Errors: 0
Max Collision Errors: 0 No Resource Errors: 0
Late Collision Errors: 0 Receive Collision Errors: 0
Deferred: 0 Packet Too Short Errors: 0
SQE Test: 0 Packet Too Long Errors: 0
Timeout Errors: 0 Packets Discarded by Adapter: 0
Single Collision Count: 0 Receiver Start Count: 0
Multiple Collision Count: 0
Current HW Transmit Queue Length: 1

General Statistics:
-------------------
No mbuf Errors: 0
Adapter Reset Count: 0
Adapter Data Rate: 2000
Driver Flags: Up Broadcast Running
Simplex 64BitSupport ChecksumOffload
PrivateSegment LargeSend DataRateSet

10/100/1000 Base-TX PCI-X Adapter (14106902) Specific Statistics:
-----------------------------------------------------------------
Link Status: Up
Media Speed Selected: Auto negotiation
Media Speed Running: 1000 Mbps Full Duplex
PCI Mode: PCI-X (100-133)
PCI Bus Width: 64-bit
Latency Timer: 144
Cache Line Size: 128
Jumbo Frames: Disabled
TCP Segmentation Offload: Enabled
TCP Segmentation Offload Packets Transmitted: 618428
TCP Segmentation Offload Packet Errors: 0
Transmit and Receive Flow Control Status: Enabled
XON Flow Control Packets Transmitted: 0
XON Flow Control Packets Received: 0
XOFF Flow Control Packets Transmitted: 0
XOFF Flow Control Packets Received: 0
Transmit and Receive Flow Control Threshold (High): 49152
Transmit and Receive Flow Control Threshold (Low): 24576
Transmit and Receive Storage Allocation (TX/RX): 8/56

衡量系统性能的指标

使用系统提供的工具来检测当前系统运行性能

1)CPU的使用可分为%user,%sys,%idle,%i/owait四类,当%user与%sys之和持续大于90%以上时,可认为CPU是当前系统的瓶颈。

2)Memory主要观察系统中当前是否有持续的pi和po操作,以及所设定的文件内存比例是否合理。常用的检测命令是vmstat.

 说明:pi,po列值要持续为0;

     avm列值*4k 要是大于当前服务器物理内存,则该服务器的瓶颈可能是内存。

     avm列值*4k 要是小于当前服务器物理内存,则该服务器内存参数设置可能存在问题。

3)I/O需要观察的是磁盘适配器的吞吐量,每秒的读写次数,完成读写操作的响应时间等,磁盘的使用率。

4)Network网络主要观察当前网络的传输速度,其流量是否接近网卡所支持的上限

常用系统检测命令

vmstat 查看当前系统的cpu和内存的使用情况

检测当前系统中cpu和内存的使用情况,需要关注的字段有

r 在命令行给定的采样间隔内,有多少核心线程在运行;r/cpu数量,如果该值大于1,则可简单认为系统cpu存在瓶颈。

avm 活动的虚拟页面数量

pi 每秒从paging space中读入的页面数量

po 每秒输出到paging space的页面数量

us CPU用于用户应用程序所占的百分比

sy CPU用于各类系统调度开销所占百分比

id CPU空闲所占百分比

wa CPU空闲,但至少在等待一个I/O请求
shenji_db#[/]vmstat 2 5

System Configuration: lcpu=20 mem=8192MB

kthr memory page faults cpu
----- ----------- ------------------------ ------------ -----------
r b avm fre re pi po fr sr cy in sy cs us sy id wa
0 0 742643 1152851 0 0 0 0 0 0 15 135 246 0 0 99 0
0 0 742643 1152851 0 0 0 0 0 0 16 323 244 0 0 99 0
0 0 742643 1152851 0 0 0 0 0 0 10 62 238 0 0 99 0
0 0 742643 1152851 0 0 0 0 0 0 16 64 243 0 0 99 0
0 0 742643 1152851 0 0 0 0 0 0 9 76 252 0 0 99 0

iostat 查看当前系统中物理卷hdisk的使用情况

需要关注的字段

%tm_act 物理卷的平局活动程度

kbps 每秒种数据传输(读写)的吞吐量,单位是KB

tps 每秒向物理卷发出读写请求的数量
shenji_db#[/]iostat 2 5

System configuration: lcpu=20 drives=5 paths=8 vdisks=0

tty: tin tout avg-cpu: % user % sys % idle % iowait
0.0 29.5 0.0 0.0 99.9 0.0

Disks: % tm_act Kbps tps Kb_read Kb_wrtn
hdisk0 0.0 0.0 0.0 0 0
hdisk1 0.0 0.0 0.0 0 0
cd0 0.0 0.0 0.0 0 0
hdisk20 0.0 0.0 0.0 0 0
hdisk2 0.0 0.0 0.0 0 0

tty: tin tout avg-cpu: % user % sys % idle % iowait
0.0 260.0 0.2 0.3 99.5 0.0

Disks: % tm_act Kbps tps Kb_read Kb_wrtn
hdisk0 0.0 0.0 0.0 0 0
hdisk1 0.0 0.0 0.0 0 0
cd0 0.0 0.0 0.0 0 0
hdisk20 0.0 0.0 0.0 0 0
hdisk2 0.0 0.0 0.0 0 0

tty: tin tout avg-cpu: % user % sys % idle % iowait
0.0 260.0 0.0 0.0 100.0 0.0

Disks: % tm_act Kbps tps Kb_read Kb_wrtn
hdisk0 0.0 0.0 0.0 0 0
hdisk1 0.0 0.0 0.0 0 0
cd0 0.0 0.0 0.0 0 0
hdisk20 0.0 0.0 0.0 0 0
hdisk2 0.0 0.0 0.0 0 0

tty: tin tout avg-cpu: % user % sys % idle % iowait
0.0 260.0 0.0 0.0 100.0 0.0

Disks: % tm_act Kbps tps Kb_read Kb_wrtn
hdisk0 0.0 0.0 0.0 0 0
hdisk1 0.0 0.0 0.0 0 0
cd0 0.0 0.0 0.0 0 0
hdisk20 0.0 0.0 0.0 0 0
hdisk2 0.0 0.0 0.0 0 0

tty: tin tout avg-cpu: % user % sys % idle % iowait
0.0 260.0 0.0 0.0 100.0 0.0

Disks: % tm_act Kbps tps Kb_read Kb_wrtn
hdisk0 0.0 0.0 0.0 0 0
hdisk1 0.0 0.0 0.0 0 0
cd0 0.0 0.0 0.0 0 0
hdisk20 0.0 0.0 0.0 0 0
hdisk2 0.0 0.0 0.0 0 0

sar 查看系统中每个CPU的使用情况,也可以用于记录当前系统的运行的情况

需要关注的字段%user %sys %wio %idle

在与-d 选项使用时,注意

avque 等待访问磁盘的请求数量

avwait,avserv 平均等待时间和平均响应时间,单位是毫秒
shenji_db#[/]sar 2 10

AIX shenji_db 3 5 00C139AE4C00 05/26/14

System configuration: lcpu=20 mode=Capped

09:30:41 %usr %sys %wio %idle physc
09:30:43 0 0 0 100 9.99
09:30:45 0 0 0 100 10.01
09:30:47 1 1 0 98 10.02
09:30:49 0 0 0 100 9.99
09:30:51 0 0 0 100 10.01
09:30:53 0 0 0 100 10.01
09:30:55 0 0 0 100 10.00
09:30:57 1 2 0 97 9.96
09:30:59 0 0 0 100 10.01
09:31:01 0 0 0 100 10.03

Average 0 0 0 99 10.00

shenji_db#[/]sar -d 2 5

AIX shenji_db 3 5 00C139AE4C00 05/26/14

System configuration: lcpu=20 drives=5 mode=Capped

09:31:59 device %busy avque r+w/s Kbs/s avwait avserv

09:32:01 hdisk0 0 0.0 0 0 0.0 0.0
hdisk1 0 0.0 0 0 0.0 0.0
cd0 0 0.0 0 0 0.0 0.0
hdisk20 0 0.0 0 0 0.0 0.0
hdisk2 0 0.0 0 0 0.0 0.0

09:32:03 hdisk0 24 0.0 54 248 4.4 5.4
hdisk1 24 0.0 54 248 5.0 6.4
cd0 0 0.0 0 0 0.0 0.0
hdisk20 0 0.0 0 1 0.0 0.2
hdisk2 0 0.0 0 0 0.0 0.0

09:32:05 hdisk0 0 0.0 0 0 0.0 0.0
hdisk1 0 0.0 0 0 0.0 0.0
cd0 0 0.0 0 0 0.0 0.0
hdisk20 0 0.0 0 0 0.0 0.0
hdisk2 0 0.0 0 0 0.0 0.0

09:32:07 hdisk0 0 0.0 0 0 0.0 0.0
hdisk1 0 0.0 0 0 0.0 0.0
cd0 0 0.0 0 0 0.0 0.0
hdisk20 0 0.0 0 0 0.0 0.0
hdisk2 0 0.0 0 0 0.0 0.0

09:32:09 hdisk0 0 0.0 0 0 0.0 0.0
hdisk1 0 0.0 0 0 0.0 0.0
cd0 0 0.0 0 0 0.0 0.0
hdisk20 0 0.0 0 0 0.0 0.0
hdisk2 0 0.0 0 0 0.0 0.0

Average hdisk0 4 0.0 10 49 0.9 1.1
hdisk1 4 0.0 10 49 1.0 1.3
cd0 0 0.0 0 0 0.0 0.0
hdisk20 0 0.0 0 0 0.0 0.0
hdisk2 0 0.0 0 0 0.0 0.0

监控所有CPU情况#sar -P ALL 5 1
shenji_db#[/]sar -P ALL 5 1

AIX shenji_db 3 5 00C139AE4C00 05/26/14

System configuration: lcpu=20 mode=Capped

09:32:59 cpu %usr %sys %wio %idle physc
09:33:04 0 0 0 0 100 0.54
1 0 0 0 100 0.47
2 0 0 0 100 0.53
3 0 0 0 100 0.47
4 0 0 0 100 0.53
5 0 0 0 100 0.47
6 0 2 0 98 0.32
7 0 0 0 100 0.28
8 0 0 0 100 0.52
9 0 0 0 100 0.48
10 0 1 0 99 0.53
11 0 0 0 100 0.47
12 0 0 0 100 0.54
13 0 0 0 100 0.47
14 0 0 0 100 0.54
15 0 0 0 100 0.46
16 0 0 0 100 0.53
17 0 0 0 100 0.47
18 0 0 0 100 0.52
19 0 0 0 100 0.47
- 0 0 0 100 9.61

netstat 参看当前系统网络的运行

常用选项

-i 显示与网络接口相关的信息

-r 显示当前系统的路由信息

-p 各种网络协议使用的统计信息

在解读统计信息时,请关注相关的overflow 或者 error字段
shenji_db#[/]netstat -i
Name Mtu Network Address Ipkts Ierrs Opkts Oerrs Coll
en1 1500 link#2 0.11.25.c0.74.70 128286712 0 9520125 4 0
en1 1500 172.24.49 shenji_db 128286712 0 9520125 4 0
en2 1500 link#3 0.11.25.bd.66.83 25007641 0 168999 2 0
en2 1500 193.65.100 net11.otamedia.fi 25007641 0 168999 2 0
lo0 16896 link#1 5963252 0 6012942 0 0
lo0 16896 127 loopback 5963252 0 6012942 0 0
lo0 16896 ::1 5963252 0 6012942 0 0

shenji_db#[/]netstat -r
Routing tables
Destination Gateway Flags Refs Use If Exp Groups

Route tree for Protocol Family 2 (Internet):
default 172.24.49.1 UG 5 3533587 en1 - - =>
default 172.24.22.129 UG 1 5947912 en1 - -
127/8 loopback U 7 335121 lo0 - -
172.24.49.0 shenji_db UHSb 0 0 en1 - - =>
172.24.49/25 shenji_db U 1 736 en1 - -
shenji_db loopback UGHS 0 1601 lo0 - -
172.24.49.127 shenji_db UHSb 0 0 en1 - -
193.65.100.0 net11.otamedia.fi UHSb 0 0 en2 - - =>
193.65.100/24 net11.otamedia.fi U 0 156109 en2 - -
net11.otamedia.fi loopback UGHS 1 4488786 lo0 - -
193.65.100.255 net11.otamedia.fi UHSb 0 0 en2 - -

Route tree for Protocol Family 24 (Internet v6):
::1 ::1 UH 0 1137864 lo0 - -

topas 在一屏上显示当前系统的整体运行情况

什么是%iowait

CPU用于等待I/O请求处理结果的百分比,CPU的状态是空闲

加高的%iowait并不一定表明系统中磁盘是瓶颈,只是说明

1)当前运行的应用是IO密集型应用,如备份操作

2)通过增加CPU密集型的操作可以使用%iowait降到0

较低的%iowait也不意味磁盘不是瓶颈,当CPU非常忙,没有空闲时间,同时使用iostat 命令检查磁盘的运行情况

%iowait不是一个磁盘性能的衡量指标
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息