您的位置：首页 > 数据库 > Mongodb

MongoDB运行状态、性能监控，分析

2012-11-20 14:44 417 查看

这篇文章的目的是让你知道怎么了解你正在运行的Mongdb是否健康。原文（http://tech.lezi.com/archives/290）

mongostat详解

mongostat是mongdb自带的状态检测工具，在命令行下使用。它会间隔固定时间获取mongodb的当前运行状态，并输出。如果你发现数据库突然变慢或者有其他问题的话，你第一手的操作就考虑采用mongostat来查看mongo的状态。

它的输出有以下几列：

inserts/s 每秒插入次数
query/s 每秒查询次数
update/s 每秒更新次数
delete/s 每秒删除次数
getmore/s 每秒执行getmore次数
command/s 每秒的命令数，比以上插入、查找、更新、删除的综合还多，还统计了别的命令
flushs/s 每秒执行fsync将数据写入硬盘的次数。
mapped/s 所有的被mmap的数据量，单位是MB，
vsize 虚拟内存使用量，单位MB
res 物理内存使用量，单位MB
faults/s 每秒访问失败数（只有Linux有），数据被交换出物理内存，放到swap。不要超过100，否则就是机器内存太小，造成频繁swap写入。此时要升级内存或者扩展
locked % 被锁的时间百分比，尽量控制在50%以下吧
idx miss % 索引不命中所占百分比。如果太高的话就要考虑索引是不是少了
q t|r|w 当Mongodb接收到太多的命令而数据库被锁住无法执行完成，它会将命令加入队列。这一栏显示了总共、读、写3个队列的长度，都为0的话表示mongo毫无压力。高并发时，一般队列值会升高。
conn 当前连接数
time 时间戳

使用profiler

类似于MySQL的slow
log,MongoDB可以监控所有慢的以及不慢的查询。

Profiler默认是关闭的，你可以选择全部开启，或者有慢查询的时候开启。

1	> use test

2	switched to db test

3	> db.setProfilingLevel(2);

4	{ "was" : 0 , "slowms" : 100, "ok" : 1} // "was" is the old setting

5	> db.getProfilingLevel()

上面斜体的级别可以取0，1，2 三个值，他们表示的意义如下：

　　0 – 不开启

　　1 – 记录慢命令 (默认为>100ms)

　　2 – 记录所有命令

　　Profile 记录在级别1时会记录慢命令，那么这个慢的定义是什么?上面我们说到其默认为100ms，当然有默认就有设置，其设置方法和级别一样有两种，一种是通过添加–slowms启动参数配置。第二种是调用db.setProfilingLevel时加上第二个参数：

db.setProfilingLevel( level ,slowms )

　　db.setProfilingLevel( 1 ,10 );

查看Profile日志

1	> db.system.profile.find().sort({$natural:-1})

2	{ "ts" : "Thu Jan 29 2009 15:19:32 GMT-0500 (EST)" , "info" :

3	"query test.$cmd ntoreturn:1 reslen:66 nscanned:0 query:{profile:2 } nreturned:1 bytes:50" ,

4	"millis" : 0} ...

3个字段的意义

ts：时间戳
info：具体的操作
millis：操作所花时间，毫秒

不多说，此处有官方文档。注意，造成满查询可能是索引的问题，也可能是数据不在内存造成因此磁盘读入造成。

使用Web控制台

Mongodb自带了Web控制台，默认和数据服务一同开启。他的端口在Mongodb数据库服务器端口的基础上加1000，如果是默认的Mongodb数据服务端口(Which
is 27017)，则相应的Web端口为28017

这个页面可以看到

当前Mongodb的所有连接
各个数据库和Collection的访问统计，包括：Reads,Writes,Queries,GetMores ,Inserts,Updates,Removes
写锁的状态
以及日志文件的最后几百行（CentOS+10gen yum 安装的mongodb默认的日志文件位于/var/log/mongo/mongod.log)

可以参考右边的截图

db.stat()

获取当前数据库的信息，比如Obj总数、数据库总大小、平均Obj大小等

01	> use test

02	switched to db test

03	> db.stats()

05	"collections" : 9,

06	"objects" : 4278845,

07	"avgObjSize" : 224.56603031892953,

08	"dataSize" : 960883236,

09	"storageSize" : 1195438080,

10	"numExtents" : 59,

11	"indexes" : 13,

12	"indexSize" : 801931264,

13	"fileSize" : 6373244928,

"ok"

:
1

db.serverStatus()

获取服务器的状态

{

"host" :"abc1234567890",--server的hostname,这里是计算机的名称

"version" :"2.2.2",--MongoDB的版本号

"process" :"mongod",--MongoDB的进程名称

"pid" :2996,--MongoDB的进程PID

"uptime" :511789,--启动时间(单位:s）

"uptimeMillis" :NumberLong(511789041),

"uptimeEstimate" :505769,--基于MongoDB内部粗粒度定时器的运行时间

"localTime" :ISODate("2012-12-26T00:42:26.576Z"),--server的本地时间

"locks" :{

"." :{

"timeLockedMicros" :{

"R" :NumberLong(9909170),

"W" :NumberLong(105416165)

},

"timeAcquiringMicros" :{

"R" :NumberLong(13023043),

"W" :NumberLong(2050090)

}

},

"admin" :{

"timeLockedMicros" :{

},

"timeAcquiringMicros" :{

}

},

"local" :{

"timeLockedMicros" :{

"r" :NumberLong(553001),

"w" :NumberLong(0)

},

"timeAcquiringMicros" :{

"r" :NumberLong(36574),

"w" :NumberLong(0)

}

},

"Dobug" :{

"timeLockedMicros" :{

"r" :NumberLong(1517233),

"w" :NumberLong(83584)

},

"timeAcquiringMicros" :{

"r" :NumberLong(112682),

"w" :NumberLong(7)

}

}

},

"globalLock" :{

"totalTime" :NumberLong("511789041000"),--自实例启动全局锁创建以来到现在多长时间，单位微秒.

"lockTime" :NumberLong(105416165),--自全局锁创建以来锁定总时间，单位微秒

"currentQueue" :{

"total" :0,--等待全局锁的队列中操作数目

"readers" :0,--等待读锁的队列中操作数目

"writers" :0--等待写锁的队列中操作数目

},

"activeClients" :{

"total" :0,--连接到server的当前活动client数目

"readers" :0,--执行读操作的当前活动client数目

"writers" :0--执行写操作的当前活动client数目

}

},

"mem" :{

"bits" :64,--64位机器

"resident" :31,--占用物理内存量

"virtual" :20478,--占用的虚拟内存量

"supported" :true,--是否支持扩展内存

"mapped" :10188,--映射到内存的数据文件大小，很接近于你的所有数据库大小。

"mappedWithJournal" :20376

},

"connections" :{

"current" :1,--当前活动连接量。连接到server的当前活跃连接数目

"available" :19999--剩余空闲连接量。剩余的可用连接数目

},

"extra_info" :{

"note" :"fields vary by platform",

"page_faults" :25747,

"usagePageFileMB" :106,

"totalPageFileMB" :12151,

"availPageFileMB" :6195,

"ramMB" :6007

},

"indexCounters" :{

"note" :"not supported on this platform"

},

"backgroundFlushing" :{

"flushes" :8527,--数据库刷新写到磁盘的次数

"total_ms" :599904,--数据库刷新数据到磁盘花费的微秒数

"average_ms" :70.35346546264806,--执行单次刷新花费的平均微秒数

"last_ms" :51,--最后一次执行完成刷新数据到磁盘花费的微秒数

"last_finished" :ISODate("2012-12-26T00:41:32.013Z")-当最后一次刷新数据完成时的时间戳

},

"cursors" :{

"totalOpen" :0,--server为client保持的游标（cursor）总数

"clientCursors_size" :0,

"timedOut" :0--server启动以来游标（cursor）超时的总数

},

"network" :{

"bytesIn" :1925,--发送到数据库的数据总量（bytes）

"bytesOut" :4294,--数据库发出的数据总量（bytes）

"numRequests" :24--发送到数据库的请求量

},

"opcounters" :{

"insert" :0,--server启动以来总的insert数据量

"query" :16646,--server启动以来总的query数据量

"update" :1,--server启动以来总的update数据量

"delete" :0,--server启动以来总的delete数据量

"getmore" :0,--server启动以来调用任何游标的getMore总次数

"command" :22 --server启动以来执行其他命令的总次数

},

"asserts" :{

"regular" :0,--server启动以来抛出正规断言（assert 类似于异常处理的形式）总数目

"warning" :0,--server启动以来抛出的告警总数目

"msg" :0,--消息断言数目。服务器内部定义的良好字符串错误

"user" :0,--用户断言数目。用户产生的错误，譬如：磁盘空间满；重复键。

"rollovers" :0--server启动以来，assert counters have rolled over的次数

},

"writeBacksQueued" :false,--是否有从mongos执行的retry操作

"dur" :{

"commits" :29,--上一间隔journal日志发生commit的次数

"journaledMB" :0,--上一间隔写到journal日志的数据量（单位：MB）

"writeToDataFilesMB" :0,--上一间隔journal日志写到数据文件的数据量（单位：MB）

"compression" :0,

"commitsInWriteLock" :0,--写锁期间发生commits的次数

"earlyCommits" :0,--schedule时间前请求commit的次数

"timeMs" :{

"dt" :3004,

"prepLogBuffer" :0,--准备写journal日志花费的时间

"writeToJournal" :0,--写journal日志花费的实际时间

"writeToDataFiles" :0,--journal日志后写数据文件花费的时间

"remapPrivateView" :0

}

},

"recordStats"
:{

"accessesNotInMemory" :2,

"pageFaultExceptionsThrown" :1,

"Dobug" :{

"accessesNotInMemory" :2,

"pageFaultExceptionsThrown" :1

},

"local" :{

"accessesNotInMemory" :0,

"pageFaultExceptionsThrown" :0

}

},

"ok" :1--serverStatus是否返回正确

}

需要关心的地方：

connections 当前连接和可用连接数，听过一个同行介绍过，mongodb最大处理到2000个连接就不行了（要根据你的机器性能和业务来设定），所以设大了没意义。设个合理值的话，到达这个值mongodb就拒绝新的连接请求，避免被太多的连接拖垮。
indexCounters:btree:misses 索引的不命中数，和hits的比例高就要考虑索引是否正确建立。你看我的”missRatio” :3.543930204420982e-7，很健康吧。所以miss率在mongostat里面也可以看
其他的都能自解释，也不是查看mongo健康状况的关键，就不说明了。

db.currentOp()

Mongodb 的命令一般很快就完成，但是在一台繁忙的机器或者有比较慢的命令时，你可以通过db.currentOp()获取当前正在执行的操作。

在没有负载的机器上，该命令基本上都是返回空的

1	> db.currentOp()

2	{ "inprog" : [ ] }

以下是一个有负载的机器上得到的返回值样例：

1	{ "opid" : "shard3:466404288" , "active" : false , "waitingForLock" : false , "op" : "query" , "ns" : "sd.usersEmails" , "query" : {}, "client_s" : "10.121.13.8:34473" , "desc" : "conn" },

字段名字都能自解释。如果你发现一个操作太长，把数据库卡死的话，可以用这个命令杀死他

1	> db.killOp( "shard3:466404288" )

MongoDB Monitoring Service

MongoDB Monitoring Service(MMS)是Mongodb厂商提供的监控服务，可以在网页和Android客户端上监控你的MongoDB状况。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航