您的位置：首页 > 理论基础 > 计算机网络

Redis(开发与运维):58---开发运维的陷阱之（Linux配置优化：内存分配控制(overcommit、swappiness)、THP、OOM killer、NTP、TCP backlog

2020-06-04 22:10 274 查看

通常来看，Redis开发和运维人员更加关注的是Redis本身的一些配置优化，例如AOF和RDB的配置优化、数据结构的配置优化等，但是对于操作系统是否需要针对Redis做一些配置优化不甚了解或者不太关心。然而事实证明一个良好的系统操作配置能够为Redis服务良好运行保驾护航

一、内存分配控制

vm.overcommit_memory

Redis在启动时可能会出现这样的日志，说明vm.overcommit_memory=0，Redis提示把它设置为1：

什么是overcommit：Linux操作系统对大部分申请内存的请求都回复yes，以便能运行更多的程序。因为申请内存后，并不会马上使用内存，这种技术叫做overcommit

vm.overcommit_memory用来设置内存分配策略，有三个可选值，如下图所示：

日志中的Background save代表的是bgsave和bgrewriteaof，如果当前可用内存不足，操作系统应该如何处理fork操作。如果 vm.overcommit_memory=0，代表如果没有可用内存，就申请内存失败，对应到Redis就是执行fork失败，在Redis的日志会出现：

Redis建议把这个值设置为1，是为了让fork操作能够在低内存下也执行成功

获取和设置的命令如下：
[code]# 获取
cat /proc/sys/vm/overcommit_memory

# 设置(需要root身份)
echo "vm.overcommit_memory=1" > /etc/sysctl.conf
sysctl vm.overcommit_memory=1
最佳实践： Redis设置合理的maxmemory，保证机器有20%~30%的闲置内存

集中化管理AOF重写和RDB的bgsave

设置vm.overcommit_memory=1，防止极端情况下会造成fork失败

swappiness

swap对于操作系统来比较重要，当物理内存不足时，可以将一部分内存页进行swap操作，已解燃眉之急。但世界上没有免费午餐，swap空间由硬盘提供，对于需要高并发、高吞吐的应用来说，磁盘IO通常会成为系统瓶颈

在Linux中，并不是要等到所有物理内存都使用完才会使用到swap，系统参数swppiness会决定操作系统使用swap的倾向程度。swappiness的取值范围是0~100，swappiness的值越大，说明操作系统可能使用swap的概率越高，swappiness值越低，表示操作系统更加倾向于使用物理内存。swap的默认值是60，了解这个值的含义后，有利于Redis的性能优化

下图对swappiness的重要值进行了说明：

运维提示：OOM（Out Of Memory）killer机制是指Linux操作系统发现可用内存不足时，强制杀死一些用户进程（非内核进程），来保证系统有足够的可用内存进行分配

从上图中可以看出，swappiness参数在Linux3.5版本前后的表现并不完全相同，Redis运维人员在设置这个值需要关注当前操作系统的内核版本

设置方法

swappiness设置方法如下：
[code]echo {bestvalue} > /proc/sys/vm/swappiness
但是上述方法在系统重启后就会失效，为了让配置在重启Linux操作系统后立即生效，只需要在/etc/sysctl.conf追加vm.swappiness={bestvalue}即可
[code]echo vm.swappiness={bestvalue} >> /etc/sysctl.conf
查看swap的总体情况

Linux提供了free命令来查询操作系统的内存使用情况，其中也包含了swap的相关使用情况

下面是某台Linux服务器执行free –m（以兆为单位）的结果，其中需要重点关注的是最后一行的swap统计，从执行结果看， swap一共有974MB，使用了0MB，空闲974MB

在另一台Linux服务器同样执行free -m，这台服务器开启了8189M swap，其中使用了5241MB

实时查看swap的使用

Linux提供了vmstat命令查询系统的相关性能指标，其中包含负载、 CPU、内存、swap、IO的相关属性。但其中和swap有关的指标是si和so，它们分别代表操作系统的swap in和swap out

下面是执行vmstat 1（每隔一秒输出）的效果，可以看到si和so都为0，代表当前没有使用swap

查看指定进程的swap使用情况

Linux操作系统中，/proc/{pid}目录是存储指定进程的相关信息，其中/proc/{pid}/smaps记录了当前进程所对应的内存映像信息，这个信息对于查询指定进程的swap使用情况很有帮助

下面以一个Redis实例进行说明，通过info server获取Redis的进程号process_id：

通过下面的命令查询Redis的smaps信息，由于有多个内存块信息，所以会输出多个内存块镜像信息：
[code]cat /proc/1908/smaps
其中Swap字段代表该内存块存在swap分区的数据大小。通过执行如下命令，就可以找到每个内存块镜像信息中，这个进程使用到的swap量，通过求和就可以算出总的swap用量：

如果Linux>3.5，vm.swapniess=1，否则vm.swapniess=0，从而实现如下两个目标： 物理内存充足时候，使Redis足够快

物理内存不足时候，避免Redis死掉（如果当前Redis为高可用，死掉比阻塞更好）

二、THP

Redis在启动时可能会看到如下日志：

从提示看Redis建议修改Transparent Huge Pages（THP）的相关配置， Linux kernel在2.6.38内核增加了THP特性，支持大内存页（2MB）分配，默认开启。当开启时可以降低fork子进程的速度，但fork操作之后，每个内存页从原来4KB变为2MB，会大幅增加重写期间父进程内存消耗。同时每次写命令引起的复制内存页单位放大了512倍，会拖慢写操作的执行时间，导致大量写操作慢查询，例如简单的incr命令也会出现在慢查询中
因此Redis日志中建议将此特性进行禁用，禁用方法如下：

[code]echo never > /sys/kernel/mm/transparent_hugepage/enabled

为了使机器重启后THP配置依然生效，可以在/etc/rc.local中追加echo never>/sys/kernel/mm/transparent_hugepage/enabled
在设置THP配置时需要注意：有些Linux的发行版本没有将THP放到/sys/kernel/mm/transparent_hugepage/enabled中，例如Red Hat6以上的THP配置放到/sys/kernel/mm/redhat_transparent_hugepage/enabled中。而Redis源码中检查THP时，把THP位置写死：

[code]FILE *fp = fopen("/sys/kernel/mm/transparent_hugepage/enabled","r");
if (!fp) return 0;

所以在发行版中，虽然没有THP的日志提示，但是依然存在THP所带来的问题

三、OOM killer

OOM killer会在可用内存不足时选择性地杀掉用户进程，它的运行规则是怎样的，会选择哪些用户进程“下手”呢？ OOM killer进程会为每个用户进程设置一个权值，这个权值越高，被“下手”的概率就越高，反之概率越低
每个进程的权值存放在/proc/{progress_id}/oom_score中，这个值是受/proc/{progress_id}/oom_adj的控制，oom_adj在不同的Linux版本中最小值不同，可以参考Linux源码中oom.h（从-15到-17）

当oom_adj设置为最小值时，该进程将不会被OOM killer杀掉，设置方法如下：

[code]echo {value} > /proc/${process_id}/oom_adj

对于Redis所在的服务器来说，可以将所有Redis的oom_adj设置为最低值或者稍小的值，降低被OOM killer杀掉的概率：

[code]for redis_pid in $(pgrep -f "redis-server")
do
echo -17 > /proc/${redis_pid}/oom_adj
done

运维提示： 有关OOM killer的详细细节，可以参考Linux源码mm/oom_kill.c中 oom_badness函数
个人认为oom_adj参数只能起到辅助作用，合理地规划内存更为重要
通常在高可用情况下，被杀掉比僵死更好，因此不要过多依赖oom_adj配置

四、NTP

NTP（Network Time Protocol，网络时间协议）是一种保证不同机器时钟一致性的服务
我们知道像Redis Sentinel和Redis Cluster这两种功能需要多个Redis节点的类型，可能会涉及多台服务器。虽然Redis并没有对多个服务器的时钟有严格要求，但是假如多个Redis实例所在的服务器时钟不一致，对于一些异常情况的日志排查是非常困难的，例如Redis Cluster的故障转移，如果日志时间不一致，对于我们排查问题带来很大的困扰（注：但不会影响集群功能，集群节点依赖各自时钟）。一般公司里都会有NTP服务用来提供标准时间服务，从而达到纠正时钟的效果（如下图所示），为此我们可以每天定时去同步一次系统时间，从而使得集群中的时间保持统一

例如每小时的同步1次NTP服务：

[code]0 * * * * /usr/sbin/ntpdate ntp.xx.com > /dev/null 2>&1

五、ulimit

在Linux中，可以通过ulimit查看和设置系统当前用户进程的资源数
其中ulimit-a命令包含的open files参数，是单个用户同时打开的最大文件个数：

Redis允许同时有多个客户端通过网络进行连接，可以通过配置maxclients来限制最大客户端连接数。对Linux操作系统来说，这些网络连接都是文件句柄。假设当前open files是4096，那么启动Redis时会看到如下日志：

[code]# You requested maxclients of 10000 requiring at least 10032 max file descriptors.
# Redis can’t set maximum open files to 10032 because of OS error: Operation not permitted.
# Current maximum open files is 4096. Maxclients has been reduced to 4064 to compensate
for low ulimit. If you need higher maxclients increase ‘ulimit –n’.

日志解释如下： 第一行：Redis建议把open files至少设置成10032，那么这个10032是如何来的呢？因为maxclients默认是10000，这些是用来处理客户端连接的，除此之外，Redis内部会使用最多32个文件描述符，所以这里的 10032=10000+32
第二行：Redis不能将open files设置成10032，因为它没有权限设置
第三行：当前系统的open files是4096，所以将maxclients设置成4096-32=4064个，如果你想设置更高的maxclients，请使用ulimit-n来设置

从上面的三行日志分析可以看出open files的限制优先级比maxclients 大

Open files的设置方法如下：

[code]ulimit -Sn {max-open-files}

六、TCP backlog

Redis默认的tcp-backlog值为511，可以通过修改配置tcp-backlog进行调整

如果Linux的tcp-backlog小于Redis设置的tcp-backlog，那么在Redis启动时会看到如下日志：

查看方法：

[code]cat /proc/sys/net/core/somaxconn

修改方法：

[code]echo 511 > /proc/sys/net/core/somaxconn

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航