您的位置：首页 > 数据库 > Memcache

memcached介绍及原理

2014-12-09 10:25 127 查看

memcached介绍及原理

memcached是一种缓存技术，存储在内存中(高性能分布式内存缓存服务器)。目的：提速。（传统的都是把数据保存在关系型数据库管理系统即RDBMS，客户端请求时会从RDBMS中读取数据并在浏览器中显示，这样当访问量过大时或集中时，导致RSBMS负担过重，数据库响应恶化，浏览器中显示延迟等严重问题，使用memcached减少数据库查询和访问次数以提高访问速度，提高扩展性）
memcached为key->value非关系型数据库，key为一般字串，值唯一。value除了php中的资源不能存，其它的数据都能存储（字符串、数值、数组、对象、布尔值、null、二进制<图片、视频>）
提速方法：
1、传统：模拟cached方法（存储到数据库时生成一份静态文件到磁盘中）
2、直接操作内存（内存表，memcached服务维持了一张内存表 hashdata）
3、CPU寄存器（最高速的，但是代价成本高）
memcached特征：
1、协议简单（文本行协议）
2、基于libevent事件处理（注：libevent是一个程序库，封装了linux的epoll、BSD类操作系统的kqueue等事件处理功能。即使对服务器的连接数添加，也能发挥O(1)的性能。memcached在linux、BSD等操作系统上能发挥其高性能。）
3、内置内存存储方式(存储在memcached内置的内存存储空间中，提高性能。问题：memcached重启或操作系统重启数据会丢失，达到一定量后会启动算法自动删除不使用的缓存)
4、不互相通信的分布式（不互相通信共享信息。）

memcached作用：
1、高性能分布式缓存服务器（缓存数据库查询结果，减少数据库访问次数）
缓存读取/写入过程见下图

memcached适合做的东西：
1、访问频繁的字典数据
2、大量的hot数据（热门数据缓存）
3、页面缓存（web站常用）
4、搜索的查询条件和结果（热门搜索的内容缓存起来）
5、临时处理数据（不需要入库，排重）
memcache工作原理：
memcache 的工作就是在专门的机器的内存里维护一张巨大的 hash 表，来存储经常被读写的一些数组与文件，从而极大的提高网站的运行效率。
采用的是C/S模式，在 server 端启动服务进程，在启动时可以指定监听的 ip，自己的端口号，所使用的内存大小等几个关键参数。采用了单进程，单线程，异步I/O，基于事件 (event_based) 的服务方式.使用 libevent 作为事件通知实现。每个 Server 只是对自己的数据进行管理。Client 端通过指定 Server 端的 ip 地址(通过域名应该也可以)。以key->value形式，key 的值通过 hash 进行转换，然后确定对那台sever存储/获取数据。
memcache内存算法：
使用的是slab allocation机制分配和管理内存，按照预先规定的大小，将分配的内存分割成特定长度的内存块，再把尺寸相同的内存块分成组，数据在存放时，根据键值大小去匹配slab大小，找就近的slab存放，所以存在空间浪费现象。
memcached缓存策略：
是LRU（最近最少使用）加上到期失效策略。当你在memcached内存储数据项时，你有可能会指定它在缓存的失效时间，默认为永久。当memcached服务器用完分配的内时，失效的数据被首先替换，然后也是最近未使用的数据。在LRU中，memcached使用的是一种Lazy Expiration策略，自己不会监控存入的key/vlue对是否过期，而是在获取key值时查看记录的时间戳，检查key/value对空间是否过期，这样可减轻服务器的负载。
memcached失效策略：
Lazy expiration + LRU
Lazy expiration作用:假如我们所存储的数据项相当多的时候，在这时候进行监控的话，花费的代价是相当大的，所以memcached不会在过期监视上耗费过多的CPU时间，从而在性能方面也起到一定的优化作用。
LRU:memcache会优先使用已超时的空间，但是还是会有追加信息时空间不足的状态，这时候会使用Least Recently Used（LRU）机制来分配空间，就从最近未被使用的记录中搜索，并将其空间分配给新的记录。
memcached分布式算法：
当向memcached集群存入/取出key/value时，memcached客户端会根据一定算法计算存入那台服务器。（第一步：选择服务器，第二步：存取数据）
余数算法：先求得键的整数散列值，再除以服务器数量，根据余数觉得存储那台服务器。（特点：简单、高效。但是扩展性差，服务器数量变更时，几乎所有的缓存都会失效）
散列算法：先计算memcached的散列值，并将其分布在0—2^32的圆上，然后用同样的方法算出存储数据键的散列值并映射至圆上，最后从数据映射到的位置开始顺顺时针查找，将数据保存在查找到的第一台服务器，如果超过2^32还是找不到，则将数据保存在第一台memcached服务器上。如果添加一台memcached服务器，则只在圆上添加的逆时针方向的第一台服务器上的键会受到影响。

memcached与redis比较

	cpu	内存利用率	持久性	数据结构	工作环境
memcached	支持多核	高	无	简单	linux/windows
redis	单核	低（采用压缩会比memcached高）	有（硬盘存储，主从同步）	复杂	linux

注：
散列值：将值从一个大的（可能很大）定义域映射到一个较小值域的（数学）函数。散列函数是把该函数应用到大的定义域中的若干值的（大）集合的结果可以均匀地（和随机地）被分布在该范围上。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航