您的位置：首页 > 大数据 > 人工智能

aerospike与tair对比

2015-07-28 14:42 579 查看

1. 性能不弱于ssdb+rocksdb，功能上尽量兼容
tair性能数据未知，从网上查到一些数据，但感觉可信度不高，需要自己测下，不过如果考虑换用ROCKSDB的存储引擎，性能应该和SpringDB相当
areospike的论文中，提到单机读22万qps, 单机写15万tps，但机器配置较低，而且没有介绍数据大小，只能作为简单参考。

2. 跨机房的复制方案
tair支持双机房部署主备两个集群，元数据服务器config server 会负责监控集群健康状态.
aerospike支持多种跨机房部署方式：active-passive, active-active, star等，active集群的node宕机了，则会先将数据同步给备集群去，保证服务持续可用；如果备集群宕机，则主集群会记录数据流同步的断开点，当连接回复后，继续同步；另外，支持按照namepspace为部署单位。
跨机房的数据同步模块XDR模块开源版本并没有实现，可以自己实现。

3. 扩容方便（稳定）
tair一致性哈希数据分布，如果哈希函数分布均匀，则保证了整个集群数据的负载均衡，对于热点桶还没有看到有特殊均衡策略。扩容即按照一致性哈希方法进行。
aerospike 同样采用一致性哈希管理数据分布，但没有中心节点，使用paxos选举协议统一所有节点对集群状态的认知。

4. 更高效的利用内存。Hybrid Storage，冷热数据
tari如果采用levelDB/rocksDB的存储引擎，冷热数据的区分主要靠memtable以及sstable，另外使用存储引擎的blck/row cache作为补充
aerospike也只有内存中索引数据和磁盘（固体盘/机械盘），没有更多冷热数据的级别。

其他：
1. 最好可以和redis兼容
tair不能完全支持redis，只有接口只支持List 和Map和普通KV以及自定义的类型
aerospike支持以下类型：int string 比特流 list map和自定义的序列化数据，并且支持list和map的组合，接口比air更丰富一些，而且支持同一个set的不同record有不同的bin。

2. 长数据支持友好
tair没有对长数据做专门设计，所有使用sstable来组织数据，多列数据会拆分成多个<key,value>存取，同一个容器内的数据一般来说是存在同一个sstable中（有可能被分隔）
aerospike的大数据支持分为两种：
大得List：单独有B+树索引，元素无数量上限；
大数据支持：指的是一个列（bin)很大，则单独使用sub-record存储，其类型可以是任意支持的类型，其大小是1KB- 1MB（取决于磁盘的块大小)，和父record共享锁和访问接口长数据应该是不可嵌套存储的(即长数据中不可再包含长数据）

3. 过期时间的支持效率好
tair在接口中可以指定数据的过期时间，过期后则对外不可见，资源回收的方式没有查到，需要看代码搞清楚，猜测是后台线程批量执行，对于levelDB存储引擎，猜测是合并时候才会执行过期数据删除。
areospike中没行都有过期的时间戳，有个专门额组件Degragmenter负载回收内存和磁盘数据，这个Degragmenter应该就是个后台线程，猜测定时+资源紧张时候出发其工作。

4. SSD空间占用小，支持压缩
tair使用levelDB存储引擎的话，是使用snappy压缩算法，压缩比率75%。
aerospike在其公开资料中没有找到相关说明，需要看代码进一步确定。

5. 更冷的数据？
tair和aerospike对更冷的数据都没有支持。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航