Twitter的分布式雪花算法 SnowFlake 每秒自增生成26个万个可排序的ID (Java版)
2018-03-13 16:53
1071 查看
分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。
有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。
而twitter的SnowFlake解决了这种需求,最初Twitter把存储系统从MySQL迁移到Cassandra,因为Cassandra没有顺序ID生成机制,所以开发了这样一套全局唯一ID生成服务。
SnowFlake算法产生的ID是一个64位的整型,结构如下(每一部分用“-”符号分隔):
1位标识部分,在java中由于long的最高位是符号位,正数是0,负数是1,一般生成的ID为正数,所以为0;
41位时间戳部分,这个是毫秒级的时间,一般实现上不会存储当前的时间戳,而是时间戳的差值(当前时间-固定的开始时间),这样可以使产生的ID从更小值开始;41位的时间戳可以使用69年,(1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69年;
10位节点部分,Twitter实现中使用前5位作为数据中心标识,后5位作为机器标识,可以部署1024个节点;
12位序列号部分,支持同一毫秒内同一个节点可以生成4096个ID;
SnowFlake算法生成的ID大致上是按照时间递增的,用在分布式系统中时,需要注意数据中心标识和机器标识必须唯一,这样就能保证每个节点生成的ID都是唯一的。或许我们不一定都需要像上面那样使用5位作为数据中心标识,5位作为机器标识,可以根据我们业务的需要,灵活分配节点部分,如:若不需要数据中心,完全可以使用全部10位作为机器标识;若数据中心不多,也可以只使用3位作为数据中心,7位作为机器标识。
snowflake生成的ID整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由datacenter和workerId作区分),并且效率较高。据说:snowflake每秒能够产生26万个ID。
循环生成的ID,运行结果如下:
Spring Cloud(二)Consul 服务治理实现
Spring Cloud(三)服务提供者 Eureka + 服务消费者(rest + Ribbon)
Spring Cloud(四)服务提供者 Eureka + 服务消费者 Feign
Spring Cloud(五)断路器监控(Hystrix Dashboard)
Spring Cloud(六)服务网关 zuul 快速入门
Spring Cloud(七)服务网关 Zuul Filter 使用
Spring Cloud(八)高可用的分布式配置中心 Spring Cloud Config
Spring Cloud(九)高可用的分布式配置中心 Spring Cloud Config 集成 Eureka 服务
Spring Cloud(十)高可用的分布式配置中心 Spring Cloud Config 中使用 Refresh
Spring Cloud(十一)高可用的分布式配置中心 Spring Cloud Bus 消息总线集成(RabbitMQ)
Github:https://github.com/souyunku/spring-boot-examples
Docker CE 安装 初窥 Dockerfile 部署 Nginx
Docker Container 容器操作
Docker Hub 仓库使用,及搭建 Docker Registry
Docker Registry Server 搭建,配置免费 HTTPS 证书,及拥有权限认证、TLS 的私有仓库
Docker Registry 企业级私有镜像仓库Harbor管理WEB UI, 可能是最详细的部署
Docker 部署 SpringBoot 项目整合 Redis 镜像做访问计数 Demo
Docker Maven Plugin 生成 Docker 镜像 push 到 DockerHub上
手把手教你 MongoDB 的安装与详细使用(一)
手把手教你 MongoDB 的安装与详细使用(二)
搭建 MongoDB分片(sharding) / 分区 / 集群环境
搭建 SolrCloud 集群服务
搭建 Solr 单机服务
搭建 RabbitMQ 集群服务
搭建 RabbitMQ 单机服务
Mycat 读写分离 数据库分库分表 中间件 安装部署,及简单使用
离线部署 CDH 5.12.1 及使用 CDH 部署 Hadoop 大数据平台集群服务
出处:http://www.ymq.io
版权归作者所有,转载请注明出处
Wechat:关注公众号,搜云库,专注于开发技术的研究与知识分享
有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。
而twitter的SnowFlake解决了这种需求,最初Twitter把存储系统从MySQL迁移到Cassandra,因为Cassandra没有顺序ID生成机制,所以开发了这样一套全局唯一ID生成服务。
原理
Twitter的雪花算法SnowFlake,使用Java语言实现。SnowFlake算法产生的ID是一个64位的整型,结构如下(每一部分用“-”符号分隔):
0 - 0000000000 0000000000 0000000000 0000000000 0 - 00000 - 00000 - 000000000000
1位标识部分,在java中由于long的最高位是符号位,正数是0,负数是1,一般生成的ID为正数,所以为0;
41位时间戳部分,这个是毫秒级的时间,一般实现上不会存储当前的时间戳,而是时间戳的差值(当前时间-固定的开始时间),这样可以使产生的ID从更小值开始;41位的时间戳可以使用69年,(1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69年;
10位节点部分,Twitter实现中使用前5位作为数据中心标识,后5位作为机器标识,可以部署1024个节点;
12位序列号部分,支持同一毫秒内同一个节点可以生成4096个ID;
SnowFlake算法生成的ID大致上是按照时间递增的,用在分布式系统中时,需要注意数据中心标识和机器标识必须唯一,这样就能保证每个节点生成的ID都是唯一的。或许我们不一定都需要像上面那样使用5位作为数据中心标识,5位作为机器标识,可以根据我们业务的需要,灵活分配节点部分,如:若不需要数据中心,完全可以使用全部10位作为机器标识;若数据中心不多,也可以只使用3位作为数据中心,7位作为机器标识。
snowflake生成的ID整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由datacenter和workerId作区分),并且效率较高。据说:snowflake每秒能够产生26万个ID。
源码
本机实测:100万个ID 耗时5秒/** * 描述: Twitter的分布式自增ID雪花算法snowflake (Java版) * https://github.com/souyunku/SnowFlake * * @author yanpenglei * @create 2018-03-13 12:37 **/ public class SnowFlake { /** * 起始的时间戳 */ private final static long START_STMP = 1480166465631L; /** * 每一部分占用的位数 */ private final static long SEQUENCE_BIT = 12; //序列号占用的位数 private final static long MACHINE_BIT = 5; //机器标识占用的位数 private final static long DATACENTER_BIT = 5;//数据中心占用的位数 /** * 每一部分的最大值 */ private final static long MAX_DATACENTER_NUM = -1L ^ (-1L << DATACENTER_BIT); private final static long MAX_MACHINE_NUM = -1L ^ (-1L << MACHINE_BIT); private final static long MAX_SEQUENCE = -1L ^ (-1L << SEQUENCE_BIT); /** * 每一部分向左的位移 */ private final static long MACHINE_LEFT = SEQUENCE_BIT; private final static long DATACENTER_LEFT = SEQUENCE_BIT + MACHINE_BIT; private final static long TIMESTMP_LEFT = DATACENTER_LEFT + DATACENTER_BIT; private long datacenterId; //数据中心 private long machineId; //机器标识 private long sequence = 0L; //序列号 private long lastStmp = -1L;//上一次时间戳 public SnowFlake(long datacenterId, long machineId) { if (datacenterId > MAX_DATACENTER_NUM || datacenterId < 0) { throw new IllegalArgumentException("datacenterId can't be greater than MAX_DATACENTER_NUM or less than 0"); } if (machineId > MAX_MACHINE_NUM || machineId < 0) { throw new IllegalArgumentException("machineId can't be greater than MAX_MACHINE_NUM or less than 0"); } this.datacenterId = datacenterId; this.machineId = machineId; } /** * 产生下一个ID * * @return */ public synchronized long nextId() { long currStmp = getNewstmp(); if (currStmp < lastStmp) { throw new RuntimeException("Clock moved backwards. Refusing to generate id"); } if (currStmp == lastStmp) { //相同毫秒内,序列号自增 sequence = (sequence + 1) & MAX_SEQUENCE; //同一毫秒的序列数已经达到最大 if (sequence == 0L) { currStmp = getNextMill(); } } else { //不同毫秒内,序列号置为0 sequence = 0L; } lastStmp = currStmp; return (currStmp - START_STMP) << TIMESTMP_LEFT //时间戳部分 | datacenterId << DATACENTER_LEFT //数据中心部分 | machineId << MACHINE_LEFT //机器标识部分 | sequence; //序列号部分 } private long getNextMill() { long mill = getNewstmp(); while (mill <= lastStmp) { mill = getNewstmp(); } return mill; } private long getNewstmp() { return System.currentTimeMillis(); } public static void main(String[] args) { SnowFlake snowFlake = new SnowFlake(2, 3); long start = System.currentTimeMillis(); for (int i = 0; i < 1000000; i++) { System.out.println(snowFlake.nextId()); } System.out.println(System.currentTimeMillis() - start); } }
循环生成的ID,运行结果如下:
170916032679263329 170916032679263330 170916032679263331 170916032679263332 170916032679263333 170916032679263334 170916032679263335 170916032679263336 170916032679263337 170916032679263338 170916032679263339 170916032679263340 170916032679263341 170916032679263342
开源地址
Github:https://github.com/souyunku/SnowFlake推荐阅读
Spring Cloud 系列教程
Spring Cloud(一)服务的注册与发现 EurekaSpring Cloud(二)Consul 服务治理实现
Spring Cloud(三)服务提供者 Eureka + 服务消费者(rest + Ribbon)
Spring Cloud(四)服务提供者 Eureka + 服务消费者 Feign
Spring Cloud(五)断路器监控(Hystrix Dashboard)
Spring Cloud(六)服务网关 zuul 快速入门
Spring Cloud(七)服务网关 Zuul Filter 使用
Spring Cloud(八)高可用的分布式配置中心 Spring Cloud Config
Spring Cloud(九)高可用的分布式配置中心 Spring Cloud Config 集成 Eureka 服务
Spring Cloud(十)高可用的分布式配置中心 Spring Cloud Config 中使用 Refresh
Spring Cloud(十一)高可用的分布式配置中心 Spring Cloud Bus 消息总线集成(RabbitMQ)
Spring Boot 系列教程
源码 + 教程Github:https://github.com/souyunku/spring-boot-examples
Docker 容器
Docker Compose 1.18.0 之服务编排详解Docker CE 安装 初窥 Dockerfile 部署 Nginx
Docker Container 容器操作
Docker Hub 仓库使用,及搭建 Docker Registry
Docker Registry Server 搭建,配置免费 HTTPS 证书,及拥有权限认证、TLS 的私有仓库
Docker Registry 企业级私有镜像仓库Harbor管理WEB UI, 可能是最详细的部署
Docker 部署 SpringBoot 项目整合 Redis 镜像做访问计数 Demo
Docker Maven Plugin 生成 Docker 镜像 push 到 DockerHub上
环境搭建
搭建 Apache RocketMQ 单机环境手把手教你 MongoDB 的安装与详细使用(一)
手把手教你 MongoDB 的安装与详细使用(二)
搭建 MongoDB分片(sharding) / 分区 / 集群环境
搭建 SolrCloud 集群服务
搭建 Solr 单机服务
搭建 RabbitMQ 集群服务
搭建 RabbitMQ 单机服务
Mycat 读写分离 数据库分库分表 中间件 安装部署,及简单使用
离线部署 CDH 5.12.1 及使用 CDH 部署 Hadoop 大数据平台集群服务
Contact
作者:鹏磊出处:http://www.ymq.io
版权归作者所有,转载请注明出处
Wechat:关注公众号,搜云库,专注于开发技术的研究与知识分享
相关文章推荐
- Twitter的分布式雪花算法 SnowFlake 每秒自增生成26个万个可排序的ID (Java版)
- Twitter的分布式自增ID雪花算法snowflake (Java版)
- Twitter的分布式自增ID算法snowflake(Java版)
- Twitter的分布式自增ID算法snowflake (Java版)
- Twitter的分布式自增ID算法snowflake (Java版)
- Twitter的分布式自增ID算法snowflake的JAVA实现以及使用时需要注意的问题
- Twitter的分布式自增ID算法snowflake (Java版)
- Twitter开源分布式自增ID算法snowflake(Java)
- Twitter的分布式自增ID算法snowflake (Java版)
- Twitter的分布式自增ID算法snowflake(有改动Java版)
- Twitter的分布式自增ID算法snowflake (Java版)
- Twitter的分布式自增ID算法Snowflake实现分析及其Java、Php和Python版
- Twitter-Snowflake(64位分布式ID算法)分析与JAVA实现
- [转] Twitter的分布式自增ID算法Snowflake实现分析及其Java、Php和Python版
- Twitter的分布式自增ID算法snowflake (Java版)
- Twitter的分布式自增ID算法snowflake的JAVA实现以及使用时需要注意的问题
- Twitter的分布式自增ID算法snowflake (Java版)
- Twitter的分布式自增ID算法snowflake (Java版)
- Twitter的分布式自增ID算法snowflake (Java版)
- Twitter的分布式自增ID算法snowflake (Java版)