您的位置:首页 > 运维架构 > 网站架构

大型网站架构模式

2015-09-02 17:12 204 查看
本文是我看了《大型网站技术架构》后,对其中一些内容进行简要总结。这本书写的很不错,值得推荐!

分层

分层是将系统在纵向维度上切分成几个部分,每个部分负责一部分相对比较单一的职责,然后通过上层对下层的依赖和调用组成一个完整的系统。

网站分层架构

应用层:负责具体业务和视图展示,如网站首页及搜索输入和结果展示

服务层:为应用层提供服务支持,如用户管理服务,购物车服务等

数据层:提供数据存储访问服务,如数据库、缓存、文件、搜索引擎等

在实践中,大的分层结构内部还可以继续分层,如应用层可以再细分为视图层和业务逻辑层;服务层也可以细分为数据接口层(适配各种输入和输出的数据格式)和逻辑处理层。

分层架构是逻辑上的,在物理部署上,三层结构可以部署在同一个物理机器上,但是随着网站业务的发展,必然需要对已经分层的模块分离部署,即三层结构分别部署在不同的服务器上,使网站拥有更多的计算资源以应对越来越多的用户访问。

分层架构能够规划软件清晰的逻辑结构便于开发维护,还对网站支持高并发向分布式发展至关重要。

分割

分割是将系统在横向维度上进行切分。

网站越大,功能越复杂,服务和数据处理的种类也越多,将这些不同的功能和服务分割开来,包装成高内聚低耦合的模块单元,一方面有助于软件的开发和维护;另一方面,便于不同模块的分布式部署,提高网站的并发处理能力和功能扩展能力。

比如在应用层,将不同业务进行分割,如将购物车、论坛、搜索、广告分割成不同的应用,由独立的团队负责,部署在不同的服务器上。分割的粒度可以非常小,并且不管在逻辑上和物理上都可以独立。

分布式

分层和分割的一个主要目的就是为了切分后的模块便于分布式部署,即将不同的模块部署在不同的服务器上,通过远程调用协同工作。通过分布式,计算资源也就更多,并发访问和数据量也能提高,进而提升服务质量。

分布式的缺陷:

1、分布式意味着服务调用必须通过网络,这可能会对性能造成比较严重的影响;

2、服务器越多,服务器宕机的概率也就越大,一台服务器宕机造成的服务不可用可能会导致很多应用不可访问,使网站的可用性降低;

3、数据在分布式环境中保持数据一致性也非常困难,分布式事务也难以保证,这对网站业务正确性和业务流程有可能造成很大的影响;

4、分布式导致网站依赖错综复杂,开发管理维护困难

常用的分布式方案:

1、分布式应用和服务

将分层和分割后的应用和服务模块分布式部署,可以改善网站性能和并发性、加快开发和发布速度、减少数据库连接资源消耗、可以使不同应用复用共同的服务,便于业务扩展。

2、分布式静态资源

独立分布式部署网站静态资源,如JS、CSS、Logo图片等,并采用独立域名,即动静分离。静态资源分布式部署可以减轻应用服务器的负载压力;通过使用独立域名加快浏览器并发加载的速度

3、分布式数据和存储

除了对传统的关系数据库进行分布式部署外,为网站应用而生的各种NoSQL产品几乎都是分布式的。

4、分布式计算

严格来说,应用、服务、实时数据处理都是计算,网站除了要处理这些在线业务,还有很大一部分用户没有直观感受的后台业务要处理,包括搜索引擎的索引构建、数据仓库的数据分析统计等。目前网站普遍使用Hadoop及其MapReduce分布式计算框架进行此类批处理计算,其特点是移动计算而不是移动数据,将计算程序发布到数据所在位置以加速计算和分布式计算。

5、其他

可以支持网站线上服务器配置实时更新的分布式配置;分布式环境下实时并发和协同的分布式锁;支持云存储的分布式文件系统等

集群

分布式虽然将已分层和分割的模块独立部署,但是对于用户访问集中的模块(如网站首页),还需要将独立部署的服务器集群化,即多台服务器部署相同应用构成一个集群,通过负载均衡设备共同对外提供服务。

集群能够提供更好的并发特性。

缓存

缓存是将数据存放在距离计算最近的位置以加快处理速度。

在网站应用中,缓存不但可以加快数据访问速度,还可以减轻后端应用和数据存储的负载压力。

1、CDN

内容分发网络,部署在距离终端用户最近的网络服务商,用户的网络请求总是先到达其网络服务商,在这里缓存网站的一些静态资源,就可以以最快的速度返回给用户(如视频前的广告,从来都不卡...)

2、反向代理

反向代理属于网站前端架构的一部分,部署在网站的前端,当用户请求到达网站的数据中心时,最先访问的就是反向代理服务器,这里缓存网站的静态资源,无需将请求继续转发给应用服务器就能返回给用户。

3、本地缓存

在应用服务器本地缓存着热点数据,应用程序可以在本机内存中直接访问数据,而无需访问数据库。

4、分布式缓存

将数据缓存在一个专门的分布式缓存集群中,应用程序通过网络通信访问缓存数据。

异步

计算机软件发展的一个重要目标和驱动力是降低软件耦合性。分层、分割、分布都是系统解耦合的手段,此外异步也是一个重要手段。

在单一服务器内部可通过多线程共享内存队列的方式实现异步,处在业务操作前面的线程将输出写入到队列,后面的线程从队列中读取数据进行处理。

在分布式系统中,多个服务器集群通过分布式消息队列实现异步,分布式消息队列可以看作是内存队列的分布式部署。

异步架构是典型的生产者-消费者模式,两者不存在直接调用。

冗余

网站需要全天候运行,服务器随时可能出现故障。冗余需要进行数据冗余备份,这样当某台服务器宕机时,可以将其上的服务和数据访问转移到其他机器上。

访问和负载很小的服务也必须部署至少两台服务器构成一个集群,其目的就是通过冗余实现服务高可用。

数据除了定期备份,存档保存,实现冷备份外,为了保证在线业务高可用,还需要对数据进行主从分离,实时同步实现热备份。

自动化

目前大型网站的自动化架构设计主要集中在发布运维方方面。

安全

网站在安全架构方面也积累了许多模式:

1、通过密码、手机校验码进行身份确认;

2、登录、交易等操作需要对网络通信进行加密;

3、网站服务器上存储的敏感数据如用户信息等也进行加密处理;

4、为了防止机器人程序滥用网络资源攻击网站,使用验证码进行识别;

5、对常见的用于攻击网站的XSS供给、SQL注入,进行编码转换等相应处理;

6、对于垃圾信息、敏感信息进行过滤;

7、对于交易转账等重要操作根据交易模式和交易信息进行风险控制
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: