您的位置:首页 > 运维架构 > 网站架构

大型网站的架构演化,发展历程

2016-06-04 14:50 645 查看
今天开始读《大型网站技术架构:核心原理与案例分析》,觉得这本书将的全面而又通俗易懂,有兴趣的同学可以看一看。下面对大型网站的架构演化,发展历程做了整理,小伙伴们一起来学习一下。 



传统企业应用面对的挑战:复杂,千变万化的业务逻辑。(功能性需求) 

大型网站面对的挑战:处理超大量的用户访问和海量的数据处理。(非功能性需求)

网站核心架构要素:性能,可用性,伸缩性,扩展性,安全性

大型网站软件系统的特点: 

(1)高并发,大流量:需要面对高并发用户,大流量访问。 

(2)高可用:系统7*24小时不间断服务。大型互联网网站的宕机时间通常会成为新闻焦点。 

(3)海量数据:需要存储,管理海量数据,需要使用大量服务器。 

(4)用户分布广泛,网络情况复杂:许多大型互联网都是为全球用户提供服务的。在国内,还有各个运营商网络互通难的问题。而中美光缆的数次故障,也让一些国外用户依赖较大的网站不得不考虑在海外建立数据中心。,发布频繁: 

(5)安全环境恶劣:由于互联网的开放性,使得互联网更容易受到攻击,大型网站几乎每天都被黑客攻击。 

(6)需求快速变更:和传统软件产品或企业应用系统不同,互联网产品为快速时应市场,满足用户需求,其产品发布频率是极高的。 

(7)渐进式发展:与传统软件产品或企业应用系统一开始就规划好全部功能和非功能需求不同,几乎所有的大型互联网网站都是从一个小网站开始,逐渐发展起来的。

=======》其实大型网站存在的难题,传统软件产品和企业应用都存在,只是没有暴漏出来,用户比较局限。

大型网站的架构演化,发展历程


(1)初级阶段

大型网站都是从小型网站发展而来,小型网站最开始没有太多人访问,只需要一台服务器就够了。应用程序,数据库,文件等所有资源都在同一台服务器上,通常服务器操作系统用linux,部署在Tomcat上,使用MySQL数据库,汇集各种免费的开源软件及一台廉价的服务器就可以网站的发展之路了。 




(2)应用程序和数据服务分离

随着网站业务的发展,一台服务器逐渐不能满足需求:越来越多的用户访问,导致性能越来越差,越来越多的数据导致存储空间不够。这个时候就需要将应用和数据分离。 

应用和数据分离后,整个网站使用三台服务器:应用服务器,文件服务器,数据服务器。 

这三台服务器对硬件资源的需求各不相同:应用服务器需要处理大量的业务逻辑,需要更快更强大的CPU;数据库服务需要快速磁盘检索和数据缓存,需要更快的硬盘和更大的内存;文件服务器需要存储大量用户上传的文件,需要更大的硬盘。




(3)使用缓存改善网站性能

网站访问特点和现实世界的财富分配一样遵循二八定律:80%的业务访问集中在20%的数据上。 

既然大部分的业务访问集中在一小部分数据上,那么可以将这一小部分数据缓存在内存中,减少数据库的访问压力,提升网站的数据访问速度,改善数据库的写入性能。

网站使用的缓存分为两种:应用服务器本地缓存和专门的分布式服务器远程缓存。 

本地缓存的访问速度更快一些,但是受应用服务器内存限制,其缓存数据量有限,而且会出现跟程序争内存的情况。 

远程分布式缓存可以使用集群的方式,部署大内存的服务器做为专门的缓存服务器,可以理论上做到不受内存容量的限制。 




(4)应用服务器集群

当一台服务器的处理能力和存储空间不足时,不要企图去更换更强大的服务器,对大型网站而言,不管多么强大的服务器,都满足不了网站持续增长的业务需求。这种情况下,更恰当的做法是增加一台服务器分担原有服务器的访问和存储压力。 

对网站架构而言,只要能通过增加一台服务器改善负载压力,就可以通过同样的方法持续增加服务器不断改善系统性能,从而实现系统的可伸缩性。应用服务器实现集群是网站可伸缩性集群架构设计中较为成熟的一种。 

通过负载均衡调度服务器,可将原来来自用户浏览器的访问请求分发到服务器集群的任何一台服务器上,如果有更多的用户,就在集群中加入更多的应用服务器,使应用服务器不再成为整个网站的瓶颈。




(5)数据库读写分离

网站在使用缓存后,使绝大部分数据操作都可以不通过数据库完成,但是仍有一部分数据(缓存访问不命中,缓存过期)和全部的写操作需要访问数据库,在网站用户到一定规模,数据库因为压力过高而成为网站的瓶颈。 

目前大部分的数据库都提供主从热备功能,通过配置两台数据库主从关系,可以将一台数据库服务器数据更新到两外一台服务器上,实现读写分离,从而改善数据库的负载压力。 




(6)使用反向代理和CDN加速

CDN和反向代理的基本原理都是缓存,区别在于CDN部署在网络提供商的机房,用户请求网站的时候,可以从距离自己近的网络提供商机房获取数据;而反向代理则部署在网站的中心机房。 




(7)分布式文件系统和分布式数据库系统

分布式数据库是网站数据拆分的最后手段,只有在单表数据规模非常庞大的时候才使用。网站更常用的数据库拆分手段是业务分库,将不同的业务的数据库部署在不用的物理服务器上。 




(8)使用NoSQL和搜索引擎

随着网站业务越来越复杂,对数据存储和检索的需求也越来越复杂,网站需要采用一些非关系型数据库技术如NoSQL和非数据库查询技术如搜索引擎。 




(9)业务拆分

大型网站为了应对日益复杂的业务场景,通过使用分而治之的手段将整个网站业务分成不同的产品线。具体到技术上,也会根据产品线划分,将一个网站拆分成不同的应用,每个应用独立部署维护。 




(10)分布式服务

随着业务拆分越来越小,存储系统越来越庞大,应用系统的整体复杂度呈指数级增长,部署维护变得越来越困难。既然每个应用系统都需要执行许多相同的业务操作,比如用户管理,商品管理等,那么可以将这些公共应用提取出来,单独部署。应用系统只需要管理界面,通过分布式服务调用公共业务服务完成具体的业务操作。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: