【笔记1-架构演进】从0开始 独立完成企业级Java电商网站开发(服务端)

news/2024/5/19 13:30:21/文章来源:https://chenchenchen.blog.csdn.net/article/details/104143098

高大上的淘宝架构

我们以淘宝架构为例,了解下大型的电商项目的服务端的架构是怎样,如图所示file

上面是一些安全体系系统,如数据安全体系、应用安全体系、前端安全体系等。中间是业务运营服务系统,如会员服务、商品服务、店铺服务、交易服务等。还有共享业务,如分布式数据层、数据分析服务、配置服务、数据搜索服务等。最下面呢,是中间件服务,如MQS即队列服务,OCS即缓存服务等。

图中也有一些看不到,例如高可用的一个体现,实现双机房容灾和异地机房单元化部署,为淘宝业务提供稳定、高效和易于维护的基础架构支撑。

这是一个含金量非常高的架构,也是一个非常复杂而庞大的架构。当然这个也不是一天两天演进成这样的,也不是一上来就设计并开发成这样高大上的架构的。

这边就要说一下,小型公司要怎么做呢?对很多创业公司而言,很难在初期就预估到流量十倍、百倍以及千倍以后网站架构会是什么样的一个状况。同时,如果系统初期就设计一个千万级并发的流量架构,很难有公司可以支撑这个成本。

因此,一个大型服务系统都是从小一步一步走过来的,在每个阶段,找到对应该阶段网站架构所面临的问题,然后在不断解决这些问题,在这个过程中整个架构会一直演进。那我们来一起看一下。

单服务器

file

从一个小网站说起。一台服务器也就足够了。文件服务器,数据库,还有应用都部署在一台机器,俗称ALL IN ONE

随着我们用户越来越多,访问越来越大,硬盘,CPU,内存等都开始吃紧。一台服务器已经满足不了。

这个时候看一下下一步演进

数据服务与应用服务分离

file

我们将数据服务和应用服务分离,给应用服务器配置更好的 CPU,内存。而给数据服务器配置更好更大的硬盘。

分离之后提高一定的可用性,例如Files Server挂了,我们还是可以操作应用和数据库等。随着访问qps越来越高,降低接口访问时间,提高服务性能和并发,成为了我们下一个目标,发现有很多业务数据不需要每次都从数据库获取。

使用缓存

包括本地缓存,远程缓存,远程分布式缓存file

因为 80% 的业务访问都集中在 20% 的数据上,也就是我们经常说的28法则。如果我们能将这部分数据缓存下来,性能一下子就上来了。而缓存又分为两种:本地缓存和远程缓存缓存,以及远程分布式缓存,我们这里面的远程缓存图上画的是分布式的缓存集群(Cluster)。

思考的点

具有哪种业务特点数据使用缓存?具有哪种业务特点的数据使用本地缓存?具有哪种务特点的数据使用远程缓存?分布式缓存在扩容时候会碰到什么问题?如何解决?分布式缓存的算法都有哪几种?各有什么优缺点?

这个时候随着访问qps的提高,服务器的处理能力会成为瓶颈。虽然是可以通过购买更强大的硬件,但总会有上限,而且这个到后期成本就是指数级增长了这时,我们就需要服务器的集群。需要使我们的服务器可以横向扩展这时就必须加个新东西:负载均衡调度服务器。

使用负载均衡,进行服务器集群

file增加了负载均衡,服务器集群之后,我们可以横向扩展服务器,解决了服务器处理能力的瓶颈。

思考的点

负载均衡的调度策略都有哪些?各有什么优缺点?各适合什么场景?

打个比方,我们有轮询,权重,地址散列,地址散列又分为原ip地址散列hash,目标ip地址散列hash,最少连接,加权最少连接,还有继续升级的很多种策略......我们一起来分析一下

典型负载均衡策略分析

轮询:优点:实现简单,缺点:不考虑每台服务器处理能力权重:优点:考虑了服务器处理能力的不同地址散列:优点:能实现同一个用户访问同一个服务器最少连接:优点:使集群中各个服务器负载更加均匀加权最少连接:在最少连接的基础上,为每台服务器加上权值。算法为(活动连接数*256 非活动连接数)/权重,计算出来的值小的服务器优先被选择。

继续引出问题的场景

我们的登录的时候登录了A服务器,session信息存储到A服务器上了,假设我们使用的负载均衡策略是ip hash,那么登录信息还可以从A服务器上访问,但是这个有可能造成某些服务器压力过大,某些服务器又没有什么压力,这个时候压力过大的机器(包括网卡带宽)有可能成为瓶颈,并且请求不够分散。

这时候我们使用轮询或者最小连接负载均衡策略,就导致了,第一次访问A服务器,第二次可能访问到B服务器,这个时候存储在A服务器上的session信息在B服务器上读取不到。

Session共享解决方案

Session Sticky粘滞会话

我们使用session sticky这种方式来解决这个问题,它的处理规则是对于同一个连接中的数据包,负载均衡会将其进行NAT转换后,转发至后端固定的服务器进行处理file

打个比方就是如果我们每次吃饭都要保证我们用的是自己的碗筷,而只要我们在一家饭店里存着我们的碗筷,只要我们每次去这家饭店吃饭就好了。

对于同一个连接中的数据包,负载均衡会将其转发至后端固定的服务器进行处理。

缺点

一台服务器运行的服务挂掉,或者重启,上面的 session 都没了这样导致了负载均衡器成了有状态的机器,为以后实现容灾造成了羁绊

Session 复制

即当browser1经过负载均衡服务器把session存到application1中,会同时把session复制到application2中,所以多台服务器都保存着相同的session信息。file

就像我们在所有的饭店里都存一份自己的碗筷。我们随意去哪一家饭店吃饭都OK,不适合做大规模集群,适合机器不多的情况。

缺点

应用服务器间带宽问题,因为需要不断同步session数据当遇到大量用户在线时,服务器占用内存过多

基于Cookie

就是说我们每次都用携带session信息的cookie去访问应用服务器file

打个比方,就是我们每次去饭店吃饭,都自己带着自己的碗筷。

缺点

cookie 的长度有限制cookie存于浏览器,安全性是一个问题

Session 服务器

把session做成了一个session服务器,比如可以使用redis实现。这样每个用户访问到应用服务器,其session信息最终都存到session server中,应用服务器也是从session server中去获取session。file

打个比方,就是我们的碗筷都存在了一个庞大的橱柜里,我们去任何一家饭店吃饭,都可以从橱柜中拿到属于我们自己的碗筷。

保证 session 服务器的可用性,session服务器单点如何解决?我们在写应用时需要做调整存储session的业务逻辑打个比方,我们为了提高session server的可用性,可以继续给session server做集群

目前架构图file

数据库读写分离

数据库的读及写操作都还需要经过数据库。当用户量达到一定量,数据库将会成为瓶颈,我们继续演进。

file使用数据库提供的热备功能,将所有的读操作引入slave 服务器,因为数据库的读写分离了,所以,我们的应用程序也得做相应的变化。我们实现一个数据访问模块(图中的data access module)使上层写代码的人不知道读写分离的存在。这样多数据源读写分离就对业务代码没有了侵入。这里就引出了代码层次的演变

思考的点

如何支持多数据源?如何封装对业务没有侵入?如何使用目前业务的ORM框架完成主从读写分离?是否需要更换ORM模型?ORM模型之间各有什么优缺点?如何取舍?

数据库读写分离会遇到的问题

在master和slave复制的时候,考虑延时问题、数据库的支持、复制条件的支持。当为了提高可用性,将数据库分机房后,跨机房传输同步数据,这个更是问题。以及应用对于数据源的路由问题

使用反向代理和 CDN 加速网站响应

file

使用 CDN 可以很好的解决不同的地区的访问速度问题,反向代理则在服务器机房中缓存用户资源。

分布式文件系统

这个时候我们的文件服务器又出现了瓶颈,我们将文件服务器改成了分布式文件服务器集群。file

思考的点

分布式文件系统如何不影响已部署在线上的业务访问?不能让某个图片突然访问不到呀是否需要业务部门清洗数据?是否需要重新做域名解析?

数据库分库分表

这个时候我们的数据库又出现了瓶颈,我们选择专库专用的形式,进行数据的垂直拆分,相关的业务独用自己的一个库,我们解决了写数据并发量大的问题,如图Products、Users、Deal库。file

思考的点

跨业务的事务如何解决?使用分布式事务、去掉事务或不追求强事务应用的配置项多了,如何跨库进行数据的join操作

随着访问量过大,数据量过大,某个业务的数据库数据量和更新量已经达到了单个数据库的瓶颈了,这个时候就需要进行数据库的水平拆分。

file如图,我们把User拆成了User1和User2,将同一个表的数据拆分到两个数据库中,解决了单数据库的瓶颈。

思考的点

水平拆分的策略都有哪些?各有什么优缺点?水平拆分的时候如何清洗数据?SQL 的路由问题,需要知道某个 User 在哪个数据库上。主键的策略会有不同。假设我们系统中需要查询2017年4月份已经下单过的用户名的明细,而这些用户分布在user1和user2上,我们后台运营系统在展示时如何分页?

拆分搜索引擎

在网站发布并进行了大规模的推广后,导致我们应用服务器的搜索量又飙升

file使用搜索引擎,解决数据查询问题。部分场景可使用 NoSQL 提高性能,开发数据统一访问模块,解决上层应用开发的数据源问题。如图data access module 可以访问数据库,搜索引擎,NoSQL

总结

这个只是一个举例演示,各个服务的技术架构是需要根据自己业务特点进行优化和演进的,所以大家的过程也不完全相同。

最后的这个也不是完美的,例如负载均衡还是一个单点,也需要集群,我们的这个架构呢也只是冰山一角,沧海一粟。在架构演进的过程中,还要考虑系统的安全性、数据分析、监控、反作弊等等......,同时继续发展呢,SOA架构、服务化、消息队列、任务调度、多机房等等… ...

从刚才对架构演进的讲解,也可以看出来,所有大型项目的架构和代码,都是这么一步一步的根据实际的业务场景,和发展情况发展演变而来的,在不同的阶段,会使用的不同的技术,不同的架构来解决实际的问题,所以说,高大上的项目技术架构和开发设计实现不是一蹴而就的。

正是所谓的万丈高楼平地起。在架构演进的过程中,小到核心模块代码,大到核心架构,都会不断演进的,这个过程值得我们去深入学习和思考。一起加油吧~~

参考:https://www.imooc.com/article/17545https://www.jianshu.com/p/796f488fd134

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_751766.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【笔记3-用户模块】从0开始 独立完成企业级Java电商网站开发(服务端)

数据表结构设计 关系设计 为什么不用外键?分库分表有外键会非常麻烦,清洗数据也很麻烦。数据库内置触发器也不适合采用。 查业务问题的后悔药——时间戳create_time 数据创建时间update_time 数据更新时间可以用于查询业务,主要要存储datet…

【笔记4-商品模块】从0开始 独立完成企业级Java电商网站开发(服务端)

分类管理模块 数据表结构设计 分类表 CREATE TABLE、mmall_ category ( id int(11) NOT NULL AUTO_ INCREMENT COMMENT 类别Id, parent_ id int(11) DEFAULT NULL COMMENT 父类 别id当id0时说明是根节点,一级类别 , name varchar(50) DEFAULT NULL COMMENT 类别…

【笔记5-购物车及地址模块】从0开始 独立完成企业级Java电商网站开发(服务端)

购物车模块 数据库表设计 购物车表 CREATE TABLE mmall_ cart ( id int(11) NOT NULL AUTO_ INCREMENT, user_ id int(11) NOT NULL, product_ id int(11) DEFAULT NULL COMMENT 商品id, quantity int(11) DEFAULT NULL COMMENT 数量, checked int(11) DEFAULT NULL COMMEN…

【笔记6-支付及订单模块】从0开始 独立完成企业级Java电商网站开发(服务端)

支付模块 实际开发工作中经常会遇见如下场景,一个支付模块,一个订单模块,有一定依赖,一个同事负责支付模块,另一个同事负责订单模块,但是开发支付模块的时候要依赖订单模块的相关类 ,方法&…

【笔记8-Redis分布式锁】从0开始 独立完成企业级Java电商网站开发(服务端)

Redis分布式锁 Redis分布式锁命令 setnx当且仅当 key 不存在。若给定的 key 已经存在,则 setnx不做任何动作。setnx 是『set if not exists』(如果不存在,则 set)的简写,setnx 具有原子性。 getset先 get 旧值,后set 新值,并返回…

多网站项目的 CSS 架构

复杂的 CSS 架构,可不是你在科班里能学到的东西。 我在互联网行业的第四份工作,是在我国一家领先的媒体新闻公司中任职一名 CSS/HTML 专家,我的主要职责就是开发可重用的、可扩展的、用于多网站的 CSS 架构。 在本文中,我将与大家…

部署网站(虚拟主机,MVC站点,前后台,百度编辑器)出现的问题

开发工具:Vs2010 数据库:Sql2008 部署主机:万网虚拟主机,支持.NET 4.0 / 4.5 SQL2008 等.. 出现问题1:无法访问页面 出现问题2:后台无法访问 出现问题3:使用的编辑器是百度的UM,有使用到的地方…

电商详情页缓存架构(一)电商网站的商品详情页架构

小型电商网站的商品详情页的页面静态化架构以及其缺陷 小型电商网站,一般使用页面静态化的方案,提前将数据渲染到模板中。 问题:每次模板变更,模板对应的所有数据需要全部重新渲染 大型电商网站的异步多级缓存构建 nginx 数据本…

云南楚雄做网站找哪家?

2019独角兽企业重金招聘Python工程师标准>>> 云南楚雄做网站哪家强? 点击进入:http://www.anline.cn 转载于:https://my.oschina.net/jiankian/blog/614142

一分钟了解阿里云产品:利用Rsync服务SLB下多台centos服务器网站文件同步更新...

易淘帮使用了SLB负载均衡,为了保证SLB下两台服务器下面的网站文件同步,易淘帮采用了rsync服务进行同步,每三分钟进行同步一次。 简单介绍下reync,rsync—remote synchronize是类unix系统下的数据镜像备份工具,它的特性…

从全球最大同性交友网站抄了一份不一样的2048小游戏

大家好,我是“前端点线面”,一位新生代农民工,欢迎关注我获取最新前端知识和《前端百题斩》pdf版(包括JS基础篇、浏览器篇、网络篇共计50个章节,5万多字),此外有喜欢划水的老铁们,可以加我进“前端划水群”…

10个大佬经常逛的小网站,各个爆款!!!

欢迎和号主【前端点线面】进群盘算法,此外本号干货满满:14个门类(100篇原创)内容(又干又硬)、《前端百题斩》pdf(助力薪资double)、20篇思维导图(知识系统化、记忆简单化…

一步步构建大型网站架构

之前我简单向大家介绍了各个知名大型网站的架构,MySpace的五个里程碑、Flickr的架构、YouTube的架构、PlentyOfFish的架构、WikiPedia的架构。这几个都很典型,我们可以从中获取很多有关网站架构方面的知识,看了之后你会发现你原来的想法很可能…

【问底】徐汉彬:大规模网站架构的缓存机制和几何分形学

【导读】徐汉彬曾在阿里巴巴和腾讯从事4年多的技术研发工作,负责过日请求量过亿的Web系统升级与重构,目前在小满科技创业,从事SaaS服务技术建设。 在过去的工作中,徐汉彬从事各类缓存建设和优化,遇到问题无数&#xf…

npm的gh-pages结合github发布repository网站

如果你在使用github而且创建了一个新的仓库,你会发现,在仓库设置里面有结合github pages发布网站的设置,如下所示: 用过github pages都知道它可以做为静态网站来处理比如html和markdown的文件产生预览效果,我之前做过类…

大型网站技术架构(二)架构模式

2019独角兽企业重金招聘Python工程师标准>>> 每一个模式描述了一个在我们周围不断重复发生的问题及该问题解决方案的核心。这样,你就能一次又一次地使用该方案而不必做重复工作。 所谓网站架构模式即为了解决大型网站面临的高并发访问、海量数据、高可靠…

大型网站技术架构(四)网站的高性能架构

2019独角兽企业重金招聘Python工程师标准>>> 网站性能是客观的指标,可以具体体现到响应时间、吞吐量、并发数、性能计数器等技术指标。 1、性能测试指标 1.1 响应时间 指应用执行一个操作需要的时间,指从发出请求到最后收到响应数据所需要的时…

网站安全认证系统的设计变迁

网站在从小到大的发展历程中,安全认证系统是如何变迁的? 下面我们从其发展的几个阶段来分下: 阶段1: 起步,注册用户很少,两台服务器,一台应用服务器,一台数据库服务器。 用户登陆后在…

如何通过IP地址来访问网站

今天我们写极少量的代码,来实现用IP地址来访问一个网站。步骤如下: 打开命令提示符,输入以下代码: (这里用CSDN官网https://www.csdn.net/为例) 输入代码ping csdn.net /n 5 复制上面正在 Ping csdn.net […

网站推荐——洛谷

粉丝福利 【洛谷】(链接在最后)是一个我感觉非常良心的网站。自从五月以来,我一直在学习C语言,明年参加CSP大赛,自然少不了刷题。 这个网站我觉得最好的地方,就是它有很多比赛的题库: 有很多…