瞬时响应:网站的高性能架构

news/2024/5/14 13:14:55/文章来源:https://blog.csdn.net/bestxiaok/article/details/105345642

什么叫高性能的网站?

两个网站性能架构设计方案:A方案和B方案,A方案在小于100个并发用户访问时,每个请求的响应时间是1秒,当并发请求达到200的时候,请求的响应时间将骤增到10秒。B方案不管是100个并发用户访问还是200个并发用户访问,每个请求的响应时间都差不多是1.5秒。哪个方案的性能好?如果老板说“我们要改善网站的性能”,他指的是什么?

同类型的两个网站,X网站服务器平均每个请求的处理时间是500毫秒,Y网站服务器平均每个请求的处理时间是1000毫秒,为什么用户却反映Y网站的速度快呢?

网站性能是客观的指标,可以具体体现到响应时间、吞吐量等技术指标,同时也是主观的感受,而感受则是一种与具体参与者相关的微妙的东西,用户的感受和工程师的感受不同,不同的用户感受也不同。

网站性能测试

性能测试是性能优化的前提和基础,也是性能优化结果的检查和度量标准。不同视角下的网站性能有不同的标准,也有不同的优化手段。

不同视角下的网站性能

软件工程师说到网站性能的时候,通常和用户说的不一样。

1.用户视角的网站性能

从用户角度,网站性能就是用户在浏览器上直观感受到的网站响应速度快还是慢。用户感受到的时间,包括用户计算机和网站服务器通信的时间、网站服务器处理的时间、用户计算机浏览器构造请求解析响应数据的时间,如图4.1所示。

图4.1 用户视角的网站性能

不同计算机的性能差异,不同浏览器解析HTML速度的差异,不同网络运营商提供的互联网宽带服务的差异,这些差异最终导致用户感受到的响应延迟可能会远远大于网站服务器处理请求需要的时间。

在实践中,使用一些前端架构优化手段,通过优化页面HTML式样、利用浏览器端的并发和异步特性、调整浏览器缓存策略、使用CDN服务、反向代理等手段,使浏览器尽快地显示用户感兴趣的内容、尽可能近地获取页面内容,即使不优化应用程序和架构,也可以很大程度地改善用户视角下的网站性能。

2.开发人员视角的网站性能

开发人员关注的主要是应用程序本身及其相关子系统的性能,包括响应延迟、系统吞吐量、并发处理能力、系统稳定性等技术指标。主要的优化手段有使用缓存加速数据读取,使用集群提高吞吐能力,使用异步消息加快请求响应及实现削峰,使用代码优化手段改善程序性能。

3.运维人员视角的网站性能

运维人员更关注基础设施性能和资源利用率,如网络运营商的带宽能力、服务器硬件的配置、数据中心网络架构、服务器和网络带宽的资源利用率等。主要优化手段有建设优化骨干网、使用高性价比定制服务器、利用虚拟化技术优化资源利用等。

性能测试指标

不同视角下有不同的性能标准,不同的标准有不同的性能测试指标,从开发和测试人员的视角,网站性能测试的主要指标有响应时间、并发数、吞吐量、性能计数器等。

1.响应时间

指应用执行一个操作需要的时间,包括从发出请求开始到收到最后响应数据所需要的时间。响应时间是系统最重要的性能指标,直观地反映了系统的“快慢”。表4.1列出了一些常用的系统操作需要的响应时间。

表4.1 常用系统操作响应时间表

测 试程序通过模拟应用程序,记录收到响应和发出请求之间的时间差来计算系统响应时间。但是记录及获取系统时间这个操作也需要花费一定的时间,如果测试目标操 作本身需要花费的时间极少,比如几微秒,那么测试程序就无法测试得到系统的响应时间。实践中通常采用的办法是重复请求,比如一个请求操作重复执行一万次, 测试一万次执行需要的总响应时间之和,然后除以一万,得到单次请求的响应时间。

2.并发数

指系统能够同时处理请求的数目,这个数字也反映了系统的负载特性。对于网站而言,并发数即网站并发用户数,指同时提交请求的用户数目。

与网站并发用户数相对应的还有网站在线用户数(当前登录网站的用户总数)和网站系统用户数(可能访问系统的总用户数,对多数网站而言就是注册用户数)。其数量比较关系为:

网站系统用户数>>网站在线用户数>>网站并发用户数

在网站产品设计初期,产品经理和运营人员就需要规划不同发展阶段的网站系统用户数,并以此为基础,根据产品特性和运营手段,推算在线用户数和并发用户数。这些指标将成为系统非功能设计的重要依据。

现实中,经常看到某些网站,特别是电商类网站,市场推广人员兴致勃勃地打广告打折促销,用户兴致勃勃地去抢购,结果活动刚一开始,就因为并发用户数超过网站最大负载而响应缓慢,急性子的用户不停刷新浏览器,导致系统并发数更高,最后以服务器系统崩溃,用户浏览器显示“Service is too busy”而告终。出现这种情况,有可能是网站技术准备不充分导致,也有可能是运营人员错误地评估并发用户数导致。

测试程序通过多线程模拟并发用户的办法来测试系统的并发处理能力,为了真实模拟用户行为,测试程序并不是启动多线程然后不停地发送请求,而是在两次请求之间加入一个随机等待时间,这个时间被称作思考时间。

3.吞吐量

指单位时间内系统处理的请求数量,体现系统的整体处理能力。对于网站,可以用“请求数/秒”或是“页面数/秒”来衡量,也可以用“访问人数/天”或是“处理的业务数/小时”等来衡量。TPS(每秒事务数)是吞吐量的一个常用量化指标,此外还有HPS(每秒HTTP请求数)、QPS(每秒查询数)等。

在系统并发数由小逐渐增大的过程中(这个过程也伴随着服务器系统资源消耗逐渐增大),系统吞吐量先是逐渐增加,达到一个极限后,随着并发数的增加反而下降,达到系统崩溃点后,系统资源耗尽,吞吐量为零。

而这个过程中,响应时间则是先保持小幅上升,到达吞吐量极限后,快速上升,到达系统崩溃点后,系统失去响应。系统吞吐量、系统并发数及响应时间之间的关系将在本章后面内容中介绍。

系 统吞吐量和系统并发数,以及响应时间的关系可以形象地理解为高速公路的通行状况:吞吐量是每天通过收费站的车辆数目(可以换算成收费站收取的高速费),并 发数是高速公路上的正在行驶的车辆数目,响应时间是车速。车辆很少时,车速很快,但是收到的高速费也相应较少;随着高速公路上车辆数目的增多,车速略受影 响,但是收到的高速费增加很快;随着车辆的继续增加,车速变得越来越慢,高速公路越来越堵,收费不增反降;如果车流量继续增加,超过某个极限后,任何偶然 因素都会导致高速全部瘫痪,车走不动,费当然也收不着,而高速公路成了停车场(资源耗尽)。

网站性能优化的目的,除了改善用户体验的响应时间,还要尽量提高系统吞吐量,最大限度利用服务器资源。

4.性能计数器

它是描述服务器或操作系统性能的一些数据指标。包括System Load、对象与线程数、内存使用、CPU使用、磁盘与网络I/O等指标。这些指标也是系统监控的重要参数,对这些指标设置报警阈值,当监控系统发现性能计数器超过阈值时,就向运维和开发人员报警,及时发现处理系统异常。

System Load即系统负载,指当前正在被CPU执行和等待被CPU执行的进程数目总和,是反映系统忙闲程度的重要指标。多核CPU的情况下,完美情况是所有CPU都在使用,没有进程在等待处理,所以Load的理想值是CPU的数目。当Load值低于CPU数目的时候,表示CPU有空闲,资源存在浪费;当Load值高于CPU数目的时候,表示进程在排队等待CPU调度,表示系统资源不足,影响应用程序的执行性能。在Linux系统中使用top命令查看,该值是三个浮点数,表示最近1分钟,10分钟,15分钟的运行队列平均进程数。如图4.2所示。

图4.2 在Linux命令行查看系统负载

性能测试方法

性能测试是一个总称,具体可细分为性能测试、负载测试、压力测试、稳定性测试。

性能测试

以系统设计初期规划的性能指标为预期目标,对系统不断施加压力,验证系统在资源可接受范围内,是否能达到性能预期。

负载测试

对系统不断地增加并发请求以增加系统压力,直到系统的某项或多项性能指标达到安全临界值,如某种资源已经呈饱和状态,这时继续对系统施加压力,系统的处理能力不但不能提高,反而会下降。

压力测试

超过安全负载的情况下,对系统继续施加压力,直到系统崩溃或不能再处理任何请求,以此获得系统最大压力承受能力。

稳定性测试

被测试系统在特定硬件、软件、网络环境条件下,给系统加载一定业务压力,使系统运行一段较长时间,以此检测系统是否稳定。在不同生产环境、不同时间点的请求压力是不均匀的,呈波浪特性,因此为了更好地模拟生产环境,稳定性测试也应不均匀地对系统施加压力。

性能测试是一个不断对系统增加访问压力,以获得系统性能指标、最大负载能力、最大压力承受能力的过程。所谓的增加访问压力,在系统测试环境中,就是不断增加测试程序的并发请求数,一般说来,性能测试遵循如图4.3所示的抛物线规律。

图4.3中的横坐标表示消耗的系统资源,纵坐标表示系统处理能力(吞吐量)。在开始阶段,随着并发请求数目的增加,系统使用较少的资源就达到较好的处理能力(a~b段),这一段是网站的日常运行区间,网站的绝大部分访问负载压力都集中在这一段区间,被称作性能测试,测试目标是评估系统性能是否符合需求及设计目标;随着压力的持续增加,系统处理能力增加变缓,直到达到一个最大值(c点),这是系统的最大负载点,这一段被称作负载测试。测试目标是评估当系统因为突发事件超出日常访问压力的情况下,保证系统正常运行情况下能够承受的最大访问负载压力;超过这个点后,再增加压力,系统的处理能力反而下降,而资源消耗却更多,直到资源消耗达到极限(d点),这个点可以看作是系统的崩溃点,超过这个点继续加大并发请求数目,系统不能再处理任何请求,这一段被称作压力测试,测试目标是评估可能导致系统崩溃的最大访问负载压力。

图4.3 性能测试曲线

性能测试反应的是系统在实际生产环境中使用时,随着用户并发访问数量的增加,系统的处理能力。与性能曲线相对应的是用户访问的等待时间(系统响应时间),如图4.4所示。

图4.4 并发用户访问响应时间曲线

在日常运行区间,可以获得最好的用户响应时间,随着并发用户数的增加,响应延迟越来越大,直到系统崩溃,用户失去响应。

性能测试报告

测试结果报告应能够反映上述性能测试曲线的规律,阅读者可以得到系统性能是否满足设计目标和业务要求、系统最大负载能力、系统最大压力承受能力等重要信息,表4.2是一个简单示例。

表4.2 性能测试结果报告

性能优化策略

如果性能测试结果不能满足设计或业务需求,那么就需要寻找系统瓶颈,分而治之,逐步优化。

1.性能分析

大型网站结构复杂,用户从浏览器发出请求直到数据库完成操作事务,中间需要经过很多环节,如果测试或者用户报告网站响应缓慢,存在性能问题,必须对请求经历的各个环节进行分析,排查可能出现性能瓶颈的地方,定位问题。

排查一个网站的性能瓶颈和排查一个程序的性能瓶颈的手法基本相同:检查请求处理的各个环节的日志,分析哪个环节响应时间不合理、超过预期;然后检查监控数据,分析影响性能的主要因素是内存、磁盘、网络、还是CPU,是代码问题还是架构设计不合理,或者系统资源确实不足。

2.性能优化

定位产生性能问题的具体原因后,就需要进行性能优化,根据网站分层架构,可分为Web前端性能优化、应用服务器性能优化、存储服务器性能优化3大类。

--转自于李智慧编写的大型网站技术架构

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_775293.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OmniGraffle导入stencils的两个方法以及优质的stencils下载网站推荐

今天写论文,需要画几个电路结构图,可是现在是WannaCry勒索病毒正肆虐的时候,不想用教研室的win7啊!(其实只是想搞清楚mac下到底有没有visio那样好用的可以导入很多模版的画流程图结构图等的利器。。。) 之前…

36氪上的这七家程序员网站你都了解吗?

2019独角兽企业重金招聘Python工程师标准>>> 我始终相信程序员交付的不是代码,是价值,所以在万众创新下程序员成了最受伤的群体,36氪上的好的项目举不胜举,但是真正为程序员服务的都有哪些呢?让我们一起来看…

如何发布一个网站

如何发布一个网站所需材料:网站空间(服务器)、域名、FTP软件、网站源程序步骤:1、首先购买空间、域名根据自己使用的编程语言来选择合适的操作系统。如网站使用ASP.net编写的,请选用Windows系列虚拟主机。使用PHP的&am…

谈谈个人网站的建立(二)—— lucene的使用

首先,帮忙点击一下我的网站http://www.wenzhihuai.com/ 。谢谢啊,如果可以,GitHub上麻烦给个star,以后面试能讲讲这个项目,GitHub地址https://github.com/Zephery/newblog 。 Lucene的整体架构 搜索引擎的几个重要概念…

网址导航类的网站为什么会没落

今天要谈论的话题是关于网址导航的,在我看来,其实这是一种已经没落的网站行业。目前还能生存下来的网址导航有hao123网址导航、2345网址导航,除此之外,还有很多互联网公司推出了适配自己产品的网址导航,例如搜狗网址导…

网站优化怎么做?怎么才会有排名,流量收录

什么是推送? 对于SEO人员应该都不陌生吧,推送就是把网站的链接主动提交给搜索引擎, 确保新的链接可以尽快被收录,同时保护原创(防止别人抄袭,以及转载后导致自己的网站没收录) 为什么我们要去…

免费采集工具之打造网站高质量内容

搜索引擎为什么一直不收录我的网站?为什么我的网站一直没有排名是不是我网站被K了?怎么让搜索引擎快速收录我的网站呢?这是最近很多站长问我的问题,今天笔者就针对这些问题发表一些我的见解。 首先我们要知道SEO做到最后做的是什…

如何使用免费采集器实现高质量网站内容布局

Hello的大家好!昨天我分享了搜狗泛收录怎么做。今天我要分享的是关于网站免费采集器的使用以及如何利用好免费的文章采集器打造网站高质量内容,让你的网站快速收录大量收录,快速上网站SEO排名的方法攻略。 笔者作为一个SEO老油子&#xff0c…

1分钟学会网站采集方法详解

最近很多站长朋友跟我诉苦说网站采集应该怎么做,手动更新难以坚持。网站定时发布文章内容是一件必须要解决的问题,因此今天我将分享一些网站采集的技巧。非常适合想做大量收录以及高权重网站的站长。 首先很多朋友会说,纯采集可能被搜索引擎算…

搜狗批量提交软件-批量提交网站链接

最近很多做搜狗的站长朋友问我搜狗推送工具有用吗?可以批量推送吗?关于搜狗的提交方式有哪些?搜狗推送应该怎么做?搜狗收录怎么大量泛收录?有没有好的搜狗口子可以让搜狗快速收录我的网站呢? 首先搜狗推送肯…

360推送工具-批量推送360网站工具

最近很多站长问我,我的网站360一直不收录是什么原因?360收录到底应该怎么做?别人的360收录几万,几十万是怎么做的?还有实用的做360收录的工具或者说方法技巧。今天笔者统一发表一下我个人的见解。 首先我们网站发布后的…

百度SEO教程-利于百度推送工具实现百度快速收录

最近很多做百度的站长问我,百度收录怎么做?有没有什么方法让百度大量收录我的网站?百度推送到底有没有用?如何利用百度推送工具,实现百度的快速收录,这期我说下我的个人见解。 一、百度链接提交的作用 链接…

知名网站的 404 页面长啥样?你的404长啥样?

2019独角兽企业重金招聘Python工程师标准>>> 每天浏览各大网站,难免会碰到404页面啊。你注意过404页面么?猿妹搜罗来了下面这些知名网站的404页面,以供大家欣赏,看看哪个网站更有创意: 我有几张阿里云幸运券…

数据收集,网站数据采集伪原创发布(图文)

数据收集,最近很多站长问我有没有好用的文章数据收集系统,因为不同CMS的文章采集伪原创发布是一件让人头痛的事。我们都知道网站的收录离不了日常的文章更新。网站有了收录之后网站的一个SEO排名才能够起来,数据收集对网站的收录起着重要的作…

网站管理之如何批量网站管理(python爬虫全网文章采集发布)

网站管理,最近很多站长问我不同CMS见得网站我们应该怎么管理,因为不同CMS的web发布接口是不一样的。我们如何实现不同网站的批量采集伪原创发布的网站管理,更重要是怎么做相应的SEO优化设置如网站文章发布之后进行一键自动批量推送给各大搜索…

网站托管,免费网站托管,全自动网站托管方法详解

网站托管,为什么我们做网站托管,做网站托管有哪些作用?第一我们网站托管之后我们不需要亲自做网站的SEO优化包括站内优化和站外优化。网站托管可以通过全网文章关键词泛采集、文章聚合、Tag标签聚合等做为文章内容来源,然后通过批…

网站维护-批量网站维护-不同CMS批量采集发布管理

网站维护,最近很多站长问我大量网站维护怎么样才能做到批量管理和维护。因为每个站对应的建站系统是不一样的,每个网站的文章自动更新是一件让人头疼的事情。市面上很少同时支持织梦、帝国、zblog、WordPress、pbootCMS等各种cms的批量采集伪原创发布已经…

网站漏洞检测工具对discuzX3.2 X3.4网站漏洞修复

2019独角兽企业重金招聘Python工程师标准>>> 2018年12月9日,国内某安全组织,对discuz X3.2 X3.4版本的漏洞进行了公开,这次漏洞影响范围较大,具体漏洞是discuz 的用户前段SQL注入与请求伪造漏洞,也俗称SSRF…

网页采集器,全自动网站采集发布(图文)

网页采集器,最近很多站长朋友问我指定网站怎么做,市场上的网页采集工具都是基本都是需要写采集规则,这需求站长朋友们会正则表达式,还有html代码基础。这对小白站长来是很难的一件事情。网页采集器可视化批量采集指定网站以及自动…

帝国CMS模板,免费帝国CMS模板,帝国CMS建站教程

帝国CMS模板,很多帝国CMS站长问我没有好用的帝国CMS模板。人们都知道那种经常被使用帝国CMS模板,是不利于网站SEO优化。好的帝国CMS模板内置了很多SEO优化设置,结合批量采集、伪原创、发布并一键自动百度、神马、360、搜狗推送。 如何选择一个…