优化网站性能必备的6种架构方案,你知道吗?

news/2024/5/21 11:56:01/文章来源:https://blog.csdn.net/xgjianstart/article/details/76826869


一个成熟的大型网站(如淘宝、天猫、腾讯等)的系统架构并不是一开始设计时就具备完整的高性能、高可用、高伸缩等特性的,它是随着用户量的增加,业务功能的扩展逐渐演变完善的,在这个过程中,开发模式、技术架构、设计思想也发生了很大的变化,就连技术人员也从几个人发展到一个部门甚至一条产品线。所以成熟的系统架构是随着业务的扩展而逐步完善的,并不是一蹴而就;不同业务特征的系统,会有各自的侧重点,例如:淘宝,要解决海量的商品信息的搜索、下单、支付,例如腾讯,要解决数亿用户的实时消息传输,百度它要处理海量的搜索请求,他们都有各自的业务特性,系统架构也有所不同。尽管如此我们也可以从这些不同的网站背景下,找出其中共用优化的技术,这些优化技术和手段广泛运用在大型网站系统的架构中,下面让我们来认识这些优化性能的技术和手段。


改善网站性能的几大手段



最开始的网站架构


最初业务量不大,访问量小,此时的架构,应用程序、数据库、文件都部署在一台服务器上,有些甚至仅仅是租用主机空间。



1. 应用、数据、文件分离


将应用程序、数据库、文件各自部署在独立的服务器上,并且根据服务器的用途配置不同的硬件,达到最佳的性能效果。



2. 利用缓存改善网站性能


大部分网站访问都遵循28原则,即80%的访问请求,最终落在20%的数据上,所以我们可以对热点数据进行缓存,减少热点数据的访问路径,提高用户体验。缓存实现常见的方式是本地缓存、分布式缓存。当然还有CDN、反向代理。


2.1 本地缓存

本地缓存,顾名思义是将数据缓存在应用服务器本地,可以存在内存中,也可以存在文件,组件。本地缓存的特点是速度快,但因为本地空间有限所以缓存数据量也有限。OSCache就是常用的本地缓存。



2.2 分布式缓存

分布式缓存的特点是,可以缓存海量的数据,并且扩展非常容易,在门户类网站中常常被使用,速度按理没有本地缓存快,常用的分布式缓存是Memcached、Redis。



2.3 反向代理

部署在网站的机房,当用户请求达到时首先访问反向代理服务器,反向代理服务器将缓存的数据返回给用户,如果没有缓存数据才会继续访问应用服务器获取,这样做减少了获取数据的成本。反向代理有Squid,Nginx。



2.4 CDN

假设我们的服务器都部署在杭州的机房,对于浙江的用户来说访问是较快的,而对于北京的用户访问是较慢的,这是由于浙江和北京分别属于电信和联通的不同发达地区,北京用户访问需要通过互联路由器经过较长的路径才能访问到杭州的服务器,返回路径也一样,所以数据传输时间比较长。对于这种情况,常常使用CDN解决,CDN将数据内容缓存到运营商的机房,用户访问时先从最近的运营商获取数据,这样大大减少了网络访问的路径。比较专业的CDN运营商有蓝汛、网宿。



3. 使用集群+负载均衡改善应用服务器性能


应用服务器作为网站的入口,会承担大量的请求,我们往往通过应用服务器集群来分担请求数。

应用服务器前面部署负载均衡服务器调度用户请求,根据分发策略将请求分发到多个应用服务器节点。



常用的负载均衡技术硬件的有F5,价格比较贵一般都在15W以上。

软件的有LVS、Nginx、HAProxy。LVS是四层(传输层)负载均衡,根据目标地址和端口选择内部服务器,Nginx和HAProxy是七层(应用层)负载均衡,可以根据报文内容选择内部服务器,因此LVS分发路径优于Nginx 和HAProxy,性能要高些,而Nginx和HAProxy则更具配置性,如可以用来做动静分离(根据请求报文特征,选择静态资源服务器还是应用服务器)。



4. 数据库优化


4.1 读写分离和分库分表

随着用户量的增加,数据库成为最大的瓶颈,改善数据库性能常用的手段是进行读写分离以及分库分表,读写分离顾名思义就是将数据库分为读库和写库,通过主备功能实现数据同步。分库分表则分为水平切分和垂直切分,水平切分则是对一个数据库特大的表进行拆分,例如用户表。垂直切分则是根据业务的不同来切分,如用户业务、商品业务相关的表放在不同的数据库中。



4.2 使用NoSql数据库和搜索引擎


对于海量数据的查询和分析,我们使用nosql数据库加上搜索引擎可以达到更好的性能。并不是所有的数据都要放在关系型数据中。常用的NOSQL有mongodb、hbase、redis,搜索引擎有lucene、solr、elasticsearch。



5. 将应用服务器进行业务拆分


随着业务的扩展,应用程序变得非常臃肿,这时我们需要将应用程序进行业务拆分,如百度分为新闻、网页、图片等业务。每个业务应用负责相对独立的业务运作。业务之间通过消息进行通信或者共享数据库来实现。



6.使用分布式系统


6.1 分布式文件系统

用户一天天增加,业务量越来越大,产生的文件越来越多,单台的文件服务器已经不能满足需求,这时就需要分布式文件系统的支撑。常用的分布式文件系统有GFS、HDFS、TFS。



GFS(Google File System)可以给大量的用户提供总体性能较高的服务


• 适合部署在廉价的普通硬件上
• 提供容错功能


HDFS(Hadoop Distributed File System)能提供高吞吐量的数据访问,非常适合大规模数据集上的应用


• 运行在通用硬件(commodityhardware)
• 高度容错
• 适合部署在廉价的机器上


TFS(Taobao Flies System)主要针对海量的非结构化数据,提供高可靠和高并发的存储访问


• 高可扩展、高可用、高性能
• 面向互联网服务
• 适合海量小文件存储


6.2 分布式服务

各个业务应用都会使用到一些基本的业务服务,例如用户服务、订单服务、支付服务、安全服务,这些服务是支撑各业务应用的基本要素。我们将这些服务抽取出来利用分部式服务框架搭建分布式服务。阿里的Dubbo是一个不错的选择。



小结


完整的系统架构图如下:



大型网站的架构是根据业务需求不断完善的,根据不同的业务特征会做特定的设计和考虑,本文只是讲述一个常规大型网站会涉及的一些优化技术和手段。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_887099.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用dtree制作一个简单的网站导航(后台管理)

目录 效果展示(轻喷) dtree简介 涉及技术 目录结构 各个文件详情 index.html top.html left.html main.html cpright.html dtree下载地址 GitHub地址 效果展示(轻喷) dtree简介 dtree是一个由JavaScript编写成的简单的…

Mysql在大型网站的应用架构演变

写在最前: 本文主要描述在网站的不同的并发访问量级下,Mysql架构的演变 可扩展性 架构的可扩展性往往和并发是息息相关,没有并发的增长,也就没有必要做高可扩展性的架构,这里对可扩展性进行简单介绍一下,常用的扩展手段…

ASP.net构建大型网站

记得很多朋友问过我如何构建一个大型的.net网站.这里值得讨论的问题是----多大 ,公司曾经需要我给他们做一个每天有1000万人次访问的门户网站.而我却一直都没有开始动手做...原因很简单,,做一个这样的网站,经费少于300万是不够的.因此需求分析和启动资金成为了规划开始的关键. …

能帮你找到网页设计灵感的16个网站

几天前我发了篇《创意灵感哪里寻》的文章,历数了一些我寻找设计灵感时经常访问的网站。在文章的最后,我给大家扔了个问题:“你会到什么网站找设计灵感呢?”。那下面呢,就是一些看官推荐的网站。有些我没听过&#xff0…

谈谈网站静态化(转)

写在前头 静态化是解决减轻网站压力,提高网站访问速度的常用方案,但在强调交互的We2.0 时代,对静态化提出了更高的要求,静态不仅要能静,还要能动,下面我通过一个项目,谈谈网站静态化后的架构设计方案,同时和大家探讨一下,在开源产品大行其道,言架构必称MemberCache, Nginx,的时…

说说大型高并发高负载网站的系统架构(更新)【转】

我在CERNET做过拨号接入平台的搭建,而后在Yahoo&3721从事过搜索引擎前端开发,又在MOP处理过大型社区猫扑大杂烩的架构升级等工作,同时自己接触和开发过不少大中型网站的模块,因此在大型网站应对高负载和并发的解决方案上有一些…

最新在线商店(电子商务网站)设计欣赏

最新在线商店(电子商务网站)设计欣赏 最新在线商店(电子商务网站)设计欣赏,国外最新的电子商务网站设计潮流。 发表于:2009-09-07 11:08 分类:首页 > 视觉设计 > 配色/构图 > , 标签: 页面设计商店 Madsen Cycles Dripping In Fat C…

如何突破网站对selenium的屏蔽

本文原创作者:鲲之鹏(http://www.site-digger.com)本文原始链接:http://www.site-digger.com/html/articles/20180821/653.html使用selenium模拟浏览器进行数据抓取无疑是当下最通用的数据采集方案,它通吃各种数据加载…

16个小众却很实用的网站(程序员 向)

https://zhuanlan.zhihu.com/p/23005451 3个月以前在知乎上回答一个问题 【有哪些能集实用,装逼于一身的冷门网站?】得到很多小伙伴的喜爱,一直到现在都还陆陆续续收到大家的赞,谢谢大家。 于是,我就想,现在…

简单爬取京东网站

简单爬取京东网站的图片 正则表达式为京东图片的地址

AST对抗某网站的Js抽取型混淆

因为网站比较敏感, 所以具体网站就不说了, 直接说逻辑部分 为了降低数据提取的错误率, 所以使用了python的slimit库对js代码进行提取处理 对网站源码的JavaScript进行分析后, 发现在其中一个script标签内的js代码是利用抽取混淆的, 并用flashvars开头的变量存储 首先用python…

KNN算法学习-实现海伦约会网站与手写体识别实验

文章目录 前言一、实验介绍二:实验过程:1.数据准备2.分析数据3.归一化数值4.测试算法5.使用算法 三、实验:实现手写识别系统sklearn数据集 总结 前言 一、K-近邻算法是什么? 简而言之,k-近邻算法就是采用测量不同特征…

(网页加载慢)浏览器访问网站时发现建立连接( Initial connection)时巨慢,需要 20 多 s的追查

今天公司网站上线,结果首页的访问速度出奇的卡。chrome里查了下网站的加载速度 Initial connection 什么鬼,竟然20多秒 其实测试时就已经发现这个问题了,一直以为是发布后网站(IIS)第一次加载特别慢的原因,…

【python网络爬虫与NLP系列】一、利用scrapy+redis实现新闻网站增量爬取

写在前头:为了督促自己完成2018上半年的个人小任务,决定在平台上记录和分享完成的过程和心得。时间有限,但尽量详细具体吧。 简述一下整个系列的任务:(1)精选几个自己感兴趣的外文网站;&#x…

SEO入门知识篇

SEO(Search Engine Optimization):通过已知的搜索引擎算法,优化网站的内部和外部网站,使网站满足搜索引擎的索引排名需求,提高搜索引擎中的关键字排名,从而为网站带来精确的用户,获得…

网站SEO不得不关注的四大问题

原博主链接:https://blog.csdn.net/cc321001   相信各位参与过网站建设的小伙伴都知道,网站优化中的SEO方法是比较稳定和有效的。不过对于刚开始接触SEO工作的小白站长来说,特别是利用网站模板快速建站的小白站长,总会遇到多多少…

企业网站建设的核心点和优化策略

摘要 企业网站建设的核心优化策略主要在于架构设计,而架构设计又包含了js代码优化、flash的减少、框架优化、图形优化等等,比如说静态或者伪静态页面更适合企业站点的优化。 越来越多的公司在创建网站时缺乏创新精神,而公司网站却表现平平。…

一个完整的网站建设需要哪些流程?

摘要 网站建设流程并不复杂,大致流程就是域名和服务器的购买,网站设计和开发,内容的补充,但在这些环境中,有很多需要注意的小细节。 1、针对对象,用户调研 在设计网站前,必须告诉网站所针对的…

浅谈网站建设的优化问题

越来越多的公司在创建网站时缺乏创新精神,而公司网站却表现平平。这种情况导致访问者无法浏览网站,也没有新鲜感。 这给公司留下了不太好的印象,也影响了信息交流。因此,有必要找到并优化网站建设的核心。非著名网站开发员让大家…

网站建设需要怎么做?个人网站建设教程

摘要 网站建设教程,从域名、服务器的购买,再到数据库的购买与配置,再到网站CMS系统的挑选以及上传安装。总的来说网站建设并不难,难的是运营,比如,如何写好文章,添加好的产品,如何让…