大型网站的架构设计图

news/2024/5/12 10:41:56/文章来源:https://blog.csdn.net/he90227/article/details/41545615

近段时间以来,通过接触有关海量数据处理和搜索引擎的诸多技术,常常见识到不少精妙绝伦的架构图。除了每每感叹于每幅图表面上的绘制的精细之外,更为架构图背后所隐藏的设计思想所叹服。个人这两天一直在搜集各大型网站的架构设计图,一为了一饱眼福,领略各类大型网站架构设计的精彩之外,二来也可供闲时反复琢磨体会,何乐而不为呢?特此,总结整理了诸如国外wikipedia,Facebook,Yahoo!,YouTube,MySpace,Twitter,国内如优酷网等大型网站的技术架构(本文重点分析优酷网的技术架构),以飨读者。

    本文着重凸显每一幅图的精彩之处与其背后含义,而图的说明性文字则从简从略。ok,好好享受此番架构盛宴吧。当然,若有任何建议或问题,欢迎不吝指正。谢谢。

 

1、WikiPedia 技术架构

 

 

  1. 来自wikipedia的数据:峰值每秒钟3万个 HTTP 请求 每秒钟 3Gbit流量, 近乎375MB 350 台 PC 服务器。
  2. GeoDNSA :40-line patch for BIND to add geographical filters support to the existent views in BIND", 把用户带到最近的服务器。GeoDNS 在 WikiPedia 架构中担当重任当然是由 WikiPedia 的内容性质决定的--面向各个国家,各个地域。
  3. 负载均衡:LVS,请看下图:

2、Facebook 架构

Facebook 搜索功能的架构示意图

    细心的读者一定能发现,上副架构图之前出现在此文之中:从几幅架构图中偷得半点海里数据处理经验。本文与前文最大的不同是,前文只有几幅,此文系列将有上百幅架构图,任您尽情观赏。

  • 4、twitter技术架构

                                                     twitter的整体架构设计图

    twitter平台大致由twitter.com、手机以及第三方应用构成,如下图所示(其中流量主要以手机和第三方为主要来源):

    缓存在大型web项目中起到了举足轻重的作用,毕竟数据越靠近CPU存取速度越快。下图是twitter的缓存架构图:

    关于缓存系统,还可以看看下幅图:

 

  • 6、Amazon技术架构

                                    Amazon的Dynamo Key-Value存储架构图

    可能有读者并不熟悉Amazon,它现在已经是全球商品品种最多的网上零售商和全球第2大互联网公司。而之前它仅仅是一个小小的网上书店。ok,下面,咱们来见识下它的架构。

    Dynamo是亚马逊的key-value模式的存储平台,可用性和扩展性都很好,性能也不错:读写访问中99.9%的响应时间都在300ms内。按分布式系统常用的哈希算法切分数据,分放在不同的node上。Read操作时,也是根据key的哈希值寻找对应的node。Dynamo使用了 Consistent Hashing算法,node对应的不再是一个确定的hash值,而是一个hash值范围,key的hash值落在这个范围内,则顺时针沿ring找,碰到的第一个node即为所需。

    Dynamo对Consistent Hashing算法的改进在于:它放在环上作为一个node的是一组机器(而不是memcached把一台机器作为node),这一组机器是通过同步机制保证数据一致的。

    下图是分布式存储系统的示意图,读者可观摩之:

    Amazon的云架构图如下:

                                           Amazon的云架构图

  • 7、优酷网的技术架构

    从一开始,优酷网就自建了一套CMS来解决前端的页面显示,各个模块之间分离得比较恰当,前端可扩展性很好,UI的分离,让开发与维护变得十分简单和灵活,下图是优酷前端的模块调用关系:

    这样,就根据module、method及params来确定调用相对独立的模块,显得非常简洁。下图是优酷的前端局部架构图:

    优酷的数据库架构也是经历了许多波折,从一开始的单台MySQL服务器(Just Running)到简单的MySQL主从复制、SSD优化、垂直分库、水平sharding分库。

    1. 简单的MySQL主从复制。
      MySQL的主从复制解决了数据库的读写分离,并很好的提升了读的性能,其原来图如下:
    2. 但是,主从复制也带来其他一系列性能瓶颈问题:

      1. 写入无法扩展
      2. 写入无法缓存
      3. 复制延时
      4. 锁表率上升
      5. 表变大,缓存率下降

      那问题产生总得解决的,这就产生下面的优化方案。

    3.  MySQL垂直分区

          如果把业务切割得足够独立,那把不同业务的数据放到不同的数据库服务器将是一个不错的方案,而且万一其中一个业务崩溃了也不会影响其他业务的正常进行,并且也起到了负载分流的作用,大大提升了数据库的吞吐能力。经过垂直分区后的数据库架构图如下:

          然而,尽管业务之间已经足够独立了,但是有些业务之间或多或少总会有点联系,如用户,基本上都会和每个业务相关联,况且这种分区方式,也不能解决单张表数据量暴涨的问题,因此为何不试试水平sharding呢?

    4.  MySQL水平分片(Sharding)

          这是一个非常好的思路,将用户按一定规则(按id哈希)分组,并把该组用户的数据存储到一个数据库分片中,即一个sharding,这样随着用户数量的增加,只要简单地配置一台服务器即可,原理图如下:

        如何来确定某个用户所在的shard呢,可以建一张用户和shard对应的数据表,每次请求先从这张表找用户的shard id,再从对应shard中查询相关数据,如下图所示:    但是,优酷是如何解决跨shard的查询呢,这个是个难点,据介绍优酷是尽量不跨shard查询,实在不行通过多维分片索引、分布式搜索引擎,下策是分布式数据库查询(这个非常麻烦而且耗性能)。

    5.  缓存策略

      貌似大的系统都对“缓存”情有独钟,从http缓存到memcached内存数据缓存,但优酷表示没有用内存缓存,理由如下:

      1. 避免内存拷贝,避免内存锁
      2. 如接到老大哥通知要把某个视频撤下来,如果在缓存里是比较麻烦的

      而且Squid 的 write() 用户进程空间有消耗,Lighttpd 1.5 的 AIO(异步I/O) 读取文件到用户内存导致效率也比较低下。

      但为何我们访问优酷会如此流畅,与土豆相比优酷的视频加载速度略胜一筹?这个要归功于优酷建立的比较完善的内容分发网络(CDN),它通过多种方式保证分布在全国各地的用户进行就近访问——用户点击视频请求后,优酷网将根据用户所处地区位置,将离用户最近、服务状况最好的视频服务器地址传送给用户,从而保证用户可以得到快速的视频体验。这就是CDN带来的优势,就近访问。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_809052.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

国内外大型SNS网站后台架构对比

要问时下什么类型的站点人气最旺?答案当属SNS网站。短短几年的时间,SNS便迅速确立了Web 2.0核心的地位。用户的增长量之快更是让人咂舌,而Facebook访问量首次超越Google的消息也让人觉得SNS的前途不可限量。当然,面对庞大且繁琐的…

各大网站架构总结笔记

各大网站架构总结笔记 记得在大学里不止一次关注网站架构方面的东西了,但每次都是泛泛了解,也没有着重记录,一段时间后对各种架构的思想也就模糊了。这几天不知怎么的又心血来潮(可能是快毕业了冲动了)想深入了解一下网…

网站启用GZip压缩后,速度快了3倍!

GZip压缩,是一种网站速度优化技术,也是一把SEO优化利器,许多网站都采用了这种技术,以达到提升网页打开速度、缩短网页打开时间的目的。 本文是一篇研究性文章,将通过某个案例来给大家显示网站采用GZip压缩前后的对比效…

中小型网站的缓存策略

在上一篇文章《大型网站系统架构分析》中,介绍了大型网站的系统架构,其中缓存环境非常重要,大型网站往往使用Squid前端缓存服务器群,memcache分布式缓存,负载均衡,CDN等来提升性能。但中小型网站使用这些大…

瞬时响应:网站的高性能架构

什么叫高性能的网站? 两个网站性能架构设计方案:A方案和B方案,A方案在小于100个并发用户访问时,每个请求的响应时间是1秒,当并发请求达到200的时候,请求的响应时间将骤增到10秒。B方案不管是100个并发用户访…

Mysql在大型网站的应用架构演变

本文主要描述在网站的不同的并发访问量级下,Mysql架构的演变,下面分别从不同的角度思考mysql的演变过程.可扩展性架构的可扩展性往往和并发是息息相关,没有并发的增长,也就没有必要做高可扩展性的架构,这里对可扩展性进行简单介绍…

大型网站架构与分布式架构

大型互联网架构 解决问题的通用思路是将分而治之(divide-and-conquer),将大问题分为若干个小问题,各个击破。在大型互联网的架构实践中,无一不体现这种思想。 架构目标 低成本:任何公司存在的价值都是为了获取商业利益…

网站分布式架构的演进

来源:知乎 http://www.zhihu.com/question/22764869/answer/31277656首先推荐4本书 大型分布式网站架构设计与实践 http://item.jd.com/11529266.html 大型网站技术架构:核心原理与案例分析 http://item.jd.com/11322972.html 大型网站系统与Java中间件实…

浅谈Web网站架构演变过程及各阶段所用的技术和架构设计

前言 我们以javaweb为例,来搭建一个简单的电商系统,看看这个系统可以如何一步步演变。该系统具备的功能:用户模块:用户注册和管理商品模块:商品展示和管理交易模块:创建交易和管理 阶段一、单机构建网站 网…

大型网站电商网站架构案例和技术架构的示例

大型网站架构是一个系列文档,欢迎大家关注。本次分享主题:电商网站架构案例。从电商网站的需求,到单机架构,逐步演变为常用的,可供参考的分布式架构的原型。除具备功能需求外,还具备一定的高性能&#xff0…

个人网站被攻击,并受到勒索信息,怎么应对?

个人网站被攻击,并受到勒索信息,这已经是第二次了 To recover your lost databases and avoid leaking it: visit http://dbrestore.to and enter your unique token 18dc****52424 and pay the required amount of Bitcoin to get it back. Databases that we have:** Your d…

Web网站通知系统设计

写在前面: 通知系统是网站信息传播机制的重要的一部分,足够写一大章来说明。本文只梳理设计原则,后续相关内容会持续更新。 这里的通知包括但不限于公告、提醒或消息(不同使用场景下的功能定义不同)。 关于各客户端平台…

主流网站服务器配置组成 主流网站服务器报价

主流网站服务器配置组成 主流网站服务器报价 当今互联网已经是由数量巨大的服务器担当各种服务角色,构成丰富多彩,信息巨大的网络世界,最新英特尔Xeon处理器采用45纳米制程技术,提供第二代四核动力,主频高达 3.2GHz&am…

如何替换页面url_网站改版需要注意什么?如何把SEO影响降到最低?

网站的重新改版意味着网站的主题、页面设计或网站架构没有变化,以便做出相对较大的改变。如果网站主题的内容发生很大变化,域名从一个行业变成另一个行业的内容,从SEO的角度来看,这不是网站的改版,而是网站的自杀。首先…

seo查询工具源码_分享3款实用的SEO推广工具,值得收藏!

在竞争激烈的市场环境中,如何降低网站的维护成本,如何获得较多的人流量,如何提高网站排名等诸多问题,都是企业在营销过程中不可忽视的问题。然而,在大多数推广方式之中,SEO优化方法被很多企业优先考虑的。因…

jstl处理栏目与子栏目_SEO:栏目页优化对于关键词排名的重要性

我们在做网站优化排名的时候发现,网站关键词排名一直上不来,而且关键词库是很少的,除了我们设置好的首页TDK以外,其它栏目页就没有好好的运用,我们可以看看大部分的企业网站,他们的栏目页大部分就是一些留言…

2021江西高考成绩查询微信可以吗,2021年江西高考成绩查询网站查分网址:http://www.jxeea.cn/...

【导语】高考结束后大家最为关心的问题就是在哪里查分,如何查分,无忧考网高考频道特别整理2021年江西高考成绩查询查分网址,成绩公布时考生可直接点击网址进行查分,预祝大家都能顺利的考上理想的大学!由于,…

PHP:【商城后台管理系统】部署友情链接,网站基础设置

PHP:【商城后台管理系统】部署友情链接,网站基础设置 一.友情链接 ①友情链接页面 ②友情链接编辑 ③友情链接添加 二.网站基础设置 ①后台网站基础设置页面 ②网站基础设置效果 三.部署流程 部署流程 后端采用thinkphp6.0,首先是网站基础设置&…

Python建站-阿里云-Ubuntu-Django

以前写的更像是备忘,这次希望写出一个完整教程,方便大家,也加深一下自己的印象。 服务器 用的是阿里云的轻量应用服务器,就是学生申请的那个,其他的应该都差不多。相信大家都已经申请好了,如果有小白的话…

avenir字体可以商用吗_一字赔万金,4个网站拯救字体版权问题

歪脑设计的第7个WHY大家好,我是小喳子夸下海口日更的我来了昨天,根正苗红的木木突然热泪盈眶要庆祝阿中麻麻的生日求程序猿小哥哥撸了个小红旗头像的小程序我和柚柚却给小哥哥捶背到无法自拔就在把小哥哥捶到四肢僵硬时,咋一看手机&#xff0…