途牛网站无线架构变迁实践

news/2024/5/13 12:05:46/文章来源:https://blog.csdn.net/weixin_30248399/article/details/96495339

从一开始的单机系统,发展到现在已拥有数百个分布式部署的系统。本文主要将途牛网站无线系统在从小到大的过程中,遇到的问题以及解决方法与大家分享,希望为大家带来一定借鉴。文章将从服务化推进、南北京机房之痛、性能提升实践、App客户端技术演进四个方面进行介绍。

 

服务化推进

 

途牛的服务化始于2011年,当时我们主要进行了会员的服务化,2012年进行了搜索2.0的服务化,2013年是服务化大举前进的时刻,主要进行了搜索3.0、价格中心、订单中心、产品基础数据等系统的服务化,2014年将TSP(途牛服务治理平台)、业务公共系统、资源搜索系统等进行服务化,2015年对产类目、开放API进行服务化。

 

从上面的过程可以看出,我们的服务化不是一蹴而就的,而是经历了一个漫长的过程,每一次拆分都相当于为高速行驶的汽车更换轮胎的过程。可以注意到,在2012年我们拆分了一个搜索2.0,之后很快又在2013年推出了搜索3.0。

 

这两个版本的区别是:做搜索2.0一开始没有什么经验,虽然采用了Solr这样非常成熟的开源搜索引擎来搭建搜索平台,但是没有明确界定搜索平台和业务系统之间的关系,导致搜索平台的逻辑非常重,被当成一个数据聚合的平台来使用,网站列表页数据和详情页数据都从搜索中出来,导致搜索获取数据源部分的逻辑非常复杂,搜索开发人员将70%的时间都放在和业务系统对接逻辑的处理上,索引效率也比较低,从而导致性能不稳定,逐渐退役。吸取教训后,我们搭建了搜索3.0的平台,仅仅提供列表搜索,统一列表字段,将数据推送逻辑移到搜索外部,由各个产品系统来进行数据推送,搜索本身专注于性能的提升与稳定性,并逐步加入智能排序、人工干预搜索结果功能。迄今为止,搜索3.0是我们公司最为稳定的系统。

 

接下来是服务化过程中,技术层面做得比较好的两个服务:价格计算服务和服务治理平台。

 

价格计算服务

 

从技术上,价格计算服务有两个难点:一个是团期价格依赖的因素较多,并且依赖路径较深;另一个是这些因素价格变动的频率较高,尤其在旺季。因此从设计上,价格计算服务必须要有较大的容量要求,同时具有实时性。

 

价格计算服务从13年开始构建,架构上也经历了四个阶段:同步架构、异步架构、并发架构和分布式架构,如图1所示。

 


图1  服务化的推荐 - 价格计算服务

 

同步架构:系统间主要通过接口进行交互,其他系统通过调用接口通知价格中心发起运算,价格中心通过接口获取其他系统价格依赖的所有资源。整个计算流程采用串行模型行,效率低仅能满足小规模的计算需求。

 

异步架构:系统间通过MQ进行交互,价格中心通过依赖数据库获取其他系统的数据,加快了数据读取的效率,并将计算价格变成两段:先针对一个资源多个供应商的情况,将资源的最低成本价计算好,然后再算产品最低价。这种架构比同步架构数据读取的效率更高,并能通过预先生成数据,加快计算的速度,提升3倍整体性能。

 

并发架构:首先将价库自身的数据(资源的成本价,产品团期起价)进行了分库分表,提升了系统的数据容量,然后再根据产品的访问频度区分冷热数据的计算频率,冷数据降低计算频率,热数据增加计算频率——并通过在内存中建立团期、行程、资源这三个维度的数据结构,提升计算过程中数据的读写效率。整体上性能比异步架构提升了3.5倍,每次每个团期的价格计算时间控制在200ms以下。

 

分布式架构:通过解析依赖数据库的Binlog,将依赖数据库的数据转换成适合使用的内存数据库结构,进一步提升数据读取效率,从而解决计算过度依赖数据库的问题,通过使用Sharding MQ,实现本地访问、本地计算;通过使用Unix域通信的机制,实现本地通信,将每个计算实例所依赖的资源和通信尽量限制在本地服务器上,最大化提升I/O能力,降低I/O损耗。整体性能比并发架构提升2倍,每次每个团期的价格计算时间控制在100ms以下。

 

通过上面几个阶段的优化,价格计算服务的整体架构如图2所示。

 


图2  服务化的推荐 - 价格计算服务整的体架构

 

其中分发节点中的计算成本节点就是一些预处理节点,主要计算资源成本价,物理机中的计算节点是实际执行价格计算的单元节点。调度节点通过一定路由规则,将价格计算分片到不同机器上,Binlog同步的时候也会按照类似规则,将数据同步到不同存储节点物理机,从而整体上实现本地存储、本地计算。

截止到2015年5月,价格计算服务每天的计算量在9亿次左右,每个团期平均每天被计算2次以上。价格计算服务始终在I/O能力和计算效率上不断迭代改进,期待未来能够有更好的架构出现。

 

服务治理平台

 

随着服务化推进越来越深入,每个系统提供的接口也越来越多,整个系统逐渐产生了这样一些问题:网状接口调用;接口中存在循环依赖,可能引起雪崩效应;服务调用缺乏监控;使用硬件实现负载均衡,可维护性较差。针对这些问题,我们急需一套服务治理平台来将所有的服务管理起来。

基于开源的服务治理平台,我们进行了部分定制,很快将适合于途牛的服务治理平台搭建起来,架构如图3所示。

 


图3  途牛的服务治理平台

 

其中注册中心采用主从模式进行集群部署,“主”进行服务地址的变更及心跳的保持,“从”提供查询服务。主从之间建立长连接,保持心跳。“主”宕机后,“从”接替,变更自己的身份标识。注册中心各个部署的实例只有获得“主”身份才能接受客户端长连接请求。各个服务提供者、服务消费者感知“主”宕机后,尝试连接“从”,并与之建立长连接,使用SQLLite数据库持久化服务列表,使用高可用的内存缓存保存可用服务地址列表,与服务提供者、服务消费者之间建立长连接,维持心跳。

 

服务提供者启动之后,通过通用组件将提供的服务告之注册中心,注册中心更新可用服务地址列表。如果该服务没有审核记录,则作为新服务待审核。新服务提交到注册中心后,注册中心不会更新到可用服务列表,需要人工在管理页面进行审核通过后才能进入使用,被服务消费者感知。

 

服务提供者发生宕机,心跳中断的情况,注册中心将更新可用服务地址列表,删除提供者的所有服务,并发出变更通知。心跳具有重连保持机制。一定时间内无心跳才断开连接。服务提供者使用连接池,控制长连接的数目,设置最高连接数。如果连接数得到最高限制,则拒绝新的连接接入,保证当前系统的可用性。

 

管理页面上可以查询服务、查看服务详细情况及可用服务地址列表,查看服务消费者列表,新上线服务的审核,待下线服务的禁止,实时调整某个服务的负载均衡策略,对某个服务提供者进行降权、倍权、禁用、允许操作。

 

南北京机房之痛

 

本节主要介绍途牛的机房部署策略。在2014年以前,我们基本上都维持了南北京机房的结构,在当时的情况下,这种策略基本上还是比较合理的,但是随着应用体量越来越大,逐步出现了问题,我们在2015年变成了南京单机房的策略,未来我们将向两地三中心这种更加稳定、高可用的架构演变。

 

南北京单机房的策略,在设计之初,很好的满足了业务需求。在2010年以前,途牛70%以上的订单均为电话订单,加上旅游订单的预订流程又比较复杂,需要客服人工参与的环节较多,我们需要将订单系统部署在南京机房,以便为我们的客服提供好的用户体验。同时为了给互联网用户提供更好的机房条件,我们需要将网站部署在北京。在这种机房架构下,我们进行了大量系统优化工作,主要是为了解决异地机房之间的数据同步问题。

 

首先针对网站数据“读多写少”的特征,我们对每一个子系统,均采用如下的典型系统设计,如图4所示。

 

 
图4  网站数据读多写少特征下的每一个子系统的典型设计

 

南北京之间通过数据库的主从同步机制进行数据同步,北京机房的应用读取北京的数据库,通过专线写入南京的数据库,从而确保两边数据的一致性。

 

该设计方案在系统容量小的时候,可以很好地运行,但是在专线不稳定的情况下,会产生较多问题,最常见的是数据同步延迟,比如用户在网站注册后,无法立刻登录。针对这个问题,我们采用了熔断的设计方案,使用特定进程监控数据库同步延迟,如果延迟达到上限,将尝试使用公网VPN进行同步,当专线情况好转时,再切换回去。

 

另外为了控制数据同步的数据量,所有数据同步均采用了压缩机制,最大限度减少同步的数据量。同时我们也不断扩大专线的容量。

 

随着业务不断增长,同步的数据量越来越多,这种部署架构遇到的挑战越来越大,最终在2015年初,我们将两地机房进行合并。中途最大挑战是南京机房的网络条件问题,当时南京地区尚无接入条件较好的多线BPG机房,为了给全国用户提供较好的网络服务,我们最终采用了动态CDN方案,南京机房出口仅提供电信出口的IP。对联通、移动的用户通过动态域名解析,解析到本地较近中转服务器,再由中转服务器优化路由访问南京的电信线路。该方案能为全国用户提供良好的网络服务。

 

在整个服务器部署成本上,我们至少降低了30%,一是避免了同一套系统在南北京部署两份,二是节省了大量的专线费用。

 

目前的单机房策略,是一个过渡方案,为了保证系统进一步的高可用和数据的安全性,我们后期将向标准的两地三中心机房部署策略迈进。

 

性能优化

 

性能优化主要介绍我们在优化过程中总结出来几个工具,我们的思路是:首先,不断推进架构演变,系统划分整理,提前对资源进行扩展,保证总体的承载能力。然后,不断推进监控完善,性能指标具体化,发现问题、解决问题,保证总体的稳定能力。主要由这样三个工具实现:CODIS、BWT、OSS。

 

Codis是豌豆荚使用Go和C语言开发,以代理方式实现的一个Redis分布式集群解决方案,且完全兼容Twemproxy。Codis底层会处理请求的转发、不停机的数据迁移等工作。所有底层的处理, 对于客户端来说都是透明的。总之,可以简单地认为后台连接的是一个内存无限大的Redis服务。我们从无缓存,到文件缓存,到Memcache缓存,到今天的Codis缓存,缓存是大型架构的必然。

使用Codis后,应用端不需要再关心缓存具体存放在哪里,不需要关心缓存扩容和数据迁移的工作,不需要关心缓存数据一致性的问题,极大提升了应用开发和维护的效率。

 

BWT是我们自主开发的一个主动缓存更新服务,为了进一步提升页面的生成效率,应用系统发生数据变更时,将要更新的数据请求发到BWT中,BWT根据设置好的更新策略,对缓存进行更新。应用系统推送过来的数据,一般会延时3分钟,进行更新。同时BWT也会通过日志分析出来的热点数据,会根据设置的时间自动更新。更新的过程中,若目标机器负载高,会自动停止更新。

 

OSS也是我们自主研发的一个网站运营监控系统,该系统初期目标是对网站的性能、可用性和安全的进行监控和管理。后期将独立成一个单独的运营监控系统,为所有系统提供监控服务。图5是OSS的系统结构。

 

 图5 网站运营监控系统OSS的系统结构

 

主要特点是使用UPD的方式将日志从应用系统发送出来,尽可能降低发送日志对应用系统的性能消耗。通过NSQ队列接收日志,使用Go语言编写的消费进程将日志汇总处理后,存入DB,并最终通过页面将各种统计报表呈现出来。

网站的各种故障,可以通过错误与性能图表,很快找到问题。主要有依赖接口监控,慢查SQL监控,Memcache监控,Redis监控以及单页面性能监控。

 

App客户端技术演进

 

这里主要介绍途牛App在开发过程中的实践心得,侧重于线热补丁和前端资源静态化两个方面。

 

在线热补丁

 

由于App采用客户端发布的方案,一旦发布出去的包有Bug,修复是一个非常头疼的问题,传统的修复方法主要有:服务器端屏蔽技术,也就是将有问题的功能暂时屏蔽掉;跳转H5页面,将产生问题的页面直接跳转到对应的H5页面;紧急发布新版本。这几种办法均有一定的局限性,对于服务端屏蔽技术,会增加服务端代码复杂度并隐藏局部功能;对于跳转到H5,会降低用户体验;对于紧急发布新版本,会增加运营成本并降低用户体验。

 

为此我们引入了阿里的在线热补丁技术,以便在问题发生时,能够快速发布补丁包将问题解决。

 

前端资源静态化

 

由于H5开发周期短,容易部署的特性,在途牛App中存在大量的H5页面,但对于H5页面,用户体验的损失也是显而易见。为了让页面中的元素更快渲染,呈现给用户,我们采用了前端资源静态化的方案,主要思路是将H5页面中的静态资源提前加载,实现要点如下:

 

  1. 静态资源异步加载,用户打开App的时候异步下载或者更新静态文件。

  2. 优化渲染,减少不必要的开销。通过优化DOM布局,将加载的静态资源分组,可以打包的,优先渲染,需要从服务器取的,后渲染,从而加快第一次进入速度;减少第一屏DOM渲染数,使用懒加载,分步加载;优化渲染结构,由于App中的Webview性能低于手机浏览器,所以减少不必要的渲染开销,比如减少消耗非常高的一些滚动图;优化交互,有交互操作,造成DOM重排重绘的,尽量使用最小的DOM重排,将需要新加入的一些层,与原来的DOM结构分开;使用一些3D CSS,使用GPU帮助页面重绘。

 

以上就是我们在架构变迁过程中的一些实践要点,虽然看起来有些散,但还是主要从架构的以下三个方面进行介绍。

 

逻辑架构:服务化,如何将业务中通用的功能抽象出来,以服务的方式提供给其他各个系统。
物理架构:南北京机房的设计初衷,遇到的问题,解决方案等。
系统架构:非功能性的架构,比如性能优化,App客户端性能改进实践。

转载于:https://www.cnblogs.com/doNetTom/p/5188766.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_724482.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

小心!高效率的sql查询,它也会导致网站响应变慢

最近一个项目进行2.0版本升级。2.0版本部署到所有的线上机器后,发现网站访问速度变的很慢。为了不影响用户体验,紧急进行版本回滚,然后进行问题查找。 分析 首先查看php的日志,没有发现有用的线索。 然后看了下mysql db的监控情况…

关键词提取自动摘要相关开源项目,自动化seo

关键词提取自动摘要相关开源项目 GitHub - hankcs/HanLP: 自然语言处理 中文分词 词性标注 命名实体识别 依存句法分析 关键词提取 自动摘要 短语提取 拼音 简繁转换https://github.com/hankcs/HanLP 文章或博客的自动摘要(自动简介) - 开源中国社区http://www.oschina.net/cod…

最全的静态网站生成器(开源项目)

将动态网页静态化,可以有效减轻服务器端的压力,并且静态网页的访问速度要快于动态网页。此外,使用静态网页还有利于搜索引擎的收录,从而提高网站的搜索排名。 下面是StaticSiteGenerators网站收集整理的开源的静态网站生成器&…

SEO终极算法(二)

上一篇我的文章《草根站长这一年用血的教训换来的SEO终极算法》受到了许多读者的争议。今天为了迎合读者迫切的需求,特意写了SEO终极算法(二),希望给做SEO的朋友们能有一些启发。本篇文章比较基础常识性的SEO基础的问题我就不写了,只写比较有…

网站服务器炸了 进不去怎么办,炉石传说服务器炸了怎么回事-暴风城进不去排不到人解决方法-乖乖手游网...

炉石传说暴风城更新了,但玩家说进不去游戏,新版本的更新服务器就会炸掉,有很多玩家已经知道是怎么回事了,详细情况乖乖小编会在下面与大家分享,想知道暴风城进不去,还排不上人的可以来看看。相关推荐:炉石传…

iis 上传php文件,PHP网站在IIS中发布的相关配置

前言前段时间整了一个挂Q的平台。源代码是从网上下载的,后期稍微调整了一下链接和title之类的文字就上线了。详细在这里。运行了一段时间,除了偶尔出现QQ下线上线,整体效果基本上符合预期,个人感觉很满意,也小有成就感…

《大型网站服务器容量规划》一导读

前 言 大型网站服务器容量规划当今社会已经进入信息时代,人们足不出户,从网络上就可以获取自己需要的信息。为了满足正常的业务需求,任何一个网站都要有硬件支持,无论日访问量是一个百万级的中型网站还是上亿级的大型网站。为了正…

通过COOKIE欺骗登录网站后台

1.今天闲着没事看了看关于XSS(跨站脚本攻击)和CSRF(跨站请求伪造)的知识,xss表示Cross Site Scripting(跨站脚本攻击),它与SQL注入攻击类似,SQL注入攻击中以SQL语句作为用户输入,从而…

win7服务器建网站教程,win7搭建Web服务器教程

如何实现资源共享?那就需要利用Web服务器,借助它来实现信息的同步,也能将信息上传到服务器端,让用户悉知。那win7如何搭建Web服务器来实现这一目的呢?下面小编就给大家介绍win7搭建Web服务器教程。第一步:打开控制面板&#xff…

一句话道破SEO真谛

都在问SEO是什么?SEO到底是做什么的?为什么要做SEO? SEO是什么?一句话:SEO就是优化。优化包含两部分:内部优化(网站优化)和外部优化(市场优化) 内部优化&am…

使用C#的HttpWebRequest模拟登陆网站

使用C#的HttpWebRequest模拟登陆网站 原文:使用C#的HttpWebRequest模拟登陆网站这篇文章是有关模拟登录网站方面的。 实现步骤; 启用一个web会话 发送模拟数据请求(POST或者GET) 获取会话的CooKie 并根据该CooKie继续访问登录后的页面&#x…

SEO站长必备的十大常用搜索引擎高级指令

作为一个seo人员,不懂得必要的搜索引擎高级指令,不是一个合格的seo。网站优化技术配合一些搜索引擎高级指令将使得优化工作变得简单。今日就和大家聊聊SEO站长必备的十大常用搜索引擎高级指令的那些事儿。 【1】引号的用法 把关键字打上引号后把引号部分…

转:游戏玩家集体出逃 社交网站遭遇迷途

原文地址:http://games.sina.com.cn/y/2010-04-27/1130394729.shtml 在经历了摘菜和抢车位等游戏引发的狂热之后, 国内社交游戏玩家集体出逃,社交网站危机显现。 在商业价值和盈利模式的质疑声中,这些依靠游戏起家的Facebook模…

使用phpmyadmin管理远程sql_网站搬家记录-使用cPanel面板从SugarHosts迁出

自从购买了独立服务器,就准备把分散在各处主机的站点迁移到一块。目前最麻烦的就是在SugarHosts.com上的产品公园站点,只能使用cPanel面板,而我对这个面板又不熟悉,故在此做下记录。cPanel是什么cPanel是一套基于Web的自动化hosti…

部分网站为什么上不去_大量网站索引暴跌,百度搞鬼可以如何应对

做SEO的同事一大早跟我说他们站长群一早就炸了!只因为进入11月以来,不少的站点收录变慢、收录变少,今天更是有不少站长反馈说,索引量直接砍半。根据提供的索引截图来看,昨天的索引量都出现了断崖式暴跌,200…

《SEO的艺术(原书第2版)》——3.12 规划和评估的高级方法

3.12 规划和评估的高级方法 业务规划有许多方法。其中一种著名的方法是SWOT(Strengths、Weaknesses、Opportunities、Threats,优势、劣势、机遇、威胁)分析。还有一些方法能够确保规划目标的正确,如SMART(Specific、Me…

快速构建LAMP网站平台

快速构建LAMP网站平台1.1 问题 本例要求基于Linux主机快速构建LAMP动态网站平台,并确保可以支撑PHP应用及数据库,完成下列任务: 1)安装LAMP平台各组件,启动LAMP平台 软件包:httpd、mariadb-server、mariadb…

[转载]网站性能优化之CSS无图片技术 —— 网站性能优化

一、无图片技术定义在不使用CSS Image(通过CSS的引入的背景图片,不包括img标签内的图片)情况下生成类似图片效果的技术;换句话的意思就是在使用纯CSS生成类似图片效果的技术。二、为什么要“无图片”?首先我们通过yslow的statisti…

WebRAY网站检查技术支撑平台的实践

平台与网站越来越多,问题更多 互联网服务平台及门户网站已经成为互联网时代政府机关企事业单位的形象代言,是政企单位展示自身形象的一个重要渠道。从国务院办公厅组织开展的第一次全国政府网站普查情况获悉,截至2015年11月,各地区…

强大的跨平台绘制流程图软件网站ProcessOn

一个强大的作图网址(https://www.processon.com),告别vision,rose等需要本地安装的软件,只需要连接网络不需要安装任何软件就能制作流程图了。能绘制基本流程图形,flowchart流程图,bpmn,evc企业价值链&…