《大型网站系统与java中间件实践》读书笔记

news/2024/5/9 19:41:00/文章来源:https://blog.csdn.net/lonelymanontheway/article/details/82935563

As always,福利置顶,pdf下载链接:http://pan.baidu.com/s/1boE2xBp 密码:iu6o
书籍还算不错,把分布式系统各种可能的问题都细致地分析一遍,并给出几种解决方法和最佳的方案,这一点值得肯定。分布式系统最怕的问题就是一致性问题,很多章节都是围绕这个问题去阐述的,给出各种环节/节点可能出现不一致的原因,并给出解决方法。

第1章 分布式系统介绍

初识分布式系统

  1. 分布式系统的定义:A distributed system is one in which Components located at networked computers communicate and coordinate their actions only by passing messages.
  2. 分布式系统的意义
    分布式系统出现的原因:升级单机处理能力的性价比越来越低;单机处理能力存在瓶颈;处于稳定性和可用性的考虑。

分布式系统的基础知识

  1. 组成计算机的要素:输入,输出,运算器,控制器和存储器;
  2. 线程与进程的执行模式:阿姆达尔定律;互不通信的多线程模式,基于共享容器协同的多线程模式,通过事件协同的多线程模式,多进程模式;
  3. 网络通信基础知识:OSI七层模型,TCP/IP模型;网络IO实现方式:BIO阻塞;NIO,基于事件驱动思想,Reactor模式;AIO异步IO,Proactor模式
  4. 如何把应用从单机扩展到分布式:5要素的变化
  5. 分布式系统的难点:缺乏全局时钟;面对故障独立性;处理单点故障,如果不能把单点变为集群,则需要给单点做好备份,降低单点故障影响范围;事务的挑战:2PC、最终一致、BASE、CAP、Paxos等。

Socket 网络通信开发时用到的三种方式:BIO、NIO和AIO
BIO:Blocking IO,采用阻塞的方式实现,一个线程处理一个Socket,发生建立连接、读数据、写数据的操作时,都可能会阻塞。
NIO:Nonblocking IO,基于时间驱动思想,采用Reactor模式,可以在一个线程中处理多个Socket套接字
AIO:AsynchronousIO,异步IO,采用Proactor模式,与NIO的差别是,AIO在进行读写操作时,只需要调用响应的read/write方法,并且需要传入CompletionHandler,在动作完成后会调用。

第2章 大型网站及其架构演进过程

什么是大型网站:
海量数据、高并发访问量、本身业务的系统的复杂度;

大型网站的架构演进

  1. 用Java技术和单机来构建的网站
  2. 从一个单机的交易网站说起
  3. 单机负载告警,数据库与应用分离
  4. 应用服务器负载告警,如何让应用服务器走向集群
  5. 数据读压力变大,读写分离吧
  6. 弥补关系型数据库的不足,引入分布式存储系统(分布式文件系统、分布式KV系统和分布式数据库)
  7. 读写分离后,数据库又遇到瓶颈:垂直拆分和水平拆分;读写分离解决读压力大的问题,水平拆分解决数据量大或者更新量大的问题;垂直拆分带来的问题:原来单机中跨业务的事务,解决方法:1. 使用分布式事务,性能下降;2. 去掉事务或者不追求强事务支持;水平拆分带来的问题:SQL路由、主键处理、多个数据库源取数据,分页排序处理;
  8. 数据库问题解决后,应用面对的新挑战
  9. 初识消息中间件

增加应用服务器后需要解决的问题:
终端用户对多个应用服务器访问的选择问题;解决方法:DNS、负载均衡
Session问题;解决方法:Session sticky,Session replication,Session数据集中存储(引入网络操作),cookie based(问题:cookie长度限制、安全性、带宽消耗、性能影响,不推荐);

读写分离带来的问题:数据复制、应用对数据源的选择问题;
搜索引擎实际上是一个读库,构建搜索用的索引就是一个数据复制的过程。搜索系统构建索引的两个维度:全量/增量;实时/非实时;实时构建索引对数据源服务器有性能影响;
缓存:数据缓存和页面缓存;Apache ESI模块;

第3章 构建Java中间件

Java中间件的定义

构建Java中间件的基础知识

  1. 跨平台的Java运行环境——JVM
  2. 垃圾回收与内存堆布局
  3. Java并发编程的类、接口和方法
  4. 动态代理
  5. 反射
  6. 网络通信实现选择

Java并发编程的类、接口和方法
线程池、synchronized、ReentrantLock(公平锁和非公平锁,公平锁的好处是等待锁的线程不会饿死)、volatile、Atomics、wait/notify/notifyAll(对这个三个方法的调用都必须是在对象的synchronized块中)、CountDownLatch、CyclicBarrier、Semaphore、Exchanger、Future/FutureTask、并发容器(copyOnWrite & Concurrent);

分布式系统中的Java中间件

第4章 服务框架

目录结构:
1、网站功能持续丰富后的困境与应对
2、服务框架的设计与实现

  1. 应用从集中式走向分布式所遇到的问题
  2. 透过示例看服务框架原型
  3. 服务调用端的设计与实现
  4. 服务提供端的设计与实现
  5. 服务升级

3、实战中的优化
4、为服务化护航的服务治理
5、服务框架与ESB的对比

服务调用端的设计与实现
在这里插入图片描述
流程:调用发起=>寻址路由=>协议适配和序列化=>网络传输=>反序列化以及协议解析=>得到结果返回给调用方
1、确定服务框架的使用方式
2、服务调用者与服务提供者之间通信方式的选择
3、引入基于接口、方法、参数的路由
4、多机房场景,避免跨机房调用,一是在服务注册中心甄别,二是地址过滤
5、服务调用端的流控处理
6、序列化与反序列化处理,Java本身的序列化性能问题、跨语言问题、序列化后语言长度等
7、网络通信实现选择:BIO、NIO、AIO
8、支持多种异步服务调用方式:Oneway,Callback,Future,可靠异步

服务提供端的设计与实现
在这里插入图片描述
1、如何暴露远程服务
2、服务端对请求处理的流程
3、执行不同服务的线程池隔离
4、服务提供端的流控处理

第5章 数据访问层

数据库从单机到分布式的挑战和应对

  1. 从应用使用单机数据库开始
  2. 数据库垂直/水平拆分的困难
  3. 单机变为多机后,事务如何处理
  4. 多机的Sequence问题与处理
  5. 应对多机的数据查询

数据访问层的设计与实现

  1. 如何对外提供数据访问层的功能
  2. 按照数据层流程的顺序看数据层设计
  3. 独立部署的数据访问层实现方式
  4. 读写分离的挑战和应对

水平拆分和垂直拆分
垂直拆分把一个数据库中不同业务单元的数据分到不同的数据库里,水平拆分是根据一定的规则把同一个业务单元的数据拆分到多个数据库中;
垂直拆分带来的影响:

  • 单机的 ACID 被打破;
  • Join操作受影响;
  • 靠外键进行约束的场景有影响;

水平拆分带来的影响:

  • ACID 被打破;
  • Join操作受影响;
  • 靠外键进行约束的场景有影响;
  • 依赖单库的自增序列生成唯一 ID 会受影响;
  • 针对单个逻辑意义上的表的查询需要跨库;

分布式事务

  • 两阶段提交:2PC
  • 一致性理论:CAP、BASE
  • Paxos协议

多机自增主键问题
考虑唯一性和连续性,UUID生成方式(IP、MAC、时间等)连续性不好;
实现方案1:把ID集中放在一个地方进行管理,对每个Id序列独立管理,每台机器使用Id时都从这个Id生成器上取。
缺点:
性能问题:每次都去远程取Id会有资源损耗
生成器的稳定性问题,作为一个无状态的集群,保证可用性
存储的问题
实现方案2:舍掉Id生成器,把相关的逻辑放到需要生成Id的应用本身。每个生成器读取可用的Id,然后给应用使用,但是数据的Id并不是严格按照进入数据库顺序而增大的。

应对多机的数据查询
跨库Join

  • 在应用层把原来数据库的Join操作分成多次的数据库操作
  • 数据冗余,对常用信息进行冗余
  • 借助外部系统,如搜索引擎

外键约束:比较难解决,不能完全依赖数据库本身来完成之前的功能了。
跨库查询:一张逻辑表,对应多个数据库的多张数据表,在一些场景下比较复杂,如排序、最大最小求和等函数处理、求平均值、非排序分页、排序后分页。

如何对外提供数据访问层的功能
1、为用户提供专有API
2、通用的方式,数据层JDBC
3、基于ORM或类ORM接口的方式
直接基于JDBC驱动方式较好~

数据层的整体流程
SQL解析=>规则处理=>SQL改写=>数据源选择=>SQL执行=>结果集返回合并处理
1、SQL解析阶段

  • SQL解析并不完备
  • SQL中不带有分库条件,但实际上是可以明确指定分库的

2、规则处理阶段

  • 采用固定哈希算法作为规则,如根据用户id取模,id mod 2分库,再id mod 4分表。实现简单,但是如果扩容的话比较复杂!
  • 一致性哈希,节点对应的哈希值为一个范围,分配给现有节点。如果有节点加入,会从原有节点分管一部分范围的哈希值;如果有节点退出,会把哈希值交给下一个节点管理
  • 虚拟节点对一致性哈希的改进,引入虚拟节点,如4个物理节点可以变为多个虚拟节点,每个虚拟节点支持连续的哈希环上的一段。
  • 映射表与规则自定义计算方式,映射表是根据分库分表字段的值的查表法来确定数据源的方法,一般用于对热点数据的特殊处理。

3、改写SQL
分库分表后,查询就要跨库。分布的不同数据库中的表的结构虽然一样,但是表的名字、索引名字未必一样,所以要修改SQL。
还有需要修改SQL的地方,如跨库计算平均值,必须修改SQL获取数量、总数后再进行计算。
4、如何选择数据源,读写分析
5、执行SQL和结果处理阶段,异常处理和判断

第6章 消息中间件

消息中间件的价值

  1. 消息中间件的定义
  2. 透过示例看消息中间件对应用的解耦
    通过服务调用让其他系统感知事件发生的方式
    通过引入消息中间件解耦服务调用

互联网时代的消息中间件

  1. 如何解决消息发送一致性
  2. 如何解决消息中间件与使用者的强依赖问题
  3. 消息模型对消息接收的影响
  4. 消息订阅者订阅消息的方式
  5. 保证消息可靠性的做法
  6. 订阅者视角的消息重复的产生和应对
  7. 消息投递的其他属性支持
  8. 保证顺序的消息队列的设计
  9. Push和Pull方式的对比

消息中间件的核心特点功能:应用之间的解耦以及操作的异步,其实是:消息的顺序保证、扩展性、可靠性、业务操作与消息发送一致性,以 及多集群订阅者等;

如何解决消息发送一致性
消息发送一致性是指产生消息的业务动作与消息发送一致,即如果业务操作成功了,那么由这个操作产生的消息一定要发送出去。
1、发送消息给消息中间件
2、消息中间件入库消息
3、消息中间件返回结果
4、业务操作
5、发送业务操作结果给消息中间件
6、更改存储中消息状态

第7章 软负载中心与集中配置管理

初识软负载中心
两个最基础的职责:聚合地址信息;生命周期感知;

软负载中心的结构
两部分:服务端和客户端;
内部三类重要数据:聚合数据,订阅关系,连接信息;

内容聚合功能的设计
主要工作:保证数据正确性,高效聚合数据;
注意问题:并发下的数据正确性保证;数据更新、删除的顺序保证;大量数据同时插入/更新时的性能保证;

解决服务上下线的感知

软负载中心的数据分发的特点和设计

  1. 数据分发与消息订阅的区别
  2. 提升数据分发性能需要注意的问题

针对服务化的特性支持

  1. 软负载数据分组
  2. 提供自动感知以外的上下线开关
  3. 维护管理路由规则

从单机到集群

  1. 数据统一管理方案
  2. 数据对等管理方案

集中配置管理中心

  1. 客户端实现和容灾策略
  2. 服务端实现和容灾策略
  3. 数据库策略

第8章 构建大型网站的其他要素

  1. 加速静态内容访问速度的CDN
  2. 大型网站的存储支持
  3. 分布式文件系统
  4. NoSQL
  5. 缓存系统
  6. 搜索系统
  7. 爬虫问题
  8. 倒排索引
  9. 查询预处理
  10. 相关度计算
  11. 数据计算支撑
  12. 发布系统
  13. 应用监控系统
  14. 依赖管理系统
  15. 多机房问题分析
  16. 系统容量规划
  17. 内部私有云
    在这里插入图片描述
    引入CDN后浏览器访问网站的流程
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_796581.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

订餐网站2(后台界面)

因为后台不要求美观所以开始做后台界面给管理员用。需要的功能: 1. 登录页面 ->单独页面,aspx直接登录,成功转入管理页面 2. 管理员查看,处理订单 ->管理页面 3. 管理员修改菜品 ->管理页面 4. 管理员管理会员 ->…

订餐网站3(数据库设计)

由于网站比较小所以使用Access数据库, 表设计之后如下图,用Mindjet MindManager画的

订餐网站4(管理界面-dishes.aspx)

管理菜品的界面 1. 添加菜品通过 table中添加input text box实现 <asp:TableRow runat"server"> <asp:TableCell runat"server">菜品名称</asp:TableCell> <asp:TableCell runat"server">菜品介绍</asp:TableCell&…

jmeter模拟对网站做压力测试

一般的网站&#xff0c;在进入业务功能前先需登录&#xff0c;然后才能访问业务功能。基本框架如下 详细步骤&#xff1a; 1 .用badboy录制登录&#xff0c;访问随意一个网址。 2.用jmeter打开&#xff0c;一会自己写的时候可以参考里面的参数名称或路径什么的。如果对http熟悉…

Fiddler是最强大最好用的Web调试工具之一--网站抓包分析

Fiddler 教程 Fiddler是最强大最好用的Web调试工具之一&#xff0c;它能记录所有客户端和服务器的http和https请求&#xff0c;允许你监视&#xff0c;设置断点&#xff0c;甚至修改输入输出数据. 使用Fiddler无论对开发还是测试来说&#xff0c;都有很大的帮助。 阅读目录 Fid…

centos6下如何安装mysql服务_centos 6.5如何安装mysql?_网站服务器运行维护,centos 6.5,mysql...

Linux运维之shell变量.md_网站服务器运行维护我们知道shell里面有许多变量&#xff0c;比如我们经常会用到的PATH变量&#xff0c;它的作用就是&#xff0c;它的作用是设置可执行文件的目录&#xff0c;这样输入命令的时候就不用使用绝对路径了。centos 6.5安装mysql的方法&…

php网站开发实例教程源码,PHP+MYSQL网站开发全程实例

1. 从观念的引述、程序代码解析到范例的延伸应用&#xff0c;给您最完整的学习流程。2. 实务网站范例&#xff0c;所有技术整合运用&#xff0c;实作技巧一览无遗。3.在PHP的程序设计中&#xff0c;以高阶的程序设计&#xff0c;配上灵活的图解&#xff0c;增加您程序设计的功力…

项目1在线交流平台-7.构建安全高效的企业服务-5.redis高级数据结构应用-统计网站数据-独立访客和日活跃用户

文章目录功能需求一、dao层定义redis数据的key二、Service层处理业务逻辑1. 对独立访客UV的记录与查询记录new SimpleDateFormat("yyyyMMdd")format(new Date())- 日期类型转为指定日期格式字符串类型查询Calendar类 Calendar.getInstance()- 实例化操作日期的Calend…

打不开_网站打不开的原因有哪些

其实网站不管是在建设的过程中还是在投入运营使用之后&#xff0c;都会出现网站打不开的现象&#xff0c;而且还有很多的企业不知道出现这种现象的原因。今天八爪网就给大家分享网站打不开的原因有哪些&#xff0c;一起来看看吧。1、检查是否是网站服务器的问题有的企业在做网站…

使用Web标准建站第8天:CSS布局入门(2)

接下来开始要真正设计布局了。和传统的方法一样&#xff0c;你首先要在脑海里有大致的轮廓构想&#xff0c;然后用photoshop把它画出来。你可能看到有关web标准的站点大都很朴素&#xff0c;因为web标准更关注结构和内容&#xff0c;实际上它与网页的美观没有根本冲突&#xff…

java webmagic 使用_使用 | Java使用WebMagic 爬取网站

小小又开始学习了&#xff0c;这次跟着项目学习着&#xff0c;需要使用一个相关的爬虫&#xff0c;这里使用的是webmagic作为网站的爬虫。安装这里使用maven进行安装。根据maven下载相关的包us.codecraftwebmagic-core0.7.3us.codecraftwebmagic-extension0.7.3Hello World几乎…

linux shell监控网站延迟,shell脚本监控网站状态

给大家发个不错的网站监控shell,当然说它功能强大也不是很强大,但配置上很灵活,因为此脚本的作用是按固定频率不停访问给出的URL,当网站不可访问时自动给设定邮箱发送告警邮件以通知用户.好了.来看脚本吧.#!/bin/sh# */2 * * * * sh /var/monitor/web_monitor.sh http:///blog.…

Vue ElementUI el-tabs 监听导航栏的mouseover 和 mouseleave 事件

需求 项目需要对 el-tabs 的导航栏做鼠标监听事件&#xff0c;但官网仅有如下点击事件。所以另辟蹊径&#xff0c;对 class"el-tabs__nav-scroll" 做监听。 示例 <template><div><el-tabs class"my-tabs" v-model"activeName" …

网站的分布式架构学习

转载学习地址&#xff1a;http://www.cnblogs.com/sharpxiajun/archive/2013/05/11/3072798.html 网站的B/S技术架构图 在传统B/S架构的企业管理系统里&#xff0c;技术架构往往就是一个工程项目&#xff0c;各个逻辑分层都是该工程的业务逻辑模块。但是作为提供公共服务的网站…

做网站用UTF-8还是GB2312?

转载自 http://justjavac.javaeye.com/blog/695252 经常我们打开外国网站的时候出现乱码&#xff0c;又或者打开很多非英语的外国网站的时候&#xff0c;显示的都是口口口口口的字符&#xff0c; WordPress程序是用的UTF-8&#xff0c;很多cms用的是GB2312。 ● 为什么有这么…

小型电子商务网站设计原则

最近谈得最多的话题莫过于大规模&#xff0c;大数据量&#xff0c;高性能&#xff0c;高并发等架构话题&#xff0c;其实一个电子商务网站开始时一定是小规模&#xff0c;小数据量&#xff0c;用不着把架构弄得过于复杂。高度设计、过度扩展(高德纳大爷也说过&#xff0c;"…

Mysql在大型网站的应用架构演变

写在最前: 本文主要描述在网站的不同的并发访问量级下&#xff0c;Mysql架构的演变 可扩展性 架构的可扩展性往往和并发是息息相关&#xff0c;没有并发的增长&#xff0c;也就没有必要做高可扩展性的架构&#xff0c;这里对可扩展性进行简单介绍一下&#xff0c;常用的扩展手段…

(转载)可扩展、高可用、负载均衡网站架构设计方案

可扩展、高可用、负载均衡网站架构设计方案作者&#xff1a;田逸(sery163.com) 本作品已刊登在《IT实验室周报》第6期第6版 基本需求: 1、 高可用性&#xff1a;将停止服务时间降低到最低甚至是不间断服务 2、 可扩展性&#xff1a;随着访问的增加&#xff0c;系统具备良好的…

MOUSEOVER在拼接的HTML无效处理

正常情况下&#xff1a; //鼠标移入移出&#xff08;顶部企业图标信息&#xff09;$(".patternBg").mouseover(function (){ $(".enterpriseContent").show(); }).mouseout(function () {$(".enterpriseContent").hide();}); 修改成&#x…

SQl语句查存储过程\触发器\约束(网站数据库转移缺漏审查)

网站开发最让我们头疼的就是数据的架构.本地开发很轻松.程序只需要打包dll就可以了,但是数据库要架设到空间服务器上,就要转移.一不小心就会忘了一些存储过程,触发器,约束.这里为大家提供几个查用的检查.能够快速找出有哪些东西是忘记传了.很实用.有好的方法,请知道. 该条语句查…