「MySQL高级篇」MySQL之MVCC实现原理事务隔离级别的实现

news/2024/4/30 6:52:28/文章来源:https://www.cnblogs.com/melojun/p/mysql-mvcc.html

大家好,我是melo,一名大三后台练习生,死去的MVCC突然开始拷打我🤣🤣🤣!

🍳引言

MVCC,非常顺口的一个词,翻译起来却不是特别顺口:多版本并发控制。

  • 其中多版本是指什么呢?一条记录的多个版本。
  • 并发控制?如何实现呢?我们上篇刚讲到了锁机制,而MVCC则是用更好的方式来提高并发性能,避免加锁!具体如何实现,底层原理是什么,这篇将带你攻破ta。

🎏本篇速览脑图

MVCC.png

image.png
通过「版本链」来控制并发事务访问同一个记录时的行为就叫 MVCC(多版本并发控制)。

看完后文,再回过头来看这张图,就会理解了

当前读,快照读

首先我们需要一些前置知识,区分开当前读和快照读。

  1. 加锁的读,则是当前读,另外update,insert,delete也都是当前读
  2. 快照读,我们平时简单的select语句其实就是【不加锁】

注意串行化隔离级别下,快照读会退化为当前读。

image.png

  • 那这俩跟MVCC有什么关系呢?

快照读,相当于你可以读到的是一个历史版本,维护这些历史版本就需要MVCC出马了【其中的undolog版本链】

MVCC用处

解决 读—写 冲突的无锁并发控制,每次对A记录的写操作,都会给A保存一个快照版本,至于读操作的时候,读的是哪个快照版本,这就得看MVCC的实现原理了【下文的readview访问规则】

🎯MVCC实现原理

🎯记录中的隐藏字段

InnoDB 里面每个事务有一个唯一的事务 ID,叫作 transaction id。它是在事务开始的时候向 InnoDB 的事务系统申请的,是按申请顺序严格递增的

每行数据也都是有多个版本的。每次事务更新数据的时候,都会生成一个新的数据版本,并且把 transaction id 赋值给这个数据版本的事务 ID,记为 row trx_id【也就是下图的DB_TRX_ID】。同时,旧的数据版本要保留,并且在新的数据版本中,能够有信息可以直接拿到它。
image.png

  • DB_TRX_ID(6字节):表示最后一次插入或更新该行的事务 id。此外,delete 操作在内部被视为更新,只不过会在记录头 Record header 中的 deleted_flag 字段将其标记为已删除

  • DB_ROLL_PTR(7字节) 回滚指针,指向该行的 undo log 。如果该行未被更新,则为空

  • DB_ROW_ID(6字节):如果没有设置主键且该表没有唯一非空索引时,InnoDB 会使用该 id 来生成聚簇索引

🎯readview

四个核心字段

image.png
计算m_ids的时候,可能会有新的事务产生,为了防止这种情况出现,MySQL保证计算m_ids【也就是生成视图数组的时候】会在事务系统的锁保护下进行,是原子操作,期间不会创建新的事务。

🎈🎈访问规则

image.png

  • 如果记录的 trx_id 值小于 Read View 中的 min_trx_id 值,表示这个版本的记录是在创建 Read View 已经提交的事务生成的,所以该版本的记录对当前事务可见

  • 如果记录的 trx_id 值大于等于 Read View 中的 max_trx_id 值,表示这个版本的记录是在创建 Read View 才启动的事务生成的,所以该版本的记录对当前事务不可见

  • 如果记录的 trx_id 值在 Read View 的 min_trx_id 和 max_trx_id 之间,表明这个版本的记录在创建 Read View 的时候 可能处于“活动状态”或者“已提交状态”;需要判断 trx_id 是否在 m_ids 列表【活跃状态】中:--【因为是有序的,故采用二分查找】

    • 如果记录的 trx_id m_ids 列表中,表示生成该版本记录的活跃事务依然活跃着(还没提交事务),所以该版本的记录对当前事务不可见
    • 如果记录的 trx_id 不在 m_ids列表中,表示生成该版本记录的活跃事务已经被提交,所以该版本的记录对当前事务可见

🍔🍔总结

  1. 版本未提交,不可见;
  2. 版本已提交,但是是在视图创建后提交的,不可见;
  3. 版本已提交,而且是在视图创建前提交的,可见。

🎈🎈update特例

image.png
在这个例子中,如果还按上边的访问规则来看的话,应该是读取不到102这个版本来着,但实际情况是如何呢?

如果读取不到的话:那事务B还是在原来的k基础上去+1,那么事务C的更新相当于是丢失了!

这里就涉及到了我们开篇讲到的当前读,更新数据都是先读后写的,这个读,就是“当前读”。

而且当前读需要对数据行加锁,此处由于事务C已经提交了,释放了锁【两阶段协议】,因此事务B可以直接查到,若事务C还未提交的话,还需要阻塞等待。

🤷‍♂️🤷‍♂️45讲疑问

可能看了45讲的小伙伴会有疑问,45讲里边这个图

这样,对于当前事务的启动瞬间来说,一个数据版本的 row trx_id,有以下几种可能:

  1. 如果落在绿色部分,表示这个版本是已提交的事务或者是当前事务自己生成的,这个数据是可见的;
  2. 如果落在红色部分,表示这个版本是由将来启动的事务生成的,是肯定不可见的;
  3. 如果落在黄色部分,那就包括两种情况
    a. 若 row trx_id 在数组中,表示这个版本是由还没提交的事务生成的,不可见;
    b. 若 row trx_id 不在数组中,表示这个版本是已经提交了的事务生成的,可见。

这个图很容易迷惑到我们,让我们误以为黄色部分跟未提交事务集合是等同的,那怎么落在黄色部分里边,还能再细分成两种情况呢?

melo画了个花里胡哨的图,来看看计算的过程【如有错误之处还请指正】

  1. 1-10就是45讲里边的绿色部分,11-15是黄色部分,15之后是红色部分
    1. 如此可以看到,黄色部分里边,还是有一些不在m_ids里边的吧,不要被表面的图像迷惑了
    2. 并不是说只有11之前的,才是已提交事务,11-15里边也是可能会有已提交事务的

image.png

生成时机

注意,并不是开启事务就生成了,得执行快照读了才会

RC: 在事务中每一次执行快照读都会生成
RR:仅在事务中第一次执行快照时生成,后续都是复用这个readview
但是如果事务中进行了当前读的操作,比如事务中进行了update操作,后续再查询就会重新生成ReadView

其实就是上边的update特例

🎯undo log

当读取记录时,若该记录被其他事务占用或当前版本对该事务不可见,则可以通过 undo log 读取之前的版本数据,以此实现快照读

类型

image.png
在 InnoDB 存储引擎中 undo log 分为两种: insert undo log 和 update undo log:

  1. insert undo log :指在 insert 操作中产生的 undo log。因为 insert 操作的记录只对事务本身可见【只在事务回滚时需要】,对其他事务不可见,故该 undo log 可以在事务提交后直接删除。不需要进行 purge 操作
  2. update undo log :update 或 delete 操作中产生的 undo log。该 undo log可能需要提供 MVCC 机制,因此不能在事务提交时就进行删除。提交时放入 undo log 链表【下文的版本链】,等待 purge线程 进行最后的删除

🎈版本链

类似一个链表,通过回滚指针,串联起来

  • 链表头部是最新的数据,尾部是最旧的记录

image.png

🍔栗子

🎈🎈RC的例子

快照读

image.png
先看事务5里边,两次快照读生成的readview是怎样的?

  1. 第一次执行,此时活跃的事务id有【3,4,5】(2已经提交了)
  2. 最小即是3,最大【注意是预分配最大】是6
  3. 创建该事务的id自然是5

第二次快照读也是同样的分析方式

🎈判断能查到哪个事务记录

我们想知道第一次快照读,读取到的是哪个事务对应的记录【左下角中四个记录】

比如拿 0x0003这条记录来分析,trx_id是3,去跟第一个readview比对

  1. 判断是否是当前事务创建的记录,3!=5,说明不是
  2. 判断是否已经提交了【小于min_trx_id】,3不小于3,则还未提交
  3. 判断是否是创建readview之后才创建的事务记录【大于max_trx_id】,3不大于,则不是
  4. 判断数据是否已经提交【不在m_ids】里边,3在说明还未提交

因此,第一次快照读,是没法读取到 0x0003这条记录的

image.png

RR的例子

image.png
具体如何分析,跟上边RC是一样的,这里就不再赘述

只需要注意:如果期间出现了当前读,则会重新生成readview

总结

MVCC就是为快照读而生的,维护不同的快照版本,使得不同事务的读-写操作不会冲突,实现多版本并发控制,借助MVCC,数据库可以实现READ COMMITTED,REPEATABLE READ等隔离级别

MVCC.png

💠下篇预告

这篇我们主要讲的是MVCC多版本并发控制,结合了事务的隔离级别,而关于事务背后的原理相关的日志,这些我们留到后边再来详解。

🖨参考文献

  • MySQL45讲
  • 黑马MySQL视频

收藏=白嫖,点赞+关注才是真爱!!!本篇文章如有不对之处,还请在评论区指出,欢迎添加我的微信一起交流:Melo__Jun

🧿友链

  • MySQL高级篇专栏

  • 🎉我的一年后台练习生涯

  • 聊聊Java

  • 分布式开发实战

  • Redis入门与实战

  • 数据结构与算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_410191.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Fiddler 抓包工具

1 基本使用 官网下载地址:Download Fiddler Web Debugging Tool for Free by Telerik X.1 电脑端监听 我们双击打开软件,进入到如下的一个界面,然后点击某一个请求,你会发现请求的内容是一堆明显不对的文字,然后该请求…

MySQL性能优化和慢查询日志

目标 了解性能优化的方案能够使用慢日志定位慢SQL 讲解 1. 优化方案 1.1 为什么要优化数据库性能 ​ MySQL凭借着出色的性能、低廉的成本、丰富的资源,已经成为绝大多数互联网公司的首选关系型数据库。可以看到Google,Facebook,Twitter&…

【百度地图】百度地图的使用方法 和 在vue中如何使用百度地图(超详细)

【百度地图】百度地图的使用方法 和 在vue中如何使用百度地图(超详细) 1- 介绍 百度地图功能强大,本篇文章只是对百度地图JavaScript API 进行一个介绍~ 官方网址 百度地图开放平台LBS:LocationBusinessServer 基于定义位置的商…

Spark 离线开发框架设计与实现

一、背景 随着 Spark 以及其社区的不断发展,Spark 本身技术也在不断成熟,Spark 在技术架构和性能上的优势越来越明显,目前大多数公司在大数据处理中都倾向使用 Spark。Spark 支持多种语言的开发,如 Scala、Java、Sql、Python 等。…

Matlab神经网络函数newff()新旧用法差异

在Matlab R2010a版中,如果要创建一个具有两个隐含层、且神经元数分别为5、3的前向BP网络,使用旧的语法可以这样写:net1 = newff(minmax(P), [5 3 1]); 注意minmax()函数的使用,还有对输出层神经元数(1)的指定。当然也可以采用新的语法,更简洁(请留意差异):net2 = new…

形态分类行为中的气泡佯谬

“假设光归根结底是波,只是给我们以粒子的印象,因为粒子吸收光波的能量是以离散的包的方式。波从源头传播出去像一个越来越大正在膨胀的气泡,到达一个原子时,气泡破裂,波坍缩并把所有的能量集中在一个地方,…

【数字式时间继电器】TR-23 DC110V

系列型号 TR-20数字式时间继电器;TR-21数字式时间继电器; TR-22数字式时间继电器;TR-23数字式时间继电器; TR-24数字式时间继电器;TR-25数字式时间继电器; TR-20D数字式时间继电器;TR-21D数字式…

无刷电机控制基础(3)——FOC矢量控制入门

本节我们讲一些无刷电机FOC矢量控制的入门知识。 1)FOC矢量控制的作用 我们前两节讲的无刷电机(BLDC),是最简单的结构,当转子匀速转动时,定子内产生的反电动势是梯形波;在驱动无刷电机转动时&a…

你不知道的JavaScript-----强制类型转换

目录 值类型转换 抽象值的操作 JSON 字符串化 ToNumber: 非数字值到数字值 Number(value) ToBoolean: 转换为布尔类型 Boolean(value) 强制类型转换 字符串和数字之间的显式强制类型转换 奇特的~运算符 字位截除 显式解析数字字符串 显式转换为布尔值 隐…

Mybatis查询返回结果类型专题

文章目录一、返回一条信息二、返回List集合三、返回Map集合四、返回多个Map集合五、返回List集合一、返回一条信息 Student selectById(Long id); 不再赘述 二、返回List集合 List< Student> selectAll(); 不再赘述 三、返回Map集合 用map集合去接收返回来的结果 字…

Python-- list(列表)的使用

目录 1.合并两个有序序列构成一个有序列表 2.编写程序判断列表是否为升序 3.输入一个十进制转换为二进制输出 4.将列表中的前p个元素到尾列表 1.合并两个有序序列构成一个有序列表 代码如下&#xff1a; list1 list(eval(input("请输入有序列表list1:"))) list…

【飞桨PaddleSpeech语音技术课程】— 一句话语音合成全流程实践

(以下内容搬运自飞桨PaddleSpeech语音技术课程&#xff0c;点击链接可直接运行源码) 一句话语音合成全流程实践 点击播放视频 1 声音克隆介绍 & 语音合成基本概念回顾 语音合成&#xff08;Speech Sysnthesis&#xff09;&#xff0c;又称文本转语音&#xff08;Text-t…

Web前端:angular对比React——选择2022年Web开发的理想框架

Javascript世界中的框架列表不断增长和变化&#xff0c;但有两个框架从其他框架中脱颖而出。Angular和React是市场上最受欢迎的框架之一&#xff0c;代表了创建web应用程序和网站的两种不同方法。 试图利用web开发框架的开发人员和企业家现在正在分析Angular和React——这两种方…

软考下午题第2题——E-R图 UML图 逻辑结构设计-示题与解析

下午的第二题主要是找【属性】【主键】【外键】【候选键】之间的关系。 候选键&#xff1a;属性或者是属性组合&#xff0c;其值能够唯一地标识一个元组 主键&#xff1a;在一个关系中可能有多个候选键&#xff0c;从中选择一个作为主键 外键&#xff1a;如果一个关系中的属性或…

微机期末复习指导

目录 位扩展定义字扩展定义1、线选法定义优点缺点2、部分译码法定义3、全译码法定义优点缺点⭐字位扩展定义问题

高压放大器基于声纹影法的声可视化实验的应用

实验名称&#xff1a;高压功率放大器基于声纹影法的声可视化实验应用 研究方向&#xff1a;声学超表面声学隐身斗篷 实验内容&#xff1a;利用声纹影平台&#xff0c;对所设计的声隐身斗篷进行出射平面波的测量&#xff0c;采用安泰放大器来驱动平面超声波阵列&#xff0c;可以…

CSS3专题-[上篇]:过渡、2D转换、动画

目录 CSS3&#xff1a;前置特性 CSS3&#xff1a;盒子模型 CSS3&#xff1a;图片滤镜与模糊处理 blur()&#xff1a;高斯模糊 CSS3&#xff1a;计算盒子宽度calc()函数 CSS3&#xff1a;过渡效果 transition属性 2D转换&#xff1a;transform属性 translate()方法 * t…

Mybatis MappedStatement

MappedStatement MappedStatement 类是 Mybatis 框架的核心类之一&#xff0c;它存储了一个 sql 对应的所有信息 Mybatis 通过解析 XML 和 mapper 接口上的注解&#xff0c;生成 sql 对应的 MappedStatement 实例&#xff0c;并放入 SqlSessionTemplate 中 configuration 类属…

凭此五点 这款信创传输系统解决了传输的迫切需求

早在20世纪80年代&#xff0c;我国政府IT底层基础软硬件的自主创新提出了相关要求&#xff0c;但受制于国外巨头垄断关键技术&#xff0c;诸多系统性风险与安全隐患无力解决。自2018年以来&#xff0c;在中兴和华为等公司供应链危机的催化下&#xff0c;信创产业进入快速发展期…

Verilog设计参数化的译码器与编码器,以及设计4位格雷码计数器

Verilog设计参数化的译码器与编码器&#xff0c;以及设计4位格雷码计数器 使用Quartusmodelsim完成设计 文章目录Verilog设计参数化的译码器与编码器&#xff0c;以及设计4位格雷码计数器1. 参数化的译码器分析代码实现Testbench结果2. 参数化的编码器分析代码Testbench结果3.…