MySQL实战解析底层---基础架构:一条SQL查询语句是如何执行的?

news/2024/4/27 10:38:06/文章来源:https://blog.csdn.net/weixin_59624686/article/details/129261418

目录

前言

连接器

查询缓存

分析器

优化器

执行器


  • 前言

  • 平时使用数据库,看到的通常都是一个整体
  • 比如,有个最简单的表,表里只有一个 ID 字段,在执行下面这个查询语句时:

  • 看到的只是输入一条语句,返回一个结果,却不知道这条语句在 MySQL 内部的执行过程
  • 把 MySQL 拆解一下,看看里面都有哪些“零件”,借由这个拆解过程,对 MySQL 有更深入的理解
  • 这样当碰到 MySQL 的一些异常或者问题时,就能够直戳本质,更为快速地定位并解决问题
  • 大体来说,MySQL 可以分为 Server 层和存储引擎层两部分
  • Server 层包括连接器、查询缓存、分析器、优化器、执行器等,涵盖 MySQL 的大多数核心服务功能,以及所有的内置函数(如日期、时间、数学和加密函数等),所有跨存储引擎的功能都在这一层实现,比如存储过程、触发器、视图等
  • 而存储引擎层负责数据的存储和提取
  • 其架构模式是插件式的,支持 InnoDB、MyISAM、Memory 等多个存储引擎
  • 现在最常用的存储引擎是 InnoDB,它从 MySQL 5.5.5 版本开始成为了默认存储引擎
  • 也就是说,执行 create table 建表的时候,如果不指定引擎类型,默认使用的就是InnoDB
  • 不过,也可以通过指定存储引擎的类型来选择别的引擎,比如在 create table 语句中使用 engine=memory, 来指定使用内存引擎创建表
  • 不同存储引擎的表数据存取方式不同,支持的功能也不同,在后面会讨论到引擎的选择
  • 不同的存储引擎共用一个 Server 层,也就是从连接器到执行器的部分
  • 连接器

  • 第一步,你会先连接到这个数据库上,这时候接待你的就是连接器
  • 连接器负责跟客户端建立连接、获取权限、维持和管理连接
  • 连接命令一般是这么写的

  • 输完命令之后,就需要在交互对话里面输入密码
  • 虽然密码也可以直接跟在 -p 后面写在命令行中,但这样可能会导致你的密码泄露
  • 如果你连的是生产服务器,强烈建议你不要这么做
  • 连接命令中的 mysql 是客户端工具,用来跟服务端建立连接
  • 在完成经典的 TCP 握手后,连接器就要开始认证你的身份,这个时候用的就是你输入的用户名和密码
    • 如果用户名或密码不对,你就会收到一个"Access denied for user"的错误,然后客户端程序结束执行
    • 如果用户名密码认证通过,连接器会到权限表里面查出你拥有的权限
    • 之后,这个连接里面的权限判断逻辑,都将依赖于此时读到的权限
  • 这就意味着,一个用户成功建立连接后,即使你用管理员账号对这个用户的权限做了修改,也不会影响已经存在连接的权限
  • 修改完成后,只有再新建的连接才会使用新的权限设置
  • 连接完成后,如果你没有后续的动作,这个连接就处于空闲状态,你可以在 show processlist命令中看到它
  • 其中的 Command 列显示为“Sleep”的这一行,就表示现在系统里面有一个空闲连接
  • 客户端如果太长时间没动静,连接器就会自动将它断开
  • 这个时间是由参数 wait_timeout 控制的,默认值是 8 小时
  • 如果在连接被断开之后,客户端再次发送请求的话,就会收到一个错误提醒: Lost connection to MySQL server during query
  • 这时候如果你要继续,就需要重连,然后再执行请求了
  • 数据库里面,长连接是指连接成功后,如果客户端持续有请求,则一直使用同一个连接
  • 短连接则是指每次执行完很少的几次查询就断开连接,下次查询再重新建立一个
  • 建立连接的过程通常是比较复杂的,所以建议在使用中要尽量减少建立连接的动作,也就是尽量使用长连接
  • 但是全部使用长连接后,你可能会发现,有些时候 MySQL 占用内存涨得特别快,这是因为MySQL在执行过程中临时使用的内存是管理在连接对象里面的
  • 这些资源会在连接断开的时候才释放
  • 所以如果长连接累积下来,可能导致内存占用太大,被系统强行杀掉(OOM)
  • 从现象看就是 MySQL 异常重启了
  • 怎么解决这个问题呢?可以考虑以下两种方案:
    • 1---定期断开长连接
    • 使用一段时间,或者程序里面判断执行过一个占用内存的大查询后,断开连接,之后要查询再重连
    • 2---如果你用的是 MySQL 5.7 或更新版本,可以在每次执行一个比较大的操作后,通过执行mysql_reset_connection来重新初始化连接资源
    • 这个过程不需要重连和重新做权限验证,但是会将连接恢复到刚刚创建完时的状态
  • 查询缓存

  • 连接建立完成后,就可以执行 select 语句了
  • 执行逻辑就会来到第二步:查询缓存
  • MySQL 拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句
  • 之前执行过的语句及其结果可能会以 key-value 对的形式,被直接缓存在内存中
  • key 是查询的语句,value 是查询的结果
  • 如果查询能够直接在这个缓存中找到 key,那么这个 value 就会被直接返回给客户端
  • 如果语句不在查询缓存中,就会继续后面的执行阶段
  • 执行完成后,执行结果会被存入查询缓存中
  • 可以看到,如果查询命中缓存,MySQL 不需要执行后面的复杂操作,就可以直接返回结果,这个效率会很高
  • 但是大多数情况下建议你不要使用查询缓存,为什么呢?因为查询缓存往往弊大于利
  • 查询缓存的失效非常频繁,只要有对一个表的更新,这个表上所有的查询缓存都会被清空
  • 因此很可能你费劲地把结果存起来,还没使用呢,就被一个更新全清空了
  • 对于更新压力大的数据库来说,查询缓存的命中率会非常低
  • 除非你的业务就是有一张静态表,很长时间才会更新一次
  • 比如,一个系统配置表,那这张表上的查询才适合使用查询缓存
  • 好在 MySQL 也提供了这种“按需使用”的方式:
  • 可以将参数 query_cache_type 设置成DEMAND,这样对于默认的 SQL 语句都不使用查询缓存
  • 而对于你确定要使用查询缓存的语句,可以用 SQL_CACHE 显式指定,像下面这个语句一样:
  • 需要注意的是,MySQL 8.0 版本直接将查询缓存的整块功能删掉了,也就是说 8.0 开始彻底没有这个功能了
  • 分析器

  • 如果没有命中查询缓存,就要开始真正执行语句了
  • 首先,MySQL 需要知道你要做什么,因此需要对 SQL 语句做解析
  • 分析器先会做“词法分析”
  • 你输入的是由多个字符串和空格组成的一条 SQL 语句,MySQL需要识别出里面的字符串分别是什么,代表什么
  • MySQL 从你输入的"select"这个关键字识别出来,这是一个查询语句
  • 它也要把字符串“T”识别成“表名T”,把字符串“ID”识别成“列 ID”
  • 做完了这些识别以后,就要做“语法分析”
  • 根据词法分析的结果,语法分析器会根据语法规则,判断你输入的这个 SQL 语句是否满足 MySQL 语法
  • 如果你的语句不对,就会收到“You have an error in your SQL syntax”的错误提醒,比如下面这个语句 select 少打了开头的字母“s”

  • 优化器

  • 经过了分析器,MySQL 就知道你要做什么了
  • 在开始执行之前,还要先经过优化器的处理
  • 优化器是在表里面有多个索引的时候,决定使用哪个索引
  • 或者在一个语句有多表关联(join)的时候,决定各个表的连接顺序
  • 比如执行下面这样的语句,这个语句是执行两个表的 join:

    • 既可以先从表 t1 里面取出 c=10 的记录的 ID 值,再根据 ID 值关联到表 t2,再判断 t2 里面 d 的值是否等于 20
    • 也可以先从表 t2 里面取出 d=20 的记录的 ID 值,再根据 ID 值关联到表 t1,再判断 t1 里面 c 的值是否等于 10
  • 这两种执行方法的逻辑结果是一样的,但是执行的效率会有不同,而优化器的作用就是决定选择使用哪一个方案
  • 优化器阶段完成后,这个语句的执行方案就确定下来了,然后进入执行器阶段
  • 执行器

  • MySQL 通过分析器知道了你要做什么,通过优化器知道了该怎么做,于是就进入了执行器阶段,开始执行语句
  • 开始执行的时候,要先判断一下你对这个表 T 有没有执行查询的权限,如果没有,就会返回没有权限的错误,如下所示 (在工程实现上,如果命中查询缓存,会在查询缓存返回结果的时候,做权限验证;查询也会在优化器之前调用 precheck 验证权限)
  • 如果有权限,就打开表继续执行
  • 打开表的时候,执行器就会根据表的引擎定义,去使用这个引擎提供的接口
  • 比如例子中的表 T 中,ID 字段没有索引,那么执行器的执行流程是这样的:
    • 1.调用 InnoDB 引擎接口取这个表的第一行,判断 ID 值是不是 10,如果不是则跳过,如果是则将这行存在结果集中;
    • 2.调用引擎接口取“下一行”,重复相同的判断逻辑,直到取到这个表的最后一行
    • 3.执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端
  • 至此,这个语句就执行完成了
  • 对于有索引的表,执行的逻辑也差不多
  • 第一次调用的是“取满足条件的第一行”这个接口,
  • 之后循环取“满足条件的下一行”这个接口,这些接口都是引擎中已经定义好的
  • 你会在数据库的慢查询日志中看到一个 rows_examined 的字段,表示这个语句执行过程中扫描了多少行
  • 这个值就是在执行器每次调用引擎获取数据行的时候累加的
  • 在有些场景下,执行器调用一次,在引擎内部则扫描了多行,因此引擎扫描行数跟rows_examined 并不是完全相同的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_75305.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Billu靶场黑盒盲打——思路和详解

一、信息收集 1、探测内网主机IP可以使用各种扫描工具比如nmap,我这里用的是自己编写的。 nmap -n 192.168.12.0/24 #扫描IP,发现目标主机 2、先不着急,先收集一波它的端口(无果) nmap -n 192.168.12.136 -p 1-10000…

华为OD机试题,用 Java 解【靠谱的车】问题

最近更新的博客 华为OD机试题,用 Java 解【停车场车辆统计】问题华为OD机试题,用 Java 解【字符串变换最小字符串】问题华为OD机试题,用 Java 解【计算最大乘积】问题华为OD机试题,用 Java 解【DNA 序列】问题华为OD机试 - 组成最大数(Java) | 机试题算法思路 【2023】使…

字符串反转-课后程序(JAVA基础案例教程-黑马程序员编著-第九章-课后作业)

【案例9-2】 字符串反转 【案例介绍】 1.案例描述 在使用软件或浏览网页时,总会查询一些数据,查询数据的过程其实就是客户端与服务器交互的过程。用户(客户端)将查询信息发送给服务器,服务器接收到查询消息后进行处…

数据仓库-数仓分层

层级 全拼 职责划分 ODS(源数据层) Operational DataStore ODS层存储最原始的数据, 对数据不做任何加工处理; 源数据主要来自业务数据库和日志,这些数据是用户操作业务系统产生,所以叫操作型数据(Operational Data) 。 DWD(…

MySQL数据库操作

查看数据库语法show databases——列出所有的数据库 show databases [ like wild ];——列出和字符串wild名字相同的数据库 这里可以配合SQl的 "%" 和 "_" 通配符使用来查找多个数据库在SQL语句中"%"代表任意字符出现任意次数,"_"代表…

为什么要学习C++软件调试技术?掌握这类技术都有哪些好处?

目录 1、为什么要学习C软件调试技术? 1.1、IDE调试手段虽必不可少,但还不够 1.2、通过查看日志和代码去排查异常崩溃问题,费时费力,很难定位问题 1.3、有的问题很难复现,可能只在客户的环境才能复现 1.4、为了应对…

短视频美颜sdk人脸编辑技术详解、美颜sdk代码分析

短视频美颜sdk中人脸编辑技术可以将人像风格进行转变,小编认为这也是未来的美颜sdk的一个重要发展方向,下文小编将为大家讲解一下短视频美颜sdk中人脸编辑的关键点。 一、人脸编辑的细分关键点 1、年龄 通过更改人脸的年龄属性,可用于模仿人…

攻不下dfs不参加比赛(七)

标题 为什么练dfs题目总结重点为什么练dfs 相信学过数据结构的朋友都知道dfs(深度优先搜索)是里面相当重要的一种搜索算法,可能直接说大家感受不到有条件的大家可以去看看一些算法比赛。这些比赛中每一届或多或少都会牵扯到dfs,可能提到dfs大家都知道但是我们为了避免眼高手…

AST之path常用属性和方法总结笔记

文章目录1. path常用属性总结1.1 path.node1.2 path.scope1.3 path.parentPath1.4 path.parent1.5 path.container1.6 path.type1.7 path.key2. path常用方法总结2.1 path.toString2.2 path.replaceWith2.3 path.replaceWithMultiple2.4 path.remove2.5 path.insertBefore2.6 p…

Android 蓝牙开发——HCI log 分析(二十)

HCI log 是用来分析蓝牙设备之间的交互行为是否符合预期,是否符合蓝牙规范。对于蓝牙开发者来说,通过 HCI log 可以帮助我们更好地分析问题,理解蓝牙协议。 一、抓取HCI log 1、手机抓取HCI log 在开发者选项中打开启用蓝牙HCI信息收集日志开关,Android系统就开始自动地收…

在中外合作办学硕士领域似乎自己一直在纠结,也许是为了能遇见人大女王金融硕士

2023考研成绩如期而至,还记得考试时的一幕幕吗?在身体被高热侵蚀的情况下,我们似乎很难忘记这次考试所带给我们的经历。如今成绩下来了,可能与我们预期的几乎相同,但是在不断地寻找新的学习途径的过程中我们发现&#…

驾驭云安全:2023年云安全展望

由于其的良好的可扩展性和优质的事件处理效率,云技术已成为现代企业的必备的管理技术之一,目前他已经成为所有行业及企业的热门选择。然而,攻击面积的增加以及不针对云技术衍生出来的多类攻击方式,使许多企业更容易受到威胁和数据…

分层测试(2)单元测试【必备】

1. 什么是单元测试? 对代码中的逻辑隔离的最小代码片段进行测试,验证其逻辑是否符合预期,单元可以是函数,方法,类,功能模块。 2. 单元测试的优点 掌握代码:单元测试允许开发人员了解单元提供…

软件测试之场景法

场景法 1. 概述 1.1 为什么使用场景法设计测试用例 大多数业务软件由后台管理(比如:用户管理、角色管理、权限管理等等各种管理)和工作流等几个部分组成。终端用户,期望软件能够实现业务需求,而不是简单的功能的组合…

2023湖北土建施工员证报考条件考试时间及报考流程 启程别

2023湖北土建施工员证报考条件考试时间及报考流程 启程别 土建施工员证是建设厅七大员中的施工员证的一种。分为土建、装饰装修、市政、设备安装。土建施工员证怎么报考等一系列相关问题启程别告诉你 施工员证报考条件 其实施工员证的报考条件没有那么复杂,基本上年…

智慧扫码点餐系统源码

智慧餐厅扫码点餐小程序系统源码 1. 开发语言:JAVA 2. 数据库:MySQL 3. 原生小程序 4. Saas 模式 5. 带调试部署视频 6、总后台管理端商家端门店端小程序用户端 智慧扫码点餐系统支持多店铺运营,单店铺运营以及连锁店铺运营。系统功能支…

numpy常用操作

文章目录1 numpy库2 数组对象 ndarray2.1 数组对象的创建2.1.1 利用array函数创建ndarray对象2.1.2 np.ones()和np.zeros()函数2.1.3 np.random.rand()函数2.1.4 np.arange()函数2.1.5 np.linspace()函数2.1.6 np.empty()函数2.2 ndarray对象常用属性2.3 ndarray常用操作2.3.1 …

IAP初探

IAP(In-Application Programming)在应用编程,浅显易懂,按照字面意思即是在程序不关闭情况下,对应用进行再次写入程序,对程序的写入需要传输数据,而传输数据的前提是通信, IAP对代码进行更新可以简要分为以…

为什么需要学习shell、shell的作用

课程基于B站于超课程笔记 03 Shebang的正确玩法_哔哩哔哩_bilibili P1 shell的作用 P2 shell执行命令的流程 P3 Shebang的正确玩法 什么是shell及组成 shell概念 shelll组成 Shebang概念 /bin/sh /bin/bash一样,都是指向一个bash解释器 [rootlocalhost ~]#…

医疗床头卡(WIFI方案)

一、产品特性 7.5寸墨水屏显示WIFI无线通信,极简部署,远程控制按键及高亮LED指示灯指示800*480点阵屏幕锂电池供电,支持USB充电DIY界面支持文本/条码/二维码/图片超低功耗/超长寿命,一次充电可用一年基于现有Wifi环境&#xff0c…