Redis学习【11】之分布式系统

news/2024/5/7 13:10:07/文章来源:https://blog.csdn.net/yang2330648064/article/details/129338531

文章目录

  • 一 数据分区算法
    • 1.1 顺序分区
      • 1.1.1 轮询分区算法
      • 1.1.2 时间片轮转分区算法
      • 1.1.3 数据块分区算法
      • 1.1.4 业务主题分区算法
    • 1.2 哈希分区
      • 1.2.1 节点取模分区算法
      • 1.2.2 一致性哈希分区算法
      • 1.2.3 虚拟槽分区算法
  • 二 分布式系统环境搭建与运行
    • 2.1 系统搭建
      • 2.1.1 系统架构
      • 2.1.2 删除持久化文件
      • 2.1.3 创建目录
      • 2.1.4 复制 2 个配置文件
      • 2.1.5 修改 redis.conf
      • 2.1.6 修改 redis6380.conf
      • 2.1.7 复制 5 个配置文件
      • 2.1.8 修改 5 个配置文件
    • 2.2 系统启动与关闭
      • 2.2.1 启动节点
      • 2.2.2 创建分布式系统
      • 2.2.3 测试系统
      • 2.2.4 关闭系统
  • 三 集群操作
    • 3.1 连接集群
    • 3.2 写入数据
      • 3.2.1 key 单个写入&批量操作
    • 3.3 集群查询
      • 3.3.1 查询 key 的 slot
      • 3.3.2 查询 slot 中 key 的数量
      • 3.3.3 查询 slot 中的 key
    • 3.4 故障转移
      • 3.4.1 故障转移
      • 3.4.2 全覆盖需求
  • 四 分布式系统的限制

  • Redis 分布式系统【Redis Cluster Redis 集群】是 Redis 3.0 开始推出的分布式解决方案。其可以很好地解决不同 Redis 节点存放不同数据,并将用户请求方便地路由到不同 Redis 的问题。

一 数据分区算法

  • 分布式数据库系统会根据不同的数据分区算法,将数据分散存储到不同的数据库服务器节点上,每个节点管理着整个数据集合中的一个子集。
    在这里插入图片描述

1.1 顺序分区

  • 顺序分区规则可以将数据按照某种顺序平均分配到不同的节点。不同的顺序方式,产生了不同的分区算法。
  • 如:轮询分区算法、时间片轮转分区算法、数据块分区算法、业务主题分区算法等

1.1.1 轮询分区算法

  • 每产生一个数据,就依次分配到不同的节点。该算法适合于数据问题不确定的场景。
  • 优点:在数据总量非常庞大的情况下,每个节点中数据是很平均的
  • 缺点:生产者与数据节点间的连接要长时间保持

1.1.2 时间片轮转分区算法

  • 在某固定长度的时间片内的数据都会分配到一个节点。时间片结束,再产生的数据就会被分配到下一个节点。这些节点会被依次轮转分配数据。
  • 优点:生产者与节点间的连接只需占用当前正在使用的,其它连接使用完毕后就立即释放。
  • 缺点:该算法可能会出现节点数据不平均的情况(因为每个时间片内产生的数据量可能是不同的)。

1.1.3 数据块分区算法

  • 在整体数据总量确定的情况下,根据各个节点的存储能力,可以将连接的某一整块数据分配到某一节点

1.1.4 业务主题分区算法

  • 数据可根据不同的业务主题,分配到不同的节点

1.2 哈希分区

  • 哈希分区规则是充分利用数据的哈希值来完成分配,对数据哈希值的不同使用方式产生了不同的哈希分区算法。

1.2.1 节点取模分区算法

  • 该算法的前提是,每个节点都已分配好了一个唯一序号,对于 NNN 个节点的分布式系统,其序号范围为[0,N−1][0, N-1][0,N1]。然后选取数据本身或可以代表数据特征的数据的一部分作为keykeykey,计算 hash(key)hash(key)hash(key)与节点数量NNN的模,该计算结果即为该数据的存储节点的序号。
  • 该算法最大的优点是简单,但缺点是其也存在较严重的不足。如果分布式系统扩容或缩容,已经存储过的数据需要根据新的节点数量NNN进行数据迁移,否则用户根据 key 是无法再找到原来的数据的。生产中扩容一般采用翻倍扩容方式,以减少扩容时数据迁移的比例。

1.2.2 一致性哈希分区算法

  • 一致性 hashhashhash 算法通过一个叫作一致性hashhashhash环的数据结构实现。这个环的起点是 000,终点是 232−12^32-12321,并且起点与终点重合。环中间的整数按逆/顺时针分布,故这个环的整数分布范围是[0,232−1][0, 2^32-1][0,2321]
    在这里插入图片描述
    在这里插入图片描述

  • 上图中存在四个对象 o1、o2、o3、o4o1、o2、o3、o4o1o2o3o4,分别代表四个待分配的数据,红色方块是这四个数据的 hash(o)hash(o)hash(o)在 Hash 环中的落点。同时,图上还存在三个节点 m0、m1、m2m_0、m_1、m_2m0m1m2的主机结点,绿色圆圈是这三节点的 hash(m)hash(m)hash(m)在 Hash 环中的落点。

  • 现在要为数据分配其要存储的节点。该数据对象的 hash(o) 按照逆/顺时针方向距离哪个节点的 hash(m)最近,就将该数据存储在哪个节点。这样就会形成上图所示的分配结果。

  • 该算法的优点是:节点的扩容与缩容,仅对按照逆/顺时针方向距离该节点最近的节点有影响,对其它节点无影响。

    • 如下图:在原来的基础上添加m3m_3m3的主机结点,对o3o_3o3的数据进行迁移
      在这里插入图片描述
  • 当节点数量较少时,容易形成数据倾斜问题,且节点变化影响的节点数量占比较大,即影响的数据量较大。所以该方式不适合数据节点较少的场景。
    在这里插入图片描述

1.2.3 虚拟槽分区算法

  • 该算法首先虚拟出一个固定数量的整数集合,该集合中的每个整数称为一个 slot 槽。这个槽的数量一般是远远大于节点数量的,然后再将所有 slot 槽平均映射到各个节点之上。Redis 分布式系统中共虚拟了 163841638416384 个 slot 槽,其范围为[0,16383][0, 16383][0,16383]
  • 例如,假设共有 3 个节点,那么 slot 槽与节点间的映射关系如下图所示:
    在这里插入图片描述
  • 而数据只与 slot 槽有关系,与节点没有直接关系。数据只通过其 key 的 hash(key)映射到slot 槽:slot=hash(key)%slotNumsslot=hash(key) \% slotNumsslot=hash(key)%slotNums。该算法的一个优点,解耦了数据与节点,客户端无需维护节点,只需维护与 slot 槽的关系即可。
  • Redis 数据分区采用的就是该算法。其计算槽点的公式为:slot=CRC16(key)%16384slot = CRC16(key) \% 16384slot=CRC16(key)%16384CRC16()CRC16()CRC16()是一种带有校验功能的、具有良好分散功能的、特殊的 hash 算法函数。
  • 其实 Redis中计算槽点的公式不是上面的那个,而是:KaTeX parse error: Expected 'EOF', got '&' at position 19: …t = CRC16(key) &̲16383。若要计算 a%ba\%ba%b,如果 b 是 2 的整数次幂,那么 KaTeX parse error: Expected 'EOF', got '&' at position 12: a \% b = a &̲ (b-1)

二 分布式系统环境搭建与运行

2.1 系统搭建

  • 这部分的内容,作者主要讲解操作和原理,所以对代码及操作的的实际操作结果展示内容会减少,但主要的步骤还是会保留下来!

2.1.1 系统架构

  • 要搭建的 Redis 分布式系统由 6 个节点构成,这 6 个节点的地址及角色分别如下表所示。一个 master 配备一个 slave,master 与 slave 的配对关系,在系统搭建成功后会自动分配。
    在这里插入图片描述

2.1.2 删除持久化文件

  • 先将之前“Redis 主从集群”中在 Redis 安装目录下生成的 RDB 持久化文件 dump638*.confAOF 持久化文件删除。因为 Redis 分布式系统要求创建在一个空的数据库之上。注意,AOF持久化文件全部在 appendonlydir 目录中。
# 在目录redis下操作
rm -rf dump638*.rdb appendonlydir

2.1.3 创建目录

  • 在 Redis 安装目录中 mkdir 一个新的目录 cluster-dis,用作分布式系统的工作目录。
# 在目录redis下操作
mkdir cluster-dis

2.1.4 复制 2 个配置文件

  • 将 cluster 目录中的 redis.conf redis6380.conf 文件复制到 cluster-dis 目录
# 在cluster-dis的操作命令
cp ../cluster/redisconf ./
cp ../cluster/redis6380.conf ./

2.1.5 修改 redis.conf

  • 对于 redis.conf 配置文件,主要涉及到以下三个四个属性:
  1. dir
    在这里插入图片描述
    • 指定工作目录为前面创建的 cluster-dis 目录。持久化文件、节点配置文件将来都会在工作目录中自动生成。
  2. cluster-enabled
    在这里插入图片描述
    • 该属性用于开启 Redis 的集群模式
  3. cluster-config-file
    在这里插入图片描述
    • 该属性用于指定“集群节点”的配置文件。该文件会在第一次节点启动时自动生成,其生成的路径是在 dir 属性指定的工作目录中。在集群节点信息发生变化后(如节点下线、故障转移等),节点会自动将集群状态信息保存到该配置文件中。
  4. cluster-node-timeout
    在这里插入图片描述
    • 用于指定“集群节点”间通信的超时时间阈值,单位毫秒

2.1.6 修改 redis6380.conf

include redis.conf
pidfile /var/run/redis_6380.pid
port 6380
dbfilename dump6380.rdb
appendfilename appendonly6380.aof
replica-priority 90
cluster-config-file nodes-6380.conf

2.1.7 复制 5 个配置文件

  • 使用 redis6380.conf 复制出 5 个配置文件 redis6381.conf、redis6382.conf、redis6383.conf、redis6384.conf、redis6385.conf
cp redis6380.conf redis6381.conf
cp redis6380.conf redis6382.conf
cp redis6380.conf redis6383.conf
cp redis6380.conf redis6384.conf
cp redis6380.conf redis6385.conf

2.1.8 修改 5 个配置文件

  • 修改 5 个配置文件 redis6381.conf、redis6382.conf、redis6383.conf、redis6384.conf、redis6385.conf 的内容,将其中所有涉及的端口号全部替换为当前文件名称中的端口号。

2.2 系统启动与关闭

2.2.1 启动节点

  • 第一种方式:手动启动
    • 启动所有 Redis 节点
    redis-server redis6380.conf
    redis-server redis6381.conf
    redis-server redis6382.conf
    redis-server redis6383.conf
    redis-server redis6384.conf
    redis-server redis6385.conf
    
  • 第二种:编写脚本文件启动【该方法在伪集群中使用方便,真实生产环境不适用】
    1. 在cluster-dis中,创建文件start-redis-cluster.sh
    vim start-redis-cluster.sh
    
      2. 编写内容如下
    
    #!/bin/bash
    rm -rf dump638*.rdb
    rm -rf appendonlydir
    rm -rf nodes-638*.conf
    redis-server redis6380.conf
    redis-server redis6381.conf
    redis-server redis6382.conf
    redis-server redis6383.conf
    redis-server redis6384.conf
    redis-server redis6385.conf
    
    1. 修改文件的权限
    chmod 755 start-redis-cluster.sh
    
    1. 运行文件
    ./start-redis-cluster.sh
    

2.2.2 创建分布式系统

  • 6 个节点启动后,它们仍是 6 个独立的 Redis,通过 redis-cli --cluster create 命令可将 6个节点创建了一个分布式系统。
    在这里插入图片描述
  • 该命令用于将指定的 6 个节点连接为一个分布式系统。--cluster replicas 1 指定每个master 会带有一个 slave 作为副本。
    在这里插入图片描述
  • 输入 yes 后回车,系统就会将以上显示的动态配置信息真正的应用到节点上,然后就可可看到如下日志
    在这里插入图片描述

2.2.3 测试系统

  • 通过 cluster nodes 命令可以查看到系统中各节点的关系及连接情况。能看到每个节点给出 connected,就说明分布式系统已经成功搭建。
redis-cli -c -p 6380 cluster nodes
  • 对于客户端连接命令 redis-cli,需要注意两点:
    • redis-cli 带有-c 参数,表示这是要连接一个“集群”,而非是一个节点。
    • 端口号可以使用 6 个中的任意一个。

2.2.4 关闭系统

  • 对于分布式系统的关闭,只需将各个节点 shutdown 即可
  • 方法一:手动关闭
redis-cli -p 6380 shutdown
redis-cli -p 6381 shutdown
redis-cli -p 6382 shutdown
redis-cli -p 6383 shutdown
redis-cli -p 6384 shutdown
redis-cli -p 6385 shutdown
  • 方法二:配置文件关闭
    1. 创建执行文件shutdown-redis-cluster.sh
    2. 编写一下内容
    #!/bin/bash
    redis-cli -p 6380 shutdown
    redis-cli -p 6381 shutdown
    redis-cli -p 6382 shutdown
    redis-cli -p 6383 shutdown
    redis-cli -p 6384 shutdown
    redis-cli -p 6385 shutdown
    # 查看关闭的效果指令
    ps aux|grep redis
    
    1. 修改文件权限
    chmode 755 shutdown-redis-cluster.sh
    

三 集群操作

3.1 连接集群

  • 与之前单机连接相比的唯一区别就是增加了参数-c。
    redis-cli -c -p 6380
    

3.2 写入数据

3.2.1 key 单个写入&批量操作

  • 无论 value 类型为 String 还是 List、Set 等集合类型,只要写入时操作的是一个 key,那么在分布式系统中就没有问题。
  • 对一次写入多个 key 的操作,由于多个 key 会计算出多个 slot,多个 slot 可能会对应多个节点。而由于一次只能写入一个节点,所以该操作会报错。系统提供了一种对批量 key 的操作方案,为这些 key 指定一个统一的 group,让这个 group 作为计算 slot 的唯一值。
    • 如:
    mset name{emp} ming game{emp} kissking 
    

3.3 集群查询

3.3.1 查询 key 的 slot

  • 通过 cluster keyslot 可以查询指定 key 的slot
    cluster keyslot xxx
    

3.3.2 查询 slot 中 key 的数量

  • 通过cluster countkeysinslot命令可以查看到指定slot所包含的 key 的个数
cluster countkeysinslot xxx

3.3.3 查询 slot 中的 key

  • 通过 cluster getkeysinslot 命令可以查看到指定 slot 所包含的 key
cluster getkeysinslot xxx num

3.4 故障转移

3.4.1 故障转移

  • 分布式系统中的某个master如果出现宕机,那么其相应的 slave 就会自动晋升为 master。如果原 master 又重新启动了,那么原 master 会自动变为新 masterslave

3.4.2 全覆盖需求

  • 如果某 slot 范围对应节点的 master 与 slave 全部宕机,那么整个分布式系统是否还可以对外提供读服务,就取决于属性 cluster-require-full-coverage 的设置。
    在这里插入图片描述
  • 该属性有两种取值:
    • yes:默认值。要求所有 slot 节点必须全覆盖的情况下系统才能运行。
    • no:slot 节点不全的情况下系统也可以提供查询服务。

四 分布式系统的限制

  • Redis 的分布式系统存在一些使用限制:
    • 仅支持 0 号数据库
    • 批量 key 操作支持有限:需要指定GROUP不能跨槽存放
    • 分区仅限于 key:即使VALUE是集合,也不能存放到不同的机器上。
    • 事务支持有限:在一个主机上有作用,槽点分到不同主机上不起作用。
    • 不支持分级管理:不支持分极管理,只有 masterslave

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_77610.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 349. 两个数组的交集和 692. 前K个高频单词

两个数组的交集 难度 简单 题目链接 这道题的难度不大,我们可以把数组里的数据存到set里面。这样就完成了排序和去重,然后我们再把一个set里面的数据和另外一个set数据进行比较。如果相同就插入到数组里。 代码如下: 但是这个算法的时间复…

【教学典型案例】14.课程推送页面整理-增加定时功能

目录一:背景介绍1、代码可读性差,结构混乱2、逻辑边界不清晰,封装意识缺乏![在这里插入图片描述](https://img-blog.csdnimg.cn/bbfc5f04902541db993944ced6b62793.png)3、展示效果不美观二:案例问题分析以及解决过程1、代码可读性…

数学建模(一):LP 问题

文章目录数学建模(一):LP 问题一、 MATLAB求解二、 Python 求解数学建模(一):LP 问题 在人们的生产实践中,经常会遇到如何利用现有资源来安排生产,以取得最大经济效益的问题。此类问…

IP 地址的简介

IP 地址 Internet 依靠 TCP/IP 协议,在全球范围内实现不同硬件结构、不同操作系统、不同网络系统的主机之间的互联。在 Internet 上,每一个节点都依靠唯一的 IP 地址相互区分和相互联系,IP 地址用于标识互联网中的每台主机的身份&#xff0c…

IDEA这些配置,简单高效

优化导包配置配置路径:File-> settings -> Editor -> General -> Auto ImportAdd unambiguous imports on the fly:自动导包Optimize imports on th fly (for current project):自动删除无用包代码提示取消大小写配置路径&#x…

UML2——行为图

目录 一、前言 二、活动图 三、交互图 3.1 一般序列图 3.2 时间约束序列图 3.3 协作图 四、用例图 五、状态图 一、前言 UML 是由视图(View)、图(Diagrams)、模型元素(Model elements)和通用机制等几…

Python GUI界面编程-初识

图形用户界面(Graphical User Interface,简称 GUI,又称图形用户接口)是指采用图形方式显示的计算机操作用户界面。与早期计算机使用的命令行界面相比,图形界面对于用户来说在视觉上更易于接受。然而这界面若要通过在显示屏的特定位置&#xf…

mac M1 nvm安装教程,避坑

mac M1 nvm 安装问题 新款的mac搭载了苹果自研的芯片,放弃了intel的x86芯片,那之前的软件难免会存在兼容性问题。 鄙人有幸踩了第一个坑。 在通过nvm 安装不同版本的node 时,出现了问题。 问题一:先说一下 nvm的安装问题&#…

现代操作系统——Linux架构与学习

小白的疑惑 在我决定从事嵌入式(应用层)方面的工作时,我查询了大量资料该如何学习,几乎所有观点不约而同的都指向了学习好Linux,大部分工作都是在Linux环境下来进行工作的。于是我雄心勃勃的去下载Linux,可…

GEE开发之ERA5(气温、降水、压力、风速等)数据获取和分析

GEE开发之ERA5(气温、降水、压力、风速等)数据获取和分析1.ERA5介绍2.初始ERA5数据2.1 DAILY代码2.2 MONTHLY代码3.遥感影像查看(DAILY之mean_2m_air_temperature)4.逐日数据分析和获取(以mean_2m_air_temperature为例)5.逐月数据…

[神经网络]Swin Transformer网络

一、概述 Swin Transformer是一个用了移动窗口的层级式Vision Transformer。 在图像领域,Transformer需要解决如下两个问题: ①尺度问题:同一语义的物体在图像中有不一样的尺度。(大小不同) ②Resolution过大:若以像素点作为单位&…

呼吸机方案 以 MM32F3270 为主控板,MM32SPIN05PF 为电机控制主控

呼吸机的作用是让氧气进入肺部并排出二氧化碳,帮助病患顺利呼吸。呼吸机连接一条管子到患者的嘴或鼻子,氧气量可以通过监视器加以控制。 基于灵动微控制器的呼吸机,以 MM32F3270 为主控板,MM32SPIN05PF 为电机控制主控&#xff1…

python 操作word库docx 增强接口

前言用python 的docx 库操作word完成一些自动化的文档生成工作,但有时候会遇到docx库提供的操作无法直接满足业务上的需求,需要对其进行一些扩展。接口完善实现在指定的文字后面插入指定的文字任务:以下示例需要在文档中的所有 "人生苦短…

【SpringMVC】springMVC介绍

参考资料 视频资料 03_尚硅谷_SpringMVC_SpringMVC简介_哔哩哔哩_bilibili 笔记资料 第一节 SpringMVC概述 (wolai.com)链接:https://pan.baidu.com/s/1A7BX2TNfbGTpYene4x3Mew 提取码:a8d5 一、SpringMVC简介 1、什么是MVC MVC是一种软件架构的思…

js正则表达式以及元字符

0、常用的正则表达式规则 手机号 const reg /^1([38][0-9]|4[579]|5[0-3,5-9]|6[6]|7[0135678]|9[89])\d{8}$/;密码 const reg /^[a-zA-Z0-9]{6,20}$/;验证码 const reg /^\d{6}$/;1、正则表达式的介绍与使用 正则表达式(Regular Expression)是用于匹配字符串中字符组合…

用Python Flask为女朋友做一个简单的网站(附可运行的源码)

🌟所属专栏:献给榕榕🐔作者简介:rchjr——五带信管菜只因一枚😮前言:该专栏系为女友准备的,里面会不定时发一些讨好她的技术作品,感兴趣的小伙伴可以关注一下~👉文章简介…

docker安装即docker连接mysql(window)

一 安装docker 1.什么是docker Docker容器与虚拟机类似,但二者在原理上不同。容器是将操作系统层虚拟化,虚拟机则是虚拟化硬件,因此容器更具有便携性、高效地利用服务器。 2.WSL2 WSL,即Windows Subsystem on Linux,中…

【CV学习笔记】之ncnnFastDet多线程c++部署

1、前言 ncnn是一款非常高效易用的深度学习推理框架,支持各种神经网络模型,如pytorch、tensorflow、onnx等,以及多种硬件后端,如x86、arm、riscv、mips、vulkan等。 ncnn项目地址:https://github.com/Tencent/ncnn FastDet是设计…

RK3568触摸屏驱动调试总结

硬件电路分析 RK3568 CPU通过I2C与触控板外设wdt87xx连接。 首先要根据电路图获取如下I2C的信息: 项目Value接在哪个I2Ci2c1I2C 寄存器地址0x2cHID 地址0x20中断B5 1、接在哪个I2C 如图,1接在I2C1: 2、使用哪个GPIO引脚接收触控板的中断 如图&#xf…

Buuctf Younger-drive 题解

目录 一.查壳 二.运行缺少dll 三.主函数 四.hObject线程 五.Thread线程 六.judge函数 七.解题脚本 这题的关键在于了解一定的线程相关知识 一.查壳 32位带壳,用upx脱壳 二.运行缺少dll 后续尝试了各种方法修复dll但是还是运行不了 值得一提的是脱壳后的程序不能动态调试…