【Distributed】分布式Ceph存储系统

news/2024/4/29 11:26:02/文章来源:https://blog.csdn.net/datangda/article/details/131730053

文章目录

  • 一、存储基础
    • 1. 单机存储设备
      • 1.1 DAS
      • 1.2 NAS
      • 1.3 SAN
      • 1.4 单机存储的问题
      • 1.5 商业存储解决方案
    • 2. 分布式存储(软件定义的存储 SDS )
      • 分布式存储的类型
    • 3. Ceph 简介
    • 4. Ceph 优势
    • 5. Ceph 架构
    • 6. Ceph 核心组件
    • 7. OSD 存储后端
      • 7.1 Filestore
      • 7.2 Bluestore
    • 8. Ceph 数据的存储过程
    • 9. Ceph 版本发行生命周期
    • 10. Ceph 集群部署
  • 二、基于 ceph-deploy 部署 Ceph 集群
    • 1. Ceph 生产环境推荐
    • 2. Ceph 环境规划
    • 3. Ceph 部署过程
      • 3.1 环境准备
      • 3.2 部署 Ceph 集群
        • 在所有节点部署
        • 在 admin 节点上安装
        • 在 node 节点上部署
        • 生成初始配置
        • 在 admin 节点初始化 mon 节点
        • 部署能够管理 Ceph 集群的节点(可选)
        • 部署 osd 存储节点
        • 在 admin 节点上部署 mgr 节点
        • 开启监控模块
      • 3.3 资源池 Pool 管理
  • 总结
    • 1. 数据存储类型
    • 2. Cpeh 的概念、架构
    • 3. Ceph 的组件


一、存储基础

1. 单机存储设备

  单机存储设备大致分为三类,分别是DAS、NAS、SAN。

1.1 DAS

  DAS (直接附加存储,是直接接到计算机的主板总线上去的存储)

  例如 IDE、SATA、SCSI、SAS、USB 接口的磁盘。所谓接口就是一种存储设备驱动下的磁盘设备,提供块级别的存储。

1.2 NAS

  NAS (网络附在存储,是通过网络附加到当前主机文件系统之上的存储)

    例如 NFS、CIFS、FTP。文件系统级别的存储,本身就是一个做好的文件系统,通过nfs接口在用户空间输出后,客户端基于内核模块与远程主机进行网络通信,把它转为好像本地文件系统一样来快用,这种存储服务是没办法对它再一次格式化创建文件系统块的。

1.3 SAN

  SAN(存储区域网络)

  例如 SCSI协议(只是用来传输数据的存取操作,物理层使用SCSI线缆来传输)、FCSAN(物理层使用光纤来传输)、iSCSI(物理层使用以太网来传输)。SAN也是一种网络存储,但不同之处在于 SAN 提供给客户端主机使用的接口是块级别的存储。

1.4 单机存储的问题

  • 存储处理能力不足

  传统的 IDE 的 IO 值是100次/秒,SATA 固态磁盘500次/秒,固态硬盘达到2000~4000次/秒。即使磁盘的 IO能力再大数十倍,也不妨抗住网站访向高峰期数十万、数百万甚至上亿用户的同时访问,这同时还要受到主机网络IO 能力的限制。

  • 存储空间能力不足

  单块磁盘的容量再大,也无法满足用户的正常访问所需的数据容量限制。

  • 单点问题

  单机存储数据存在单点故障问题。

1.5 商业存储解决方案

  EMC、NetAPP、IBM、DELL、华为、浪潮

2. 分布式存储(软件定义的存储 SDS )

  常见的分布式存储:Ceph、TFS、FastDFS、MooseFs (MFS) 、HDFS、GlusterFS(GFS)。存储机制会把数据分散存储到多个节点上,具有高扩展性、高性能、高可用性等优点。

对比说明/文件系统TFSFastDFSMogileFSMooseFSGlusterFSCeph
开发语言C++CPerlCCC++
开源协议GPL V2GPL V3GPLGPL V3GPL V3LGPL
数据存储方式文件/Trunk文件文件/块对象/文件/块
集群节点通信协议私有协议(TCP)私有协议(TCP)HTTP私有协议(TCP)私有协议(TCP)/RDAM(远程直接访问内存)私有协议(TCP)
专用元数据存储点占用NS占用DB占用MFS占用MDS
在线扩容支持支持支持支持支持支持
冗余备份支持支持-支持支持支持

分布式存储的类型

  块存储(例如硬盘,一般是一个存储被一个服务器挂载使用,适用于容器或虚拟机存储卷分配、日志存储、文件存储)就是一个裸设备,用于提供没有被组织过的存储空间,底层以分块的方式来存储数据。

  文件存储(例如NFS,解决块存储无法共享问题,可以一个存储被多个服务器同时挂载,适用于目录结构的存储、日志存储)是一种数据的组织存放接口,一般是建立在块级别的存储结构之上,以文件形式来存储数据,而文件的元数据和实际数据是分开存储的

  对象存储(例如OSS,一个存储可以被多服务同时访问,具备块存储的高速读写能力,也具备文件存储共享的特性,适用图片存储、视频存储)基于API接口提供的文件存储,每一个文件都是一个对象,且文件大小各不相同的,文件的元数据和实际数据是存放在一起的。

  总结:块存储只能一对一,以分块形式存储;文件存储可以一对多,建立在块存储之上,以文件形式存储;对象存储可以一对多,通过应用API接口进行访问。

3. Ceph 简介

  Ceph使用c++语言开发,是一个开放、自我修复和自我管理的开源分布式存储系统。具有高扩展性、高性能、高可靠性的优点。

  Ceph目前已得到众多云计算厂商的支持并被广泛应用。RedFlat 及 OpenStack,Kubernetes 都可与Cegh整合以支持虚拟机镜像的后端存储。

  粗略估计,我国70%~80%的云平台都将Ceph作为底层的存储平台,由此可见Ceph俨然成为了开源云平台的标配。目前国内使用Ceph搭建分布式存储系统较为成功的企业有华为、阿里、中兴、华三、浪潮、中国移动、网易、乐视、360、星辰天合存储、杉岩数据等。

4. Ceph 优势

  • 高扩展性::去中心化,支持使用普通X86服务器,支持上千个存储节点的规模,支持TB到EB级的扩展。
  • 高可靠性:没有单点故障,多数据副本,自动管理,自动修复。
  • 高性能:摒弃了传统的集中式存储元数据寻址的方案,采用 CRUSH 算法,数据分布均衡,并行度高。
  • 功能强大:Ceph是个大一统的存储系统,集块存储接口(RBD)、文件存储接口(CephFS)、对象存储接口(RadosGW)于一身,因而适用于同的应用场景。

5. Ceph 架构

自下向上,可以将Ceph系统分为四个层次:

RADOS基础存储系统(Reliable,Autonomic,Distributed object store,即可靠的、自动化的、分布式的对象存储)

  RADOS是Ceph最底层的功能模块,是一个无限可扩容的对象存储服务,能将文件拆解成无数个对象(碎片)存放在硬盘中,大大提高了数据的稳定性。它主要的OSD和Monitor两个组件组成OSD和Monitor都可以部署在多台服务器中,这就是Ceph分布式的由来,高扩展性的由来。

LIBRADOS基础库

  LIBRADOS提供了与RADOS进行交互的方式,并向上层应用提供Ceph服务的AT接口,因此上层的RBD、RGW和CephFS都是通过Librados访问的,目前提供PHP 、Ruby、Java、Python、Go、C和C++支持,以便直接基于RADOS(而不是整个Ceph)进行客户端应用开发。

高层应用接口:包括了三个部分

  (1)对象存储接口RGW(RADOS Gateway )

     网关接口,基于Librados开发的对象存储系统,提供S3和Swift兼容的RESTful API接口。

  (2)块存储接口RBD (Reliable Block Device)

      基于Librados提供块设备接口,主要用于Host/ VM。

  (3)文件存储接口 CephFS ( Ceph File System)

     Ceph文件系统,提供了一个符合POSIX标准的文件系统,它使用Ceph存储集群在文件系统上存储用户数据。基于Librados提供的分布式文件系统接口。

应用层

  基于高层接口或者基础库Librados开发出来的各种APP,或者Host、VM等诸多客户端。

在这里插入图片描述

6. Ceph 核心组件

  Ceph 是一个对象式存储系统,它把每一个待管理的数据流(如文件等数据)切分为一到多个固定大小(默认4兆)的对象数据(Object),并以其为原子单元(原子是构成元素的最小单元)完成数据的读写。

OSD (Object Storage Daemon,守护进程 ceph-osd)

  是负责物理存储的进程,一般配置成和磁盘一一对应,一块磁盘启动一个OSD进程。主要功能是存储数据、复制数据、平衡数据、恢复数据,以及与其它OSD间进行心跳检查,负责响应客户端请求返回具体数据的进程等。通常至少需要3个OSD来实现冗余和高可用性。

PG( Placement Group归置组)

  PG是一个虚拟的概念而已,物理上不真实存在。它在数据寻址时类似于数据库中的索引:Ceph先将每个对象数据通过HASH算法固定映射到一个 PG 中,然后将 PG 通过CRUSH算法映射到 OSD。

Pool

  Pool是存储对象的逻辑分区,它起到 namespace 的作用。每个 Pool 包含一定数量(可配置)的 PG。Pool可以做故障隔离域,根据不同的用户场景不统一进行隔离。

  Pool中数据保存方式支持两种类型:

   (1)多副本(replicated):类似 raid1,一个对象数据默认保存3个副本,放在不同的 OSD;

   (2)纠删码(Brasure Code):类似 raid5,对 CPU 消耗稍大,但是节约磁盘空间,对象数据保存只有1个副本。由于Ceph 部分功能不支持纠删码池,此类型存储池使用不多。

  Pool、 PG 和 OSD的关系:

     一个Pool里有很多个PG;一个PG里包含一堆对象,一个对象只能属于一个PG;PG有主从之分,一个PG分布在不同的OSD上(针对多副本类型)。

Monitor (守护进程 ceph-mon )

  用来保存OSD的元数据。负责维护集群状态的映射视图(Cluster Map:OSD Map、Monitor Map、PG Nap和 CRUSH Map),维护展示集群状态的各种图表,管理集群客户端认证与授权。一个Ceph集群通常至少需要 3 或 5 个(奇数个) Monitor 节点才能实现冗余和高可用性,它们通过Paxos 协议实现节点间的同步数据。

Manager(守护进程 ceph-mgr )

  负责跟踪运行时指标和 Ceph 集群的当前状态,包括存储利用率、当前性能指标和系统负载。为外部监视和管理系统提供额外的监视和接口,例如 zabbix、 prometheus、cephmetrics 等。一个 ceph 集群通常至少需要 2 个 mgr 节点实现高可用性,基于 raft 协议实现节点间的信息同步。

MDS (Metadata server,守护进程 ceph-mds )

  是 CephES 服务依赖的元数据服务。负责保存文件系统的元数据,管理目录结构。对象存储和块设备存储不需要元数据服务;如果不使用 CepFS 可以不安装。

7. OSD 存储后端

  OSD 有两种方式管理它们存储的数据。在 Luminous 12.2.z 及以后的发行版中,默认(也是推荐的)后端是 BlueStore。在 Luminous 发布之前, 默认是 FileStore, 也是唯一的选项。

7.1 Filestore

  FileStore是在Ceph中存储对象的一个遗留方法。它依赖于一个标准文件系统(只能是XFS),并结合一个键/值数据库(传统上是LevelDB,现在BlueStore是RocksDB),用于保存和管理元数据。

  FileStore经过了良好的测试,在生产中得到了广泛的应用。然而,由于它的总体设计和对传统文件系统的依赖,使得它在性能上存在许多不足。

7.2 Bluestore

  从 Ceph 12.2.0 (Luminous)版本开始的。在 Luminous版本中,BlueStore 被引入作为一种新的
高性能的 OSD 存储引擎,以替代旧的 Filestore 引擎。

  在 Ceph 中, BlueStore 可以提供更快的响应时间和更高的数据吞吐量,同时也具有更好的可靠性和稳定性。相比之下,旧的 FileStore 存储引擎通常需要更多的CPU和内存资源,对 IO 延迟的敏感度也较高。

  FileStore 将对象存储为块设备基础上的文件系统(通常是 XFS)中的文件。

  Elustore将对象直接存储在原始块设备上,免除了对文件系统层的需要,提高了读写操作速度,通过直接操作底层块设备来管理数据,而不是传统的文件系统。

  这种方法提供了更好的性能和可靠性,因为可以将数据划分为较小的块并使用校验和来检测错误。此外,BlueStore可以直接与Solid State Drive(SSD)交互,并利用其快速读写速度。

  BlueStore还具有可扩展性,可以处理数百万个物理盘和千亿个对象。它实现了动态负载平衡和自动恢复机制,以确保高可用性和数据可靠性。

8. Ceph 数据的存储过程

  • 客户端从 mon 获取最新的 Cluster Map。

  • 在 Ceph 中,一切皆对象。Ceph 存储的数据都会被切分成为一到多个固定大小的对象(Object)。Object size 大小可以由管理员调整,通常为 2M 或 4M。

  每个对象都会有一个唯一的 OID,由 ino (即是文件的 FileID,用于在全局唯一标识每一个文件)与 ono(则是分片的编号) 组成。比如:一个文件 FileID 为 A,它被切成了两个对象,一个对象编号0,另一个编号1,那么这两个文件的 oid 则为 A0 与 A1。

  OID 的好处是可以唯一标示每个不同的对象,并且存储了对象与文件的从属关系。由于 Ceph 的所有数据都虚拟成了整齐划一的对象,所以在读写时效率都会比较高。

  • 通过对 OID 使用 HASH 算法得到一个16进制的特征码,用特征码与 Pool 中的 PG 总数取余,得到的序号则是 PGID 。即 Pool_ID + HASH(OID) % PG_NUM 得到 PGID。
  • PG 会根据设置的副本数量进行复制,通过对 PGID 使用 CRUSH 算法算出 PG 中目标主和次 OSD 的 ID,存储到不同的 OSD 节点上(其实是把 PG 中的所有对象存储到 OSD 上)。即通过 CRUSH(PGID) 得到将 PG 中的数据存储到各个 OSD 组中。

  CRUSH 是 Ceph 使用的数据分布算法,类似一致性哈希,让数据分配到预期的地方。

  总结:先将文件切边成数据对象(默认大小为4M),然后对oid使用hash算法得到一个数值再除以PG总数取余得到数据对象的pgid,接着对pgid使用CRUSH算法得到PG对应的OSD的ID(如果有多副本则是主从的OSD的ID),最后将数据对象存储到对应的OSD上。

9. Ceph 版本发行生命周期

  Ceph从Nautilus版本(14.2.0)开始,每年都会有一个新的稳定版发行,预计是每年的3月份发布,每年的新版本都会起一个新的名称(例如,“Mimic”)和一个主版本号(例如,13代表Mimic,因为“M”是字母表的第13个字母)。

  版本号的格式为 x.y.z,x 表示发布周期(例如,13 代表 Mimic,17 代表 Quincy),y 表示发布版本类型,即

  • x.0.z :y等于 0,表示开发版本;
  • x.1.z :y等于 1,表示发布候选版本(用于测试集群);
  • x.2.z :y等于 2,表示稳定/错误修复版本(针对用户)。

10. Ceph 集群部署

  目前 Ceph 官方提供很多种部署 Ceph 集群的方法,常用的分别是 ceph-deploy,cephadm 和 二进制:

  • ceph-deploy :一个集群自动化部署工具,使用较久,成熟稳定,被很多自动化工具所集成,可用于生产部署。

  • cephadm :从 Octopus 和较新的版本版本后使用 cephadm 来部署 ceph 集群,使用容器和 systemd 安装和管理 Ceph 集群。目前不建议用于生产环境。

  • 二进制:手动部署,一步步部署 Ceph 集群,支持较多定制化和了解部署细节,安装难度较大。

二、基于 ceph-deploy 部署 Ceph 集群

1. Ceph 生产环境推荐

1、存储集群全采用万兆网络
2、集群网络(cluster-network,用于集群内部通讯)与公共网络(public-network,用于外部访问Ceph集群)分离
3、mon、mds 与 osd 分离部署在不同主机上(测试环境中可以让一台主机节点运行多个组件)
4、OSD 使用 SATA 亦可
5、根据容量规划集群
6、至强E5 2620 V3或以上 CPU,64GB或更高内存
7、集群主机分散部署,避免机柜的电源或者网络故障

2. Ceph 环境规划

主机名Public网络Cluster网络角色
admin192.168.145.15admin(管理节点负责集群整体部署)、client
node01192.168.145.30192.168.100.11mon、mgr、osd(/dev/sdb、/dev/sdc、/dev/sdd)
node02192.168.145.45192.168.100.12mon、mgr、osd(/dev/sdb、/dev/sdc、/dev/sdd)
node03192.168.145.60192.168.100.13mon、osd(/dev/sdb、/dev/sdc、/dev/sdd)
client192.168.145.75client

3. Ceph 部署过程

3.1 环境准备

#可选步骤:创建 Ceph 的管理用户
useradd cephadm
passwd cephadmvisudo
cephadm ALL=(root) NOPASSWD:ALL
#关闭 selinux 与防火墙
systemctl disable --now firewalld
setenforce 0
sed -i 's/enforcing/disabled/' /etc/selinux/config

在这里插入图片描述

#根据规划设置主机名
hostnamectl set-hostname admin
hostnamectl set-hostname node01
hostnamectl set-hostname node02
hostnamectl set-hostname node03
hostnamectl set-hostname client

在这里插入图片描述

#配置 hosts 解析
cat >> /etc/hosts << EOF
192.168.145.15 admin
192.168.145.30 node01
192.168.145.45 node02
192.168.145.60 node03
192.168.145.75 client
EOF

在这里插入图片描述

#在 node节点 安装常用软件和依赖包
yum -y install epel-release
yum -y install yum-plugin-priorities yum-utils ntpdate python-setuptools python-pip gcc gcc-c++ autoconf libjpeg libjpeg-devel libpng libpng-devel freetype freetype-devel libxml2 libxml2-devel zlib zlib-devel glibc glibc-devel glib2 glib2-devel bzip2 bzip2-devel zip unzip ncurses ncurses-devel curl curl-devel e2fsprogs e2fsprogs-devel krb5-devel libidn libidn-devsel openssl openssh openssl-devel nss_ldap openldap openldap-devel openldap-clients openldap-servers libxslt-devel libevent-devel ntp libtool-ltdl bison libtool vim-enhanced python wget lsof iptraf strace lrzsz kernel-devel kernel-headers pam-devel tcl tk cmake ncurses-devel bison setuptool popt-devel net-snmp screen perl-devel pcre-devel net-snmp screen tcpdump rsync sysstat man iptables sudo libconfig git bind-utils tmux elinks numactl iftop bwm-ng net-tools expect snappy leveldb gdisk python-argparse gperftools-libs conntrack ipset jq libseccomp socat chrony sshpass

在这里插入图片描述

#在 admin 管理节点配置 ssh 免密登录所有节点
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
sshpass -p '123' ssh-copy-id -o StrictHostKeyChecking=no root@admin
sshpass -p '123' ssh-copy-id -o StrictHostKeyChecking=no root@node01
sshpass -p '123' ssh-copy-id -o StrictHostKeyChecking=no root@node02
sshpass -p '123' ssh-copy-id -o StrictHostKeyChecking=no root@node03

在这里插入图片描述

#配置时间同步
systemctl enable --now chronyd
timedatectl set-ntp true					#开启 NTP
timedatectl set-timezone Asia/Shanghai		#设置时区
chronyc -a makestep							#强制同步下系统时钟
timedatectl status							#查看时间同步状态
chronyc sources -v							#查看 ntp 源服务器信息
timedatectl set-local-rtc 0					#将当前的UTC时间写入硬件时钟

在这里插入图片描述

#重启依赖于系统时间的服务
systemctl restart rsyslog 
systemctl restart crond#关闭无关服务
systemctl disable --now postfix

在这里插入图片描述

#所有节点 配置 Ceph yum源
wget https://download.ceph.com/rpm-nautilus/el7/noarch/ceph-release-1-1.el7.noarch.rpm --no-check-certificaterpm -ivh ceph-release-1-1.el7.noarch.rpm --force

在这里插入图片描述

#执行完上面所有的操作之后重启所有主机(可选)
sync
power off
#在 node节点 上添加 一张网卡和三个磁盘#在线刷新磁盘
echo "- - -" > /sys/class/scsi_host/host0/scan
echo "- - -" > /sys/class/scsi_host/host1/scan
echo "- - -" > /sys/class/scsi_host/host2/scan
lsblk				#查看磁盘情况

在这里插入图片描述

3.2 部署 Ceph 集群

在所有节点部署

#为所有节点都创建一个 Ceph 工作目录,后续的工作都在该目录下进行
mkdir -p /etc/ceph

在这里插入图片描述

在 admin 节点上安装

#在 admin节点 安装 ceph-deploy 部署工具
cd /etc/ceph
yum install -y ceph-deployceph-deploy --version

在这里插入图片描述

在 node 节点上部署

#在管理节点为其它节点安装 Ceph 软件包
#ceph-deploy 2.0.1 默认部署的是 mimic 版的 Ceph,若想安装其他版本的 Ceph,可以用 --release 手动指定版本
cd /etc/ceph
ceph-deploy install --release nautilus node0{1..3} admin#ceph-deploy install 本质就是在执行下面的命令:
yum clean all
yum -y install epel-release
yum -y install yum-plugin-priorities
yum -y install ceph-release ceph ceph-radosgw
#也可采用手动安装 Ceph 包方式,在其它节点上执行下面的命令将 Ceph 的安装包都部署上:
sed -i 's#download.ceph.com#mirrors.tuna.tsinghua.edu.cn/ceph#' /etc/yum.repos.d/ceph.repo
yum install -y ceph-mon ceph-radosgw ceph-mds ceph-mgr ceph-osd ceph-common ceph

在这里插入图片描述

生成初始配置

#在管理节点运行下述命令,告诉 ceph-deploy 哪些是 mon 监控节点
cd /etc/ceph
ceph-deploy new --public-network 192.168.145.0/24 --cluster-network 192.168.100.0/24 node01 node02 node03

在这里插入图片描述

#命令执行成功后会在 /etc/ceph 下生成配置文件
ls /etc/ceph
ceph.conf					#ceph的配置文件
ceph-deploy-ceph.log		#monitor的日志
ceph.mon.keyring			#monitor的密钥环文件

在这里插入图片描述

在 admin 节点初始化 mon 节点

cd /etc/ceph
ceph-deploy mon create node01 node02 node03			#创建 mon 节点,由于 monitor 使用 Paxos 算法,其高可用集群节点数量要求为大于等于 3 的奇数台ceph-deploy --overwrite-conf mon create-initial		#配置初始化 mon 节点,并向所有节点同步配置# --overwrite-conf 参数用于表示强制覆盖配置文件ceph-deploy gatherkeys node01						#可选操作,向 node01 节点收集所有密钥

在这里插入图片描述

#命令执行成功后会在 /etc/ceph 下生成配置文件
ls /etc/ceph
ceph.bootstrap-mds.keyring			#引导启动 mds 的密钥文件
ceph.bootstrap-mgr.keyring			#引导启动 mgr 的密钥文件
ceph.bootstrap-osd.keyring			#引导启动 osd 的密钥文件
ceph.bootstrap-rgw.keyring			#引导启动 rgw 的密钥文件
ceph.client.admin.keyring			#ceph客户端和管理端通信的认证密钥,拥有ceph集群的所有权限
ceph.conf
ceph-deploy-ceph.log
ceph.mon.keyring

在这里插入图片描述

#在 mon 节点上查看自动开启的 mon 进程
ps aux | grep ceph
root       23024  0.0  0.2 189264  9208 ?        Ss   18:29   0:00 /usr/bin/python2.7 /usr/bin/ceph-crash
root       24086  0.0  0.0 112824   988 pts/2    S+   18:40   0:00 grep --color=auto ceph

在这里插入图片描述

#在管理节点查看 Ceph 集群状态
cd /etc/ceph
ceph -scluster:id:     804fe03b-b14f-4d05-83c5-b81bdce558dbhealth: HEALTH_WARNmons are allowing insecure global_id reclaimmon node01 is low on available spaceservices:mon: 3 daemons, quorum node01,node02,node03 (age 6m)mgr: no daemons activeosd: 0 osds: 0 up, 0 indata:pools:   0 pools, 0 pgsobjects: 0 objects, 0 Busage:   0 B used, 0 B / 0 B availpgs: 

在这里插入图片描述

#查看 mon 集群选举的情况
ceph quorum_status --format json-pretty | grep leader
"quorum_leader_name": "node01",

在这里插入图片描述

#扩容 mon 节点
ceph-deploy mon add <节点名称>

部署能够管理 Ceph 集群的节点(可选)

#可实现在各个节点执行 ceph 命令管理集群
cd /etc/ceph
ceph-deploy --overwrite-conf config push node01 node02 node03		#向所有 mon 节点同步配置,确保所有 mon 节点上的 ceph.conf 内容必须一致ceph-deploy admin node01 node02 node03			#本质就是把 ceph.client.admin.keyring 集群认证文件拷贝到各个节点

在这里插入图片描述

#在 mon 节点上查看
ls /etc/ceph
ceph.client.admin.keyring  ceph.conf  rbdmap  tmpr8tzyccd /etc/ceph
ceph -s

部署 osd 存储节点

#主机添加完硬盘后不要分区,直接使用
lsblk 
NAME   MAJ:MIN RM  SIZE RO TYPE MOUNTPOINT
sda      8:0    0   40G  0 disk 
├─sda1   8:1    0  5.6G  0 part [SWAP]
└─sda2   8:2    0 34.4G  0 part /
sdb      8:16   0   20G  0 disk 
sdc      8:32   0   20G  0 disk 
sdd      8:48   0   20G  0 disk 
sr0     11:0    1  4.4G  0 rom 

在这里插入图片描述

#如果是利旧的硬盘,则需要先擦净(删除分区表)磁盘(可选,无数据的新硬盘可不做)
cd /etc/ceph
ceph-deploy disk zap node01 /dev/sdb
ceph-deploy disk zap node02 /dev/sdb
ceph-deploy disk zap node03 /dev/sdb

在这里插入图片描述

#在 admin节点 添加 osd 节点
ceph-deploy --overwrite-conf osd create node01 --data /dev/sdb
ceph-deploy --overwrite-conf osd create node02 --data /dev/sdb
ceph-deploy --overwrite-conf osd create node03 --data /dev/sdb

在这里插入图片描述

#查看 ceph 集群状态
ceph -scluster:id:     804fe03b-b14f-4d05-83c5-b81bdce558dbhealth: HEALTH_WARNno active mgrmons are allowing insecure global_id reclaimmon node01 is low on available spaceservices:mon: 3 daemons, quorum node01,node02,node03 (age 16m)mgr: no daemons activeosd: 3 osds: 3 up (since 26s), 3 in (since 26s)data:pools:   0 pools, 0 pgsobjects: 0 objects, 0 Busage:   0 B used, 0 B / 0 B availpgs:  

在这里插入图片描述

ceph osd stat
ceph osd tree
rados df
#扩容 osd 节点
cd /etc/ceph
ceph-deploy --overwrite-conf osd create node01 --data /dev/sdc
ceph-deploy --overwrite-conf osd create node02 --data /dev/sdc
ceph-deploy --overwrite-conf osd create node03 --data /dev/sdc
ceph-deploy --overwrite-conf osd create node01 --data /dev/sdd
ceph-deploy --overwrite-conf osd create node02 --data /dev/sdd
ceph-deploy --overwrite-conf osd create node03 --data /dev/sdd#添加 OSD 中会涉及到 PG 的迁移,由于此时集群并没有数据,因此 health 的状态很快就变成 OK,如果在生产环境中添加节点则会涉及到大量的数据的迁移。

在 admin 节点上部署 mgr 节点

#ceph-mgr守护进程以Active/Standby模式运行,可确保在Active节点或其ceph-mgr守护进程故障时,其中的一个Standby实例可以在不中断服务的情况下接管其任务。根据官方的架构原则,mgr至少要有两个节点来进行工作。
cd /etc/ceph
ceph-deploy mgr create node01 node02ceph -scluster:id:     7e9848bb-909c-43fa-b36c-5805ffbbeb39health: HEALTH_WARNmons are allowing insecure global_id reclaimservices:mon: 3 daemons, quorum node01,node02,node03mgr: node01(active, since 10s), standbys: node02osd: 0 osds: 0 up, 0 in

在这里插入图片描述

#解决 HEALTH_WARN 问题:mons are allowing insecure global_id reclaim问题:
#禁用不安全模式
ceph config set mon auth_allow_insecure_global_id_reclaim false
ceph -s#扩容 mgr 节点
ceph-deploy mgr create <节点名称>

在这里插入图片描述

ceph osd status    #查看 osd 状态,需部署 mgr 后才能执行
+----+--------+-------+-------+--------+---------+--------+---------+-----------+
| id |  host  |  used | avail | wr ops | wr data | rd ops | rd data |   state   |
+----+--------+-------+-------+--------+---------+--------+---------+-----------+
| 0  | node01 | 1025M | 18.9G |    0   |     0   |    0   |     0   | exists,up |
| 1  | node02 | 1025M | 18.9G |    0   |     0   |    0   |     0   | exists,up |
| 2  | node03 | 1025M | 18.9G |    0   |     0   |    0   |     0   | exists,up |
+----+--------+-------+-------+--------+---------+--------+---------+-----------+ceph osd df    		#查看 osd 容量,需部署 mgr 后才能执行
ID CLASS WEIGHT  REWEIGHT SIZE   RAW USE DATA    OMAP META  AVAIL  %USE VAR  PGS STATUS 0   hdd 0.01949  1.00000 20 GiB 1.0 GiB 1.8 MiB  0 B 1 GiB 19 GiB 5.01 1.00   0     up 1   hdd 0.01949  1.00000 20 GiB 1.0 GiB 1.8 MiB  0 B 1 GiB 19 GiB 5.01 1.00   0     up 2   hdd 0.01949  1.00000 20 GiB 1.0 GiB 1.8 MiB  0 B 1 GiB 19 GiB 5.01 1.00   0     up TOTAL 60 GiB 3.0 GiB 5.2 MiB  0 B 3 GiB 57 GiB 5.01                 
MIN/MAX VAR: 1.00/1.00  STDDEV: 0

在这里插入图片描述

开启监控模块

#在 ceph-mgr Active节点执行命令开启
ceph -s | grep mgryum install -y ceph-mgr-dashboardcd /etc/cephceph mgr module ls | grep dashboard

在这里插入图片描述

#开启 dashboard 模块
ceph mgr module enable dashboard --force#禁用 dashboard 的 ssl 功能
ceph config set mgr mgr/dashboard/ssl false#配置 dashboard 监听的地址和端口
ceph config set mgr mgr/dashboard/server_addr 0.0.0.0
ceph config set mgr mgr/dashboard/server_port 8000#重启 dashboard
ceph mgr module disable dashboard
ceph mgr module enable dashboard --force#确认访问 dashboard 的 url
ceph mgr services

在这里插入图片描述

#在 admin节点 上设置 dashboard 账户以及密码
echo "12345678" > dashboard_passwd.txtceph dashboard set-login-credentials admin -i dashboard_passwd.txt或
ceph dashboard ac-user-create admin administrator -i dashboard_passwd.txt

在这里插入图片描述

浏览器访问:http://192.168.145.30:8000 ,账号密码为 admin/12345678

在这里插入图片描述

在这里插入图片描述

3.3 资源池 Pool 管理

总结

1. 数据存储类型

块存储:一对一,只能被一个主机挂载使用,数据以块为单位进行存储,典型代表:硬盘。文件存储:一对多,能被多个主机同时挂载/传输使用,数据以文件的形式存储的(元数据和实际实际是分开存储),并且有目录的层级关系,典型代表:NFS。对象存储:一对多,能被多个主机/应用通过API接口访问使用,数据以文件的形式存储的,一个文件即一个对象,元数据和实际数据是存储在一起的。文件是扁平化方式存储的,没有目录的层级关系,典型代表:阿里云的OSS、亚马逊云的S3。

2. Cpeh 的概念、架构

分布式存储系统,具有高性能、高扩展性、高可用性等特点,还集块/文件/对象存储功能于一身架构(从下往上看): 客户端(主机/虚拟机/容器/应用程序):使用存储的读写数据的终端LIBRADOS对象反问接口:提供存储接口给客户端使用,Ceph默认提供三个接口 RBD块存储接口、CephFs文件存储接口、RGW对象存储接口,还支持用户使用JAVA/Python/C等编程语言二次开发自定义的接口 RADOS基础存储系统(统一存储池):提供存储能力进行读写的,Ceph中一切都是以对象形式存储,RADOS就是负责存储这些对象的,并保证数据的一致性和可靠性

3. Ceph 的组件

OSD				 负责存储数据,一般一个磁盘对应一个OSD,响应客户端的读写请求
Monitor(mom)	Ceph监视器,保存OSB的元数据,维护Ceph集群状态的各种图表视图(监控全局状态),管理客户端的认证与授权
Manager(mgr)	负责跟踪集群状态和监控指标,暴露接口给监控软件获取监控指标数据
MDS				 负责保存CpehFS文件系统的元数据,仅在使用CephFS接口功能的时候使用PG				 可以理解为保存OSD位置的索引,一个PG可以包含多个数据对象,一个数据对象只能属于一个PG
Pool			  数据池,可以理解为一个命名空间,一个Pool里包含多个PG,可以使不同的Pool里的PG重名

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_331142.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微服务架构+创建微服务工程(商品/订单)

目录 1.微服务架构 1.1.单体应用架构 1.2.微服务应用 1.3 微服务架构的优势 1.4.微服务架构的缺点(挑战) 1.5. SpringCloud与微服务关系 1.6.SpringBoot和SpringCloud关系 2. 创建微服务工程 2.1.数据库 2.2.搭建父工程 2.2 创建公共模块 2.3.商品系统 2.4.订单微…

在Linux中使用curl访问EasyCVR页面,返回报错Unauthorized是什么原因?

EasyCVR可拓展性强、视频能力灵活、部署轻快&#xff0c;可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等&#xff0c;以及支持厂家私有协议与SDK接入&#xff0c;包括海康Ehome、海大宇等设备的SDK等。平台既具备传统安防视频监控的能力&#xff0c;比如&#xff1a;视…

检测到错误页面web应用服务器版本信息泄露

详细描述 Web服务器未能正确处理异常请求导致Web服务器版本信息泄露&#xff0c;攻击者收集到服务器信息后可进行进一步针对性攻击。 解决办法 临时修复建议如下&#xff1a; 1、关闭web服务器错误提示。 2、关闭运行平台的错误提示。 3、建立错误机制&#xff0c;不要把真实…

力扣 198.打家劫舍【中等】

198.打家劫舍 1 题目2 思路3 代码4 结果 1 题目 题目来源&#xff1a;力扣&#xff08;LeetCode&#xff09;https://leetcode.cn/problems/house-robber 题目&#xff1a;你是一个专业的小偷&#xff0c;计划偷窃沿街的房屋。每间房内都藏有一定的现金&#xff0c;影响你偷窃…

优化产品知识库的 SEO 技巧

在当今数字化的商业环境中&#xff0c;为产品知识库进行搜索引擎优化&#xff08;SEO&#xff09;是至关重要的。随着用户越来越倾向于通过搜索引擎获取信息&#xff0c;优化产品知识库可以帮助你的企业在竞争激烈的市场中脱颖而出。 通过改进SEO&#xff0c;你可以帮助用户找到…

K8S V1.25.11安装以及踩坑之旅

说明&#xff1a; 系统&#xff1a;centos9 stream K8S版本&#xff1a;V1.25.11&#xff08;不要装最新的&#xff0c;后续的可视化界面安装的是个坑&#xff0c;基本上不支持&#xff0c;时间&#xff1a;2023年7月14日&#xff09; Docker版本&#xff1a;20.10.16 (不要…

4.postgresql--rollup,grouping sets,cube

PostgreSQL ROLLUP 是group by 的子句&#xff0c;是生成多个分组集合的快捷功能。与Cube子句的差异是&#xff0c;rollup 不生成基于特定列所有可能的分组集合&#xff0c;生成分组集合为其子集。 ROLLUP假设输入列之间存在层次结构&#xff0c;从而生成有意义的所有分组集合…

力扣21. 合并两个有序链表

题目 将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 链接&#xff1a;21. 合并两个有序链表 - 力扣&#xff08;LeetCode&#xff09; 题解 设置两个指针head和tail&#xff0c;head用来指向新链表的头结点&#xff0c;tail…

第G1周:生成对抗网络(GAN)入门

目录 一、课题背景和开发环境二、理论基础1.生成器2. 判别器3. 基本原理 三、前期准备工作1. 定义超参数2.下载数据3. 配置数据 四、定义模型1. 定义鉴别器2. 定义生成器 五、训练模型1. 创建实例2. 训练模型3. 保存模型 &#x1f368; 本文为&#x1f517;365天深度学习训练营…

prometheus调整默认数据存储时间

调整kubernetes部署的prometheus数据存储时间 由于prometheus是用kuberentes部署的&#xff0c;没办法像传统部署方式那种直接在启动参数增加存储时间的参数。需要在configmap里或者在deployment里添加&#xff0c;我这里使用的方式是在deployement里添加调整存储时间的参数。…

React native 已有项目升级兼容web

基础 概念 | webpack 中文文档 | webpack 中文文档 | webpack 中文网 深入理解Webpack及Babel的使用 - 掘金 Introduction to React Native for Web // React Native for Web Webpack 是一个现代的 JavaScript 应用程序的静态模块打包工具&#xff0c;它将应用程序所依赖的各…

Star History 月度开源精选|2023 年 6 月

上一期 Star History 月度精选是写给市场、运营人员的&#xff0c;而这一期回归到 DevTools 类别&#xff0c;我们六月发现了好一些开发者可以用的不错工具&#xff01; AI Getting Started 还记得 Supabase “Build in a weekend” 的广告词吗&#xff01;AI Getting Started…

AIGC文生图:使用ControlNet 控制 Stable Diffusion

1 ControlNet介绍 1.1 ControlNet是什么&#xff1f; ControlNet是斯坦福大学研究人员开发的Stable Diffusion的扩展&#xff0c;使创作者能够轻松地控制AI图像和视频中的对象。它将根据边缘检测、草图处理或人体姿势等各种条件来控制图像生成。 论坛地址&#xff1a;Adding…

Docker安装Rabbitmq超详细教程

&#x1f680; Docker安装Rabbitmq保姆级教程 &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1…

Java 装箱拆箱原理 包装类型缓存池

JAVA中的基本数据类型 byteshortintlongfloatdoublebooleanchar 为了让上述基本数据类型可以转为对象&#xff0c;Java在1.5推出了一系列包装类&#xff0c;基本类和包装类互相转换的过程&#xff0c;称为装箱和拆箱 缓存池 缓存池也叫常量池。它是事先存储一些常量数据用以…

数据结构——各种常见算法的实现方法和思路

文章目录 常见的排序算法类型复杂度和稳定性 1.冒泡排序2.直接插入排序3.希尔排序4.简单选择排序方法1&#xff1a;双向遍历选择排序方法2&#xff1a;单向遍历选择排序 5.归并排序方法1&#xff1a;递归方法2&#xff1a;非递归 6.快速排序方法1&#xff1a;随机取keyi方法2&a…

JMeter自定义日志与日志分析

1 JMeter日志概览 JMeter与Java程序一样&#xff0c;会记录事件日志&#xff0c;日志文件保存在bin目录中&#xff0c;名称为jmeter.log。当然&#xff0c;我们也可以在面板中直接察看日志&#xff0c;点击右上角黄色标志物可以打开日志面板&#xff0c;再次点击收起。 可见&…

PostgreSQL MVCC的弊端优化方案

我们之前的博客文章“我们最讨厌的 PostgreSQL 部分”讨论了大家最喜欢的 DBMS 多版本并发控制 (MVCC) 实现所带来的问题。其中包括版本复制、表膨胀、索引维护和真空管理。本文将探讨针对每个问题优化 PostgreSQL 的方法。 尽管 PostgreSQL 的 MVCC 实现是 Oracle 和 MySQL 等…

layui会议OA项目数据表格新增改查

文章目录 前言一、后台代码编写1.1 数据表优化1.2 R工具类1.3 UserDao新增改查1.4 Servlet的编写 二、前台页面的编写2.1 userManege.jsp2.2 userManage.js2.3 新增、修改用户共用jsp2.4add、edit的js 三、演示3.1 查询3.2 新增3.3 修改3.4 删除 前言 在上篇博客我们实现了左侧…

【数据结构】二叉树——链式结构

目录 一、前置声明 二、二叉树的遍历 2.1 前序、中序以及后序遍历 2.2 层序遍历 三、节点个数以及高度 3.1 节点个数 3.2 叶子节点个数 3.3 第k层节点个数 3.4 二叉树的高度/深度 3.5 查找值为x的节点 四、二叉树的创建和销毁 4.1 构建二叉树 4.2 二叉树销毁 4.3 …