TStor OneCOS 技术专栏——轻松单桶万亿

news/2024/4/27 14:34:07/文章来源:https://blog.csdn.net/Tencent_COS/article/details/128115807

TStor OneCOS简介

TStor OneCOS海量对象存储(后面简称OneCOS),是基于腾讯云公有云存储架构打造的完全自研的分布式软件定义存储,轻松支持单桶万亿对象和EB级容量,集群容量无限伸缩,同时支持高密大盘等多种硬件机型。本期我们来聊聊单桶万亿对象数的核心能力。

背景

云计算、5G、大数据、AI等创新技术的快速发展,引发了海量非结构化数据的规模化聚集,数百PB容量或千百亿数量的海量数据存储需求变得越发普遍。

以智能汽车自动驾驶训练场景为例:一辆汽车约搭载8个摄像头,包括前向3颗、周视4颗、后视1颗,每个摄像头以30帧/秒的速度拍摄12小时,将会产生约1036万多帧的图片,如果保存近1年100辆车的数据,就是接近3800亿的数据。即使对数据进行自动化过滤处理,剩下需要精确标注的数量仍然非常惊人,这还不包括除摄像头之外其他传感器和流程的数据。

        

 

某汽车厂商最初使用公有云对象存储,存储量已经达到千亿对象数,存在单桶超过百亿文件数的桶。现在由于合规、成本等因素选择自建私有云对象存储全量替换云上对象。由于业务使用便利和配置效率,要求存储文件桶必须和云上一样的划分命名,核心要求就是单桶对象数规模和云上一致,单桶需要支持超过千亿的对象数,以满足未来数据持续增长。

主流存储厂商为了保证存储的性能、稳定性及可靠性,通常会对单集群、单个桶等规格做出限制,拥有海量数据的客户随业务增长需要拆分多个集群,大大降低了使用效率,同时也增加了管理和运维的复杂度。

OneCOS天然适应这种大规模海量数据需求,和公有云COS一致,每个存储桶中最大对象数不限。如某用户单桶超过55PB、总文件数超过5000亿:

数据和索引存储分离

首先,OneCOS通过把对象内容的存储和元数据的存储的解耦,做成两套独立的系统,并且每个系统对外的接口尽量的简单,高内聚低耦合,方便各个系统独立演进和迭代。元数据存储和对象内容存储分离的结构如下图:

        

OneCOS引入了全局统一的分布式元数据集群,使用一套元数据存储系统真正意义上解决了单存储桶规模的局限性。在对象存储系统中,既要存储对象的内容也要存储对象的元数据,这两个存储对系统的要求是不一样的,对象内容的存储在接口上只需要上传、下载、删除就可以了,并且对象的内容一般都比较大,在存储的时候需要做切分;而对象的元数据,一般value都比较小,并且元数据的操作在接口上除了增加、删除、查询之后,还需要支持有序的list操作,另外元数据的操作还要有一定的事务的能力,以支持用户对同一个对象的多并发的操作等。

索引存储支持多个表空间    

OneCOS的元数据存储在业务上支持不同的表空间,比如说上传中的对象、已删除的对象、上传完成的对象是在不同的表空间中。OneCOS元数据的表空间类似于数据库中的表,每个表空间是相互独立的,在访问元数据的时候需要先指定表空间。

通过表空间这一层的抽象,使元数据在逻辑的组织上更加的清晰,方便对不同的表空间施加不同的存储优化和QoS访问控制等。

hash加range的数据组织形式

OneCOS对象存储对外的ListObjects接口要求对象的列表要能顺序的列出,很显然这个要求对象的列表在底层存储的时候要按照顺序来存储,OneCOS也是这样做的,但同时不同的存储桶之间并不需要按照全局的顺序来存储,因此OneCOS这边最终的存储方案是按照hash加range的方式来组织元数据的。对appid和bucket,按照hash来打散,对某个存储桶的对象列表,按照range有序的存储到某些小表中,并且当小表比较大时,支持分裂成多个小表,并在整个索引元数据集群中均衡分布。

       

另外考虑有的存储桶使用时间作为对象名称的使用场景,比如说存储桶中存储的是日志文件,日志文件是按照时间来命名的,这样元数据按照range有序来存储对象列表的时候会发现新对象的上传总是在range最后的一个小区间中,对应到元数据存储的某单个小表上,这样这个小区间对应的小表就会成为整个存储桶的瓶颈,虽然存储桶很大,但是上传的key在range中比较集中,会导致元数据单小表的能力成为整个bucket的瓶颈。为了应对这种场景,OneCOS在分hash和range的时候,也支持在对象名上做hash,这样可以把热点的对象在小表上打散,提升存储桶整体的性能。为了应对对象列表hash打散对list操作的性能影响,OneCOS逻辑层针对list的操作做了多路并发的缓存和加速。

cas事务支持的能力   

在大规模对象的处理上不可避免的会遇到冲突的问题,比如说多个并发同时在上传、删除、下载同一个对象,OneCOS通过分表空间以及单key的cas能力来保证冲突处理过程中的正确性。

对象索引表空间的key是对象的名称,value指向数据索引;数据索引表空间的key是数据的unique key,value指向这个数据在底层存储上的相关的信息。租户的每次上传操作都对应唯一的一个数据索引,上传完成之后,再通过cas的操作更新对象索引表空间中这个对象的指向。通过这种方式来解决多路并发对同一个对象操作冲突的处理。

综上,OneCOS单桶支持万亿对象的能力,具有绝对领先的私有云和混合云数据存储优势,和公有云规格无缝衔接,可以轻松帮助数据中心快速实现真正的海量云存储,确保满足未来数据需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_228028.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STL的常用算法-查找 (20221130)

STL的常用算法 概述&#xff1a; 算法主要是由头文件<algorithm> <functional> <numeric> 组成。 <algorithm>是所有STL头文件中最大的一个&#xff0c;涉及比较、交换、查找、遍历等等&#xff1b; <functional>定义了一些模板类&#xff0…

如何设计可扩展架构

架构设计复杂度模型 业务复杂度和质量复杂度是正交的 业务复杂度 业务固有的复杂度&#xff0c;主要体现为难以理解、难以扩展&#xff0c;例如服务数量多、业务流程长、业务之间关系复杂 质量复杂度 高性能、高可用、成本、安全等质量属性的要求 架构复杂度应对之道 复杂…

野火FPGA进阶(2):基于I2C协议的EEPROM驱动控制

文章目录第49讲&#xff1a;基于I2C协议的EEPROM驱动控制理论部分设计与实现i2c_ctrli2c_rw_dataeeprom_byte_rd_wrtb_eeprom_byte_rd_wr第49讲&#xff1a;基于I2C协议的EEPROM驱动控制 理论部分 I2C通讯协议&#xff08;Inter-Integrated Circuit&#xff09;是由Philips公…

改革后IB数学该如何选?

IB数学&#xff0c;作为一个IB课程里必选科目&#xff0c;让无数IB学霸为之自豪&#xff0c;他们能解出外教都不会做的题。另一方面&#xff0c;也让很多同学&#xff08;自称“学渣”&#xff09;避之不及。 从2019年起&#xff0c;IB数学教学大纲发生重大改革。▲图源&#x…

C语言详细知识点(下)

⛄️上一篇⛄️C语言详细知识点&#xff08;上&#xff09; 文章目录五、数组1、一维数组的定义及使用2、二维数组的定义及使用3、字符数组的定义及使用六、函数1、函数的定义2、函数的调用3、函数的声明4、函数的嵌套调用5、函数的递归调用七、指针1、什么是指针2、指针变量3、…

链表之反转链表

文章目录链表之反转链表题目描述解题思路代码实现链表之反转链表 力扣链接 题目描述 定义一个函数&#xff0c;输入一个链表的头节点&#xff0c;反转该链表并输出反转后链表的头节点。 示例&#xff1a; ​ 输入: 1->2->3->4->5->NULL ​ 输出: 5->4-&…

基于vue项目的代码优化

前言 项目上线后其整体性能的优良是用户也是研发人员所关注的。项目优化非常重要&#xff0c;一丝一毫的提升都是对用户的负责。因此我们在开发中就应该注重细节&#xff0c;优化工作从日常开发做起。本篇文章就分享一些在日常开发中代码层面的优化手段。 开发常用优化手段 …

达摩院快速动作识别TPS ECCV论文深入解读

一、论文&代码 论文&#xff1a;https://www.ecva.net/papers/eccv_2022/papers_ECCV/papers/136630615.pdf 模型&代码&#xff1a;ModelScope 魔搭社区 二、背景 高效的时空建模(Spatiotemporal modeling)是视频理解和动作识别的核心问题。相较于图像的Transforme…

开源共建 | TIS整合数据同步工具ChunJun,携手完善开源生态

TIS整合ChunJun实操 B站视频&#xff1a; https://www.bilibili.com/video/BV1QM411z7w5/?spm_id_from333.999.0.0 一、ChunJun 概述 ChunJun是一款易用、稳定、高效的批流统一的数据集成框架&#xff0c;可基于实时计算引擎Flink实现多种异构数据源之间的数据同步与计算&…

flink学习

Flink学习之路&#xff08;一&#xff09;Flink简介 - 走看看 Flink(一)-基本概念 - 知乎 Flink架构&#xff1a; Flink整个系统包含三个部分&#xff1a; 1、Client&#xff1a; 给用户提供向Flink系统提交用户任务&#xff08;流式作业&#xff09;的能力。用户提交一个F…

全球无人驾驶大洗牌,百度Apollo Day宣告Robotaxi进入2.0时代

作者 | 德新 编辑 | 王博1. 全球无人驾驶大洗牌&#xff0c;Robotaxi越发向头部聚集 全球无人驾驶落地正呈现两幅面孔。随着资本热潮褪去&#xff0c;一部分公司在资金和研发上已经难以为继&#xff0c;Robotaxi落地的资源和希望&#xff0c;正无限向头部公司聚集。 10月&#…

OVS DPDK VXLAN隧道处理

在学习OVS VXLAN实现之前&#xff0c;我们先回顾一下传统VTEP设备是如何处理VXLAN报文的。如下图所示&#xff1a; vxlan报文进入交换机端口后&#xff0c;根据报文头部信息进行vxlan隧道终结。隧道终结后&#xff0c;根据underlay信息进行overlay映射&#xff0c;得到overlay的…

鲲鹏devkit性能分析工具介绍(四)

鲲鹏devkit性能分析工具介绍&#xff08;四&#xff09; 前面我们已经介绍了鲲鹏devkit性能分析工具的全景分析、热点函数分析、进程/线程分析、微架构分析、和访存分析&#xff0c;由此可见进行性能调优绝对不能够仅仅去进行一方面的考察而是需要全方面的数据分析进行一定的舍…

8、多进程之间的通信

多进程之间的常用通信方法有两种&#xff0c;及Queue和Pipe 一、Queue Queue([maxsize])&#xff1a;创建共享的进程队列。maxsize是队列中允许的最大项数。如果省略此参数&#xff0c;则无大小限制。底层队列使用管道和锁定实现。另外&#xff0c;还需要运行支持线程以便队列中…

[附源码]计算机毕业设计springboot基于Web的软考题库平台

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

[论文阅读] Curriculum Semi-supervised Segmentation

[论文地址] [代码] [MICCAI 19] Abstract 本研究调查了半监督CNN分割的课程式策略&#xff0c;它设计了一个回归网络来学习图像级信息&#xff0c;如目标区域的大小。这些回归被用来有效地规范分割网络&#xff0c;约束未标记图像的softmax预测&#xff0c;使其与推断的标签分…

16-JavaSE基础巩固项目:拼图小游戏

阶段项目-拼图小游戏 一、项目介绍 1、目的 锻炼逻辑思维能力&#xff0c;让我们知道前面学习的知识点在实际开发中的应用场景。 1、为了学习一个新知识&#xff1a;GUI GUI全称&#xff1a;Graphical User Interface&#xff08;又称图形用户接口&#xff09;是指采用图形化…

【Android进阶之旅】内存泄漏的危害有哪些?(案例分析)

随着计算机应用需求的日益增加&#xff0c;应用程序的设计与开发也相应的日趋复杂&#xff1b; 开发人员在程序实现的过程中处理的变量也大量增加&#xff0c;如何有效进行内存分配和释放&#xff0c;防止内存泄漏的问题变得越来越突出 例如&#xff1a; 服务器应用软件&#x…

Redis 内存淘汰和过期删除策略

提起使用Redis的优点&#xff0c;大家可以列举出许多&#xff0c;比如&#xff1a;数据存储在内存&#xff0c;读写速度快&#xff0c;性能优异。比如数据持久化&#xff0c;便于数据备份及恢复等等。 分布式服务系统平台发展至今&#xff0c;Redis活跃在平台的各个领域&#…

RabbitMQ事务消息

通过对信道的设置实现 channel.txSelect()&#xff1b;通知服务器开启事务模式&#xff1b;服务端会返回Tx.Select-Ok channel.basicPublish&#xff1b;发送消息&#xff0c;可以是多条&#xff0c;可以是消费消息提交ackchannel.txCommit() &#xff1b;提交事务&#xff1b;…