关于数据治理工具的选型,你了解多少?

news/2024/4/29 6:38:34/文章来源:https://blog.csdn.net/esensoft123/article/details/128021270

数据治理的本质是盘点数据资产、治理数据质量,实施数据全生命周期的管理,这里面包括了建组织、立制度或者使用一款数据治理的软件帮助企业开展数据治理的相关工作等等。根据不同的数据治理项目特点,会用到不同的技术或工具。拥有一套趁手好用的平台和工具,无疑能够让您的数据治理工作事半功倍。

对于数据治理工具的选型,通常大家会关心以下问题,例如:

  • 企业通常利用本地部署还是基于云的工具?

  • 目前是否有中心化的数据平台?是否需要一个能与多个数据平台集成的工具?大概范围是什么样?

  • 是否需要一个工具来处理来自多个数据源的大量数据?

  • 用户是否需要自助式的数据服务满足工作流程中的数据需求?

数据治理工具全景图(来源:大数据标准工作组)

那么整体对于企业来讲,如何来选择一款数据治理的软件能更大程度的保障管理效果,促进管理目标达成,结合十多年的从业经历,给大家提供以下两个维度作为参考,既关注工具本身,也要考虑企业自身实力

工具的能力

数据治理工具选型的首要因素是工具自身,具体可以从功能、性能、架构、采购成本四个方面进行考虑。

1、产品功能

对于数据治理工具功能的考察要结合企业自身的业务需求,要选择最适合企业现状和发展要求的。在数据治理领域,目前有两个学术流派,一是全面的数据治理体系,二是面向主题的数据治理,这两套体系没有谁高谁低,针对不同的企业选择适合的策略和适合的工具。

假如您的企业中没有或技术人员不足,那么选择的数据治理工具的功能一定要简单易用并且功能点要覆盖企业的业务需求,尽量减少定制化开发的功能。假如您的企业技术实力雄厚,可以选择一个稳定的框架,部分功能可以定制开发,这样也许更加易用和适用。

在功能指标上,不同的数据治理主题关注的功能和工具不同,例如:元数据管理、数据质量管理、数据标准管理、主数据管理等。从技术选型角度来看,数据治理工具落地需要考虑的功能列表有:

  • 跨平台支持各主流数据库和数据平台的元数据信息

  • 管理关键数据资产,如数据字典

  • 跟踪和管理元数据操作历史和变更记录

  • 批量导入和更新元数据

  • 分配数据治理流程角色和策略

  • 定义工作流程和管理用户权限

  • 通过数据探查快速分析业务数据情况

  • 自动化追踪数据质量指标和效果

  • ……

这个话题会涉及很多技术细节,这里就不再一一展开了。但是,要重点强调的是数据治理工具的选型一定要了解其工作方式及其自动化程度,以及完成特定任务可能需要的特定功能。最后,至关重要的是要考虑数据控制、安全性和许可等因素。

此外,评估和选择数据治理工具不仅取决于功能,还取决于您如何使用这些工具来增加业务价值。例如,如果您对元数据管理有要求,请确保在使用具有该功能的数据治理工具之前,应该搞清楚为什么要用元数据工具,它能帮助企业的业务价值带来些什么或改变什么?

2、产品性能

数字化时代,企业的数据环境变得多样而复杂,大数据的4V特征(体量大、多样化、速度快、密度低)已经展现的淋漓尽致。考虑到需要处理的大量数据以及业务需求的日益复杂,对于任何正在评估的新技术和工具,都必须考虑性能和可伸缩性。数据治理的工具需要能够支持大量并发用户和非常大的数据集,尤其是针对数据模型工具、数据质量工具、数据集成工具、数据存取工具。

3、产品架构

产品架构包括了数据架构、技术架构、应用架构、安全架构、部署架构等。在数据治理项目中,数据架构更多的是需要根据企业的现状和需求进行规划设计的,比如数据的分层分级、数据的存储、数据的读取、数据的安全控制等。

技术架构重点是考察供应商产品的技术先进性。当下微服务架构、人工治理、区块链、大数据、云计算等都是流行的技术,如果您考察的产品用的技术架构比较老旧,则与主流架构生态的融合则会存在一定的障碍。

应用架构是从功能组件的适用性、易用性,以及功能组件的关联性等方面进行考量的。

安全架构是考察产品在数据安全防护和个人隐私数据保护层面的功能和成熟度。

此外,在部署模式上是否支持云部署也是一个需要考虑的点,因为很多中小企业不得不考虑成本问题,机房、服务器和人力资源都是需要投入资金的。

4、采购成本

数据治理工具选型通常会受到财务预算的限制,因而采购成本也是不少企业在选型时重点考虑的因素。然而,对采购成本的控制不等于简单的报价和还价,价低者为最佳,还应该包含对很多隐性因素的考量,比如购买成本、实施成本、升级成本、学习成本等。

现实中大多数企业都只关注购置成本,并试图将其最小化,而不是以总拥有成本为标准。正如前两年的云计算项目,出现了很多“0元中标”情况。事实上,这种看似购置价为“0”的项目,每年都需要需要投入大量服务费、运营费,总的成本并不低。要相信:“羊毛出在羊身上”。

厂商的能力

除了前面列出的工具相关要素外,数据治理厂商的整体实力也是选型时需要考虑的重要方面。企业的数据治理是一项持续的长期工作,所以对于数据治理工具的选型要尽量选择能够长期合作的、靠谱的厂商。尤其是要当心一些概念炒作一流,拿不出“真货”的厂商,如果选择了这样的厂商,您的企业很有可能成为被拿来试验的”小白鼠”。

毕竟从某种意义上来说,数据治理厂商的能力决定着数据治理工具的优劣。在厂商层面,主要考虑解决方案、服务、品牌和市场4个要素。

1、解决方案

解决方案是数据治理厂商能力的一个重要表现,虽然不是直接反映产品和工具的功能,但是解决方案能力保证企业如何才能将工具使用起来的重要措施。这往往考察的是企业在数据治理方面上的实施经验或成熟的案例。数据治理解决方案能力主要包括但不限于:数据治理组织体系、数据治理流程体系、数据治理运维管理、数据治理考核体系等。

同时,是否拥有具体行业的解决方案反映出厂商对该行业的数据治理应用是否积累了丰富经验,对行业特点是否有较为透彻的了解。越来越多的企业期望将工具与企业具体业务做更好的结合,从而产出更大的价值。完备的行业解决方案能够帮助企业精准定位业务问题,对症下药,得到的效果自然也就更好。

2、服务

数据治理相关的项目都应该是更注重服务的,厂商在数据领域的咨询规划能力、专业业务和技术能力非常重要。其实,一旦数据治理产品在使用中出现问题,如果厂商无法提供服务,企业就需要再投入成本进行后期维护,这项工作极其困难而繁重。

比如厂商是否提供产品的配套文档或其他基于文本的材料,一般包括:产品手册、产品章程、产品规格说明、数字媒体、产品白皮书等;充分考虑厂商是否提供本地化服务,是否能快速响应,是否有完善的问题解决机制等,并且还要考虑对于企业一些特定的需求,厂商是否能提供服务支持对数据治理产品的二次开发。当然,如果您的企业技术和业务能力如果足够强大,不需要太多依赖供应商来的话,该环节可以忽略。

3、品牌

品牌是数据治理厂商整体实力、用户认可度和口碑的综合体现,无论买什么,选头部品牌总没错。在 B2B 领域,品牌就是厂商的形象。关于数据治理厂商品牌的评估,可以先看厂商的运营方式,比如是一站式服务还是组合式服务,再看厂商的经验和积累的口碑,比如是否有众多的成功案例,是否给企业客户带来了很大的价值。

4、市场占有率

市场就是最好的试金石,是工具和厂商两大要素的综合体现。激烈的市场竞争会自动淘汰掉产品能力差、生命周期短的数据治理工具,因此数据治理工具的市场占有率、行业地位、领先程度在很大程度上说明了其优越性,是 IT 进行选型的首要考虑标准。

以上是数据治理工具选型时,需要特别注意的几个方向 ,大家在选型的时候可以参考。很显然在数字化时代,借助类似于睿治数据治理平台的这些工具,可以加速企业数字化转型进程。受市场认可的软件其实有很多,选择时必须要结合实际的情况。一般的情况下,都建议选择市面上较主流的产品,比较容易达到好的效果,目前企业数据治理软件市场占有率前列的,就是亿信华辰的睿治数据治理平台,官网可以在线试用,大家对功能可以有个很全面的评估。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_225361.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pdf生成:puppeteer

一、Puppeteer Puppeteer是Google Chrome团队出品的一款无界面Chrome工具,它提供了丰富的API,让开发者像鼠标一样控制浏览器的各种行为。Puppeteer是一个Node库,提供发了一个高级API来通过DevTools协议控制Chromium或Chrome。Puppeteer默认以…

LVGL学习笔记

芯片启动到LVGL初始化完成大体流程如下: 界面增加打印后代码如下: static void drag_event_handler(lv_event_t * e) {lv_obj_t * obj lv_event_get_target(e);lv_indev_t * indev lv_indev_get_act();if(indev NULL) return;lv_point_t vect;lv_indev_get_vect(indev, …

scala语法(一)(有java基础速学)

在拥有java基础上学习scala,注意以下几点 1. 变量声明 var | val 变量名 [: 变量类型] 变量值 val name: String "nico" 声明变量时,类型可以省略(就是叫 类型推断) val name "nico"类型确定后&#xff…

【面试题】JS基础-异步

1. 异步 1.1 为什么要异步? JS是单线程语言,只能同时做一件事。JS和DOM渲染共用同一个线程,因为JS可修改DOM结构。当遇到等待的情况时,例如网络请求、定时任务,程序不能卡住。所以需要异步来解决JS单线程等待的问题&…

Git -- submoudule子模块使用

文章目录子模块的作用添加子模块拉取带子模块的项目修改子模块代码子模块的作用 通常情况下,我们做项目时会有几个业务功能区分比较明确的模块,比如简单来说,一个项目我们可以分为认证授权模块、工具类模块、常规业务模块。 而像认证…

【Redis技术探索】「高可用架构模式」哨兵(sentinel)模式实现主从故障互切换模式详解

哨兵(sentinel)模式实现主从故障互切换模式详解Redis的多种模式Redis单机模式Redis单机模式的优点Redis单机模式的缺点Redis主从复制旧版本配置新版本配置查看主节点信息主从模式的优点主从复制的弊端Redis哨兵模式分析哨兵结构组成哨兵模式的主从切换Re…

重点,一文掌握ReentrantLock加解锁原理!|原创

本文详细讲解了 ReentrantLock 加锁和释放锁的原理,以及和 Synchronized 的对比。本文较长,建议收藏!点击上方“后端开发技术”,选择“设为星标” ,优质资源及时送达简要总结 ReentrantLock实现原理:volati…

Android入门第33天-Android里的弹出式对话框

简介 Android Studio里在4.0前有一种ProgressDialog,这个已经淘汰了。我们完全可以使用ProgressBar来取代。但是还有一种Dialog叫PopWindow,它是一种“可阻塞式Dialog”。即弹出后除非你给它一个“动作”否则就一直显示在那。 今天我们就来看看这种Dia…

【Linux】基础IO —— 动静态库的制作与使用

🌈欢迎来到Linux专栏~~动静态库的制作与使用 (꒪ꇴ꒪(꒪ꇴ꒪ )🐣,我是Scort目前状态:大三非科班啃C中🌍博客主页:张小姐的猫~江湖背景快上车🚘,握好方向盘跟我有一起打天下嘞!送给自…

Spring Boot 检索定时任务

概述 应用经常需要添加检索功能,开源的 ElasticSearch 是目前全文搜索引擎的首选。他可以快速的存储、搜索和分析海量数据。Spring Boot通过整合Spring Data ElasticSearch为我们提供了非常便捷的检索功能支持。 Elasticsearch是一个分布式搜索服务,提…

Unity3D占用内存太大怎么解决呢? -下

什么时候才是UnusedAssets?看一个例子: Object obj Resources.Load("MyPrefab"); GameObject instance Instantiate(obj) as GameObject; ......... Destroy(instance); 创建随后销毁了一个Prefab实例,这时候 MyPrefab已经没有被实际的物体…

5.XMLHttpRequest对象

XMLHttpRequest简称xhr,是浏览器提供的Javascript对象。之前我们使用的都是jQuery中的Ajax,现在我们使用原生JS的Ajax 目录 1 GET请求 1.1 不带参数请求 1.2 带参数请求 2 URL的编码与解码 2.1 编码 encodeURI() 2.2 解码 decodeURI() 3 …

【通用设计方法】之接收异常保护

目录 前言 一、接收异常保护 二、超短包、背靠背的支持 后记 前言 为了系统的鲁棒性,我们常常会做一系列的异常保护功能,避免系统挂死。 这里仅仅介绍接收保护的某些设计思路,抛砖引玉。 一、接收异常保护 设计思路:通过可配…

数据可视化大屏设计

在数据业务展示场景中,数据可视化大屏已经变得十分常见。那么在设计思路上,数据可视化大屏应当遵循什么样的设计逻辑?本篇文章里做了介绍,一起来看一下。 一、数据大屏的应用场景 1、大型会议 2、业务展示 二、数据大屏分类 1、展…

C语言源代码系列-管理系统之会员计费系统

往期文章分享点击跳转>《导航贴》- Unity手册,系统实战学习点击跳转>《导航贴》- Android手册,重温移动开发 👉关于作者 众所周知,人生是一个漫长的流程,不断克服困难,不断反思前进的过程。在这个过…

【Python百日进阶-WEB开发-冲進Flask】Day183 - Flask数据库ORM基础、增加

文章目录一、day03项目环境和结构搭建1.1 flask-script1.1.1 flask-script是干什么的?1.1.2 flask-script安装1.1.3 flask-script的使用1.1.3.1 创建Manager实例1.1.3.2 初始化实例出错与解决1.1.4 终端启动1.1.4.1 查看runserver参数1.1.5 自定义添加manager命令1.…

linux篇【11】:linux下的线程<前序>

目录 一.linux下的线程 1.linux下的线程概念 (1)教材上粗略的 线程 定义 (2)线程的引入 (3)线程真正定义 以及 示意图 (4)linux 和 windows等其他操作系统的线程对比 &#xf…

新的趋势:From Big to Small and Wide data

新的趋势:From Big to Small and Wide data 所以,在这个时候,作为率先提出要做 MySQL 开源 HTAP 数据库的 StoneDB,想要稍微冷静一下。 不是说我们不做 HTAP 了,而是有了一个新的思路。这个思路,也同样来…

【亲测】网址引导页管理系统

介绍: 易航网址引导系统-网址引导页管理系统去授权版一款极其优雅的易航网址引导页管理系统, 如果有问题可以跟我反馈,共同进步。祝各位道友一路飞升,顶峰相见!内置12套模板和防墙插件。 项目亮点: 1、…

Redis基础命令(String类型)Value为JSON

目录 String类型(存储的值为JSON形式) 问题: 解决办法: 示例: 实际操作: 总结: String类型(存储的值为JSON形式) 问题: Redis没有类似MySql中的表的概…