致敬图灵!HashData拥抱数据智能新时代!

news/2024/4/20 8:15:35/文章来源:https://blog.csdn.net/m0_54979897/article/details/131998313

图片

图1:2023ACM中国图灵大会现场

生于1912年的艾伦·图灵被称为“计算机科学之父”、“人工智能之父”。1966年,国际计算机协会(ACM)为了纪念这位卓越的科学家,设立了以其名字命名的ACM图灵奖,以表彰在计算机领域做出重大贡献的科学家。

时至今日,图灵专注创新、持续探索的精神激励着一代又一代的科学家投身计算机科学的研究,由此带动的IT技术变革也深刻影响了社会和经济的发展。

今天,新一轮人工智能科技革命和产业变革已然到来。自去年年底以来,国内众多科技企业陆续推出大模型产品,并积极推进大模型的行业落地应用。

在AI大模型火热的当下,以“通用智能,人机共生”为主题的2023ACM中国图灵大会于7月28日至30日在武汉召开。酷克数据作为国内云原生数据仓库领军企业,受邀参与本次大会。在会上,酷克数据展示了基于HashData云数仓自主研发的下一代高级分析和数据科学工具HashML,助力 AI 模型生产应用和规模化落地。

三层解耦 降低数据分析成本

AI模型训练需要依托海量的文本、图像和视频数据。如何低成本、高效率地管理与利用数据,是企业在人工智能时代面临的重要挑战。HashData云数仓通过创新的三层解耦架构设计,在保证了数据的一致性的同时,节省了更低的存储和调用资源。

图片

图2:HashData产品架构

HashData的湖仓一体特性帮助企业一站式管理多模态训练数据。产品架构完美适应混合云,最大限度帮助用户实现公域训练数据和私有训练数据的安全、合规、统一管理和调度。云架构带来的充分弹性和并发性,支持几乎无限的横向扩展,满足用户长时间、高密度的数据提取与计算的峰值需求。此外,HashData支持亿级向量存储,为大模型训练提供根本的底层支持。

同时,HashData云数仓能够充分发挥云平台的弹性和扩展能力,并且将数据持久化到底层对象存储,大幅度降低企业进行数据分析的成本。

HashData数据仓库可无缝对接多种公有云和混合云,以统一的平台提供包括数据仓库、数据湖、数据科学、数据工程和数据共享等能力,可以支持千万级的数据库对象、100+PB数据量、数千个并发应用。

此外,通过支持对象存储,HashData能够提供完全兼容多个公有云与混合云的数据管理能力,为企业多云战略的实施提供了灵活易用的解决方案。

两大引擎 高效管理海量数据

在数据智能产业链上,基础设施建设和模型生产应用是AI大模型发展的必由之路,而机器学习是Al成长的重要“抓手”。

传统MPP架构的数据库,在机器学习解决方案存在支持算法种类有限、缺乏数据并行训练、新算法开发难度大等诸多问题,难以满足数据管理和模型开发的需求。

与之相比,HashData拥有两种计算引擎:针对SQL查询分析任务的MPP计算引擎,以及针对机器学习和深度学习任务的ML/DL计算引擎。

基于存算分离的架构,HashData不仅能够通过SQL计算引擎对传统的数仓业务提供很好的支持,还能够借助ML/DL计算引擎实现对机器学习和深度学习的高效支持,其中包括在库内环境对大语言模型进行微调和推理。HashML就是酷克数据利用HashData强大的计算引擎打造的下一代In-Database高级分析和数据科学工具。

 图3:基于HashData双计算引擎架构构建HashML

同时,HashData还实现了对大规模向量数据的高效存储和检索,使得基于知识增强的LLM智能应用搭建变得更加简单。

一步到位 助力大模型规模化应用

AI 模型开发完成后需要在实际生产环境中落地部署,才能最终实现价值。

国际调研机构Gartner的研究表明,只有53%的项目能够从 AI 原型转化为生产。AI生产转化率低的主要原因在于模型全链路生命周期管理存在问题,包括跨团队协作难度大、过程和资产管理欠缺、生产和交付周期长等。

为了解决这些问题,HashML提供了从数据查询处理、高级分析到ML/DL模型的训练、推理和服务部署的全套工具,实现对大语言模型微调和推理的全链路支持。例如,借助HashML,最少用3行代码就可以对LLaMA2模型进行参数高效的微调:

图片

图4:用HashML对LLaMA2模型进行微调

HashML与HashData云数仓共享统一的存储和计算资源,随数仓的部署提供开箱即用、一站式交付的AI能力,大幅降低了系统部署的成本和复杂度,为开发者提供了统一的数据查询、分析、建模环境。

图片

图5:HashML主要功能概览

作为一款算法先进、性能卓越的数据科学工具,HashML能够帮助用户高效、简易地构建、训练和部署模型,极大地降低建模使用门槛,让用户能够在短时间内尝试多种模型架构和参数组合,从而更好地满足多元应用场景的需求。

目前,HashML各项功能正在紧锣密鼓地完善中,预计将于八月发布第一个正式版本。届时,我们将邀请各方合作伙伴共同参与验证测试,推动产品快速迭代升级,加速 AI 落地,让AI惠及各行各业。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_337228.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL | 常用命令示例

MySQL | 常用命令示例 一、启停MySQL数据库服务二、连接MySQL数据库三、创建和管理数据库四、创建和管理数据表五、数据备份和恢复六、查询与优化 MySQL是一款常用的关系型数据库管理系统,广泛应用于各个领域。在使用MySQL时,我们经常需要编写一些常用脚…

【初阶C语言】整数比大小

各位大佬的光临已是上上签 在C语言刷题过程中,一定遇到过很多比大小的题目,那么本节就专门介绍比大小的方法,若大佬们还有更优解,欢迎补充呀! 本节讲解的方法主要有三种:1.条件判断 2.三目操作符 3.函数调…

干翻Dubbo系列第四篇:Dubbo3第一个应用程序细节补充

前言 不从恶人的计谋,不站罪人的道路,不坐亵慢人的座位,惟喜爱耶和华的律法,昼夜思想,这人便为有福!他要像一棵树栽在溪水旁,按时候结果子,叶子也不枯干。凡他所做的尽都顺利。 如…

14 Linux实操篇-进程管理(重点)

14 Linux实操篇-进程管理(重点) 文章目录 14 Linux实操篇-进程管理(重点)14.1 进程的基本操作14.1.1 进程和程序14.1.2 父进程和子进程14.1.3 常见的Linux进程14.1.4 显示系统执行的进程-ps14.1.5 终止进程-kill/killall14.1.6 查…

36.悬浮板

悬浮板 html部分 <div class"container"><div class"square"></div> </div>css部分 *{margin: 0;padding: 0; } body{background-color: #111;height: 100vh;overflow: hidden;display: flex;justify-content: center;align-it…

【小白必看】Python爬虫实战之批量下载女神图片并保存到本地

文章目录 前言运行结果部分图片1. 引入所需库2. 发送请求获取网页内容3. 解析网页内容并提取图片地址和名称4. 下载并保存图片完整代码关键代码讲解 结束语 前言 爬取网络上的图片是一种常见的需求&#xff0c;它可以帮助我们批量下载大量图片并进行后续处理。本文将介绍如何使…

机器学习 | Python实现NARX模型预测控制

机器学习 | Python实现NARX模型预测控制 目录 机器学习 | Python实现NARX模型预测控制效果一览基本介绍研究内容程序设计参考资料效果一览 基本介绍 机器学习 | Python实现NARX模型预测控制 研究内容 贝叶斯黑盒模型预测控制,基于具有外源输入的非线性自回归模型的预期自由能最…

绝美!轮到AI写真爆火了!18种AI视频制作教程;Llama 2微调的极速指南;Nijijourney官方AI绘画课 | ShowMeAI日报

&#x1f440;日报&周刊合集 | &#x1f3a1;生产力工具与行业应用大全 | &#x1f9e1; 点赞关注评论拜托啦&#xff01; &#x1f916; 摄影写真面临AI技术洗牌&#xff0c;一键生成杂志大片的时代来了 软件&#xff1a;midjourney & Stable Diffusion 模型&#xff…

TypeScript基础篇 - TS模块

目录 模块的概念 Export 语法&#xff08;default&#xff09; Export 语法&#xff08;non-default&#xff09; import 别名 Type Export语法【TS】 模块相关配置项&#xff1a;module【tsconfig.json】 模块相关配置项&#xff1a;moduleResolution 小节总结 模块的…

【LLM】大语言模型学习之LLAMA 2:Open Foundation and Fine-Tuned Chat Model

大语言模型学习之LLAMA 2:Open Foundation and Fine-Tuned Chat Model 快速了解预训练预训练模型评估微调有监督微调(SFT)人类反馈的强化学习(RLHF)RLHF结果局限性安全性预训练的安全性安全微调上手就干使用登记代码下载获取模型转换模型搭建Text-Generation-WebUI分发模型…

pytorch的发展历史,与其他框架的联系

我一直是这样以为的&#xff1a;pytorch的底层实现是c(这一点没有问题&#xff0c;见下边的pytorch结构图),然后这个部分顺理成章的被命名为torch,并提供c接口,我们在python中常用的是带有python接口的&#xff0c;所以被称为pytorch。昨天无意中看到Torch是由lua语言写的&…

M 芯片的 macos 系统安装虚拟机 centos7 网络配置

centos 安装之前把网络配置配好或者是把网线插好 第一步找到这个 第二步打开网络适配器 选择图中所指位置 设置好之后 开机启动 centos 第三步 开机以后 编写网卡文件保存 重启网卡就可以了&#xff0c;如果重启网卡不管用&#xff0c;则重启虚拟机即可 “ ifcfg-ens160 ” 这…

【java入门学习】

文章目录 java学习章节目录学习前的准备main函数怎么写&#xff1f;Java程序运行的步骤如何让代码运行起来&#xff1f;java程序由三部分构成&#xff1a;注释注释规范 标识符练习 总结 java学习章节目录 SE语法 初阶段主要来熟悉java的语法&#xff1a; 1.初始java 2.数据类型…

黑苹果如何在macOS Sonoma中驱动博通网卡

准备资源&#xff08;百度&#xff1a;黑果魏叔 下载&#xff09; 资源包中包含&#xff1a;AirportBrcmFixup.kext/IOSkywalkFamily.kext/IO80211FamilyLegacy.kext/OpenCore-Patcher 使用方法&#xff1a; 1.将 csr-active-config 设置为 03080000 全选代码 复制 2.在 …

kafka集群搭建(Linux环境)

zookeeper搭建&#xff0c;可以搭建集群&#xff0c;也可以单机&#xff08;本地学习&#xff0c;没必要搭建zookeeper集群&#xff0c;单机完全够用了&#xff0c;主要学习的是kafka&#xff09; 1. 首先官网下载zookeeper&#xff1a;Apache ZooKeeper 2. 下载好之后上传到…

layui框架学习(33:流加载模块)

Layui中的流加载模块flow主要支持信息流加载和图片懒加载两部分内容&#xff0c;前者是指动态加载后续内容&#xff0c;示例的话可以参考csdn个人博客主页&#xff0c;鼠标移动到页面底部时自动加载更多内容&#xff0c;而后者是指页面显示图片时才会延迟加载图片信息。   fl…

记录vue的一些踩坑日记

记录vue的一些踩坑日记 安装Jq npm install jquery --save vue列表跳转到详情页&#xff0c;再返回列表的时候不刷新页面并且保持原位置不变&#xff1b; 解决&#xff1a;使用keepAlive 在需要被缓存的页面的路由中添加&#xff1a;keepAlive: true, {path: /viewExamine,nam…

怎么在线修改图片?分享一个图片修改工具

无论是在个人或商业领域&#xff0c;我们都需要使用高质量的图片来传达信息或提高品牌形象。大尺寸的图片也会占据大量的存储空间和带宽&#xff0c;影响网站的加载速度和用户体验。因此&#xff0c;我们需要一种高效的工具来解决这个问题。今天向大家介绍一款非常实用的图片处…

Android 开发代码规范

一. AndroidStudio开发工具规范 使用最新的稳定版本.统一文件的编码格式为utf-8. 清除每个类里面的无效的import导包.代码样式统一,比如&#xff0c;tab缩进4个空格&#xff0c;或者 tab size等如果没有特殊情况使用默认的配置即可。每行字数每行字符数不得超过 160 字符&…

C++--菱形继承

1.什么是菱形继承 单继承&#xff1a;一个子类只有一个直接父类时称这个继承关系为单继承 多继承&#xff1a;一个子类有两个或以上直接父类时称这个继承关系为多继承 菱形继承的问题&#xff1a;菱形继承有数据冗余和二义性的问题&#xff0c;数据冗余是由于创建多个相同类型的…