产业大模型刚开卷,京东跑进“最后半公里”

news/2024/4/20 1:04:31/文章来源:https://blog.csdn.net/GZZN2019/article/details/131730203

点击关注

 

姚    悦

王一粟

“京东一直在探索哪些产品、技术、场景可以真正把大模型用起来,在我们内部的场景中反复验证后,才决定在7月份对外发布,现在我们在零售、健康、物流、金融等业务场景里已经积累了一些经验。”京东集团技术委员会主席、京东云事业部总裁曹鹏在群访中,对光锥智能表示。

大模型火热半年,自2月官宣聚焦“产业大模型”后,一直相对低调的京东,也终于展示了自己的言犀大模型。但与此同时,大模型的竞争已经趋于白热化。据不完全统计,当前国内已发布超过80个大模型产品,并已经开始对应不同行业、不同应用场景频繁发力。

究竟什么样的大模型,才能在这番激烈的竞争中突出重围?

一方面,大模型亟需寻找到场景快速落地,另一方面,中国实体产业需要技术驱动来降本增效。

于是,从产业中来,到产业中去,就成了京东大模型自然的选择。

“大模型,让技术帮助产业降本增效的可能性成倍递增。”京东集团CEO许冉认为,从产业段切入大模型,如同从北坡攀爬技术珠峰。道路虽然更加艰难,却有更波澜壮阔的风景。

图片

长于产业的大模型

“言犀大模型训练时,融合70%的通用数据与30%数智供应链原生数据”,IEEE Fellow、京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬告诉光锥智能。

这种大模型训练方式,与此前业界早期普遍认为的并不相同。

“目前,基础模型有三种不同的应用模式:第一种是通用基础模型训练好后,迁移至行业基础模型中,进而做产业(垂直)应用;第二种是通用基础模型进行微调;第三种,则是利用通用大模型+‘知识库和搜索引擎’。”业内人士分享道。

图片

2023京东科技峰会现场

由于前两种的训练成本偏高,且用于通用大模型训练的公开数据“噪声”过大,容易出现错误、谣言、偏见等问题,以至于让AI 存在“幻觉”“一本正经的胡说八道”,无法保障内容真实可信,进而阻碍大模型落地行业。

近期,从OpenAI到国内部分公司,都开始偏向第三种应用路径,而京东也正是走的这条路。“知识库+搜索引擎”,大致可以理解为是产业(垂类)领域的向量数据库,这样的向量数据库与通用大模型结合,被业界称之为“黄金搭档”。

通过这样的路径,“言犀大模型一开始就既具备常识,又具备专业性。相当于是既做了通识教育,又做了四年本科教育”,何晓冬形象地描述言犀大模型的差异性。

京东找到这样的路径,并不是偶然。

从事AIGC领域研究20余年的何晓冬,在2020年开始通过注意力机制、深度学习、Transformer 生成文档、文案,他注意到,用大语言模型直接生成的文案、文字和报告总会出现一些“胡说八道”“玄幻”的现象。

于是,何晓冬和团队提出了知识注入的预训练语言模型(K-Plug),并于2021年发布了相关论文。“京东内部用上更早一点”,何晓冬说,通过K-Plug,让Transformer和行业知识结合,让生成式语言模型的内容生成正确率从83%、85%左右,直接提升到95%以上,才能达到商用程度。

“83%的正确率在to C 用户的聊天中,也可以接受。但是,商用是不可接受的。”何晓冬提到。

GPT能出现智能涌现,依靠的不是数据,而是文本数据中的知识。所以,相比一味的追求超大参数量,数据中的“知识”含量更为重要。

基于20年的行业“知识”积累,京东言犀可以说是“长”在了数智供应链上。

图片

供应链是产业中数据最集中、结构最复杂、相关度最密切的环节。在零售、物流,到健康、保险、工业等场景中,京东沉淀了从采购、分销、交易、物流等产业链条中的巨量数据,并且每天还会源源不断产生大量“活”的交互数据。

在行业中长期积累的“知识”,保障了大模型的可信,极大的帮助大模型落地。

“只有自己的场景才能培养适合自己的大模型应用”,京东集团副总裁、京东科技产品与解决方案总裁高礼强如此说道。

30%的京东数智供应链数据,训练出了产业可用的大模型,而大模型在应用过程中要落地,还需要在具体场景中继续打磨。

在场景中历练,算法与数据的飞轮

“大模型不是我们的目标,而是(产业服务的)工具。”曹鹏表示,大模型不能只用来聊天、画画、吟诗作赋,最终还是要在产业中创造价值。

所以,在语言大模型火热的半年里,京东选择了埋头摸索和尝试,让大模型先在京东的多项业务中历练。

由于AIGC在生成和交互中表现优异,所以在京东健康中落地较快。

图片

AI问诊流程

在京东健康的诸多业务流程中,大模型首先在AI问诊中落地。用户输入“我可以吃阿司匹林吗?”的诉求后,接下来在AI的引导下,通过多轮对话逐步判断病因,给出诊断、用药参考,并进行生活建议,医疗风险提示。

这就是在言犀大模型3.0的基础上,通过医疗知识和经验训练的“慧医千询”大模型,在现场辅助诊疗场景下的具体表现。这背后,是京东健康累计线上问诊数据2.8亿,超3千万高质量临患对话,140余科室医疗专家等数据积累。

如果是一般通用大模型,在遇到患者问题时,更倾向于直接把答案给出。“但是在实际的医疗场景下,是需要多轮对话,才能更深入了解用户病史信息,这样才能给出更适合用户自身特点的方案。”京东集团副总裁、京东健康技术产品部负责人李欣表示。

医疗是和百姓生活息息相关一个行业,其中存在一个著名的“不可能三角”,即医疗服务不可能同时实现高质量、高覆盖、低成本,这本质上是由于优质医疗资源的供给不足造成。

“慧医千询”的出现,目标就是通过远程医疗全流程方案,解决这个“不可能三角”。

李欣透露,“慧医千询”重点会做两个核心场景,“首先是药师的问答,这个非常专业化、具体,是医疗大模型最容易发挥作用的地方,AI自动化可以省去90%的人工工作量。再在这个基础上,推全场景医患问答。”

除了京东健康,大模型在京东物流、零售等方面也大展拳脚。

“电商的产品视频、照片直接由人去拍摄非常贵,少则几百块,多则几千块。”京东集团副总裁、京东科技产品与解决方案总裁高礼强表示,AIGC可以极大的降低商品营销的成本。

图片

目前,基于言犀的AIGC内容营销平台,已经能很好地理解商品特征,自动帮助商家生成商品图片、卖点等营销素材。以每套图为例,成本降低90%,周期从7天缩短到半天。

通过对营销的理解,以及用户运营经验的持续积累,大模型解决了诸如关键性任务,动态适应性、用户体验等问题。本次发布的AI增长营销平台是京东科技市场和平台运营团队依托日常的金融营销工作结合大模型应用的探索,能大幅优化了营销运营流程,降低运营人员的学习成本与操作成本,实现方案生产效率上百倍提高。将过去涉及产品/研发/算法/设计/分析师等5类以上职能才能完成的流程,压缩至1人。同时,一个入口的全新交互模式,让人机交互次数从2000次降低至少于50次,将操作效率提升了超过40倍。

另外,数字人在主播方面的落地也是行业热点,基于京东在电商领域知识增强模型K-PLUG,仅需在直播后台上传商品链接,数字人就能“阅读”商品详情,找到关键的规格、卖点等信息,并自动生成真实、生动、可阅读性强的直播文案。

图片

例如,商家原先写出50个SKU的直播脚本需要至少五小时,使用K-PLUG模型只需要“一键生成”。目前K-PLUG商品文案写作能力已经覆盖3000多个京东的品类,累计生成文案30多亿字。

通过上面场景就可以看到,大模型在产业(垂类)场景中的降本增效非常明显。

当大模型在海量具体场景中使用时,人类真实反馈就会让数据和算法的形成飞轮效应。这期间,高质量数据不断生成,垂直行业的智能涌现才有可能出现。

为了支撑大模型在场景中的历练,京东需要不断在产品和算力方面提升能力。产品方面,日前,京东将积累高质量行业数据的两个平台——数智平台优加DaaS和言犀智能服务都已升级到了3.0版本,进一步提升了交互能力,以及更好地将数据用起来;算力方面,已经布局了全国首个基于SuperPOD架构的超大规模计算集群——天琴α,算力总规模达到135TFLOPS(每秒浮点运算次数)。

六年AI路,三年大模型

种树最好的时间是在十年前。

在大模型突然爆火之前,京东很早已经开始“栽树”。

“技术、技术、技术”,2017年初,京东开始全面向 AI 技术转型。

第一个技术,主要用于解决内部大规模人力带来的效率问题;第二个技术,是组件化、模块化的技术服务对外输出;第三个技术,则是对前沿技术进行探索和有秩序地创新。

2017年底,京东在人工智能的布局就开始落地,一方面聚集团队,通过人才、研究、专利等打造技术护城河;但与此同时,京东也一直在思考一个问题——怎样将这些技术落地产生闭环的商业价值和产品价值?

2018年,人工智能领域科学家何晓冬正式加入京东。2020年,何晓冬团队就开始关注如何利用深度学习的模型。2021年京东开始组建大模型团队,探索深度学习及语音和语言技术在新兴领域等应用场景的落地。

早在2022年,京东就推出了百亿参数的大模型Vega。但直到今年上半年ChatGPT大火,京东虽然在2月份宣布要做服务产业的大模型,但迟迟没有对外公布。

“百模大战”白热化升级,外界都替京东着急了。“有无数的朋友,最近都会跑过来问我,你们京东有没有大模型?什么时候发大模型?”曹鹏在2023京东全球科技探索者大会暨京东云峰会上打趣道。

但这背后,其实回到一个很严肃的问题上,就是京东最初就思考的那个问题——技术的价值,也可以说成是大模型的价值。

“大模型本身是没有办法直接产生价值的,只有放到场景里才能够产生实际的价值。”曹鹏说,“在京东我们真正讲大模型本身会比较少,更多会讲在产业里面、场景里面,怎么能够利用新的技术带来产业变化,真的给产业不断提升效率、改善体验、降低成本,这才是一个技术真正核心的价值所在。”

关于大模型,京东制定了“三步走”战略。第一步,基于内部实践构建言犀大模型和言犀AI开发计算平台;第二步,在零售、金融、健康、物流等京东内部高复杂场景大规模锤炼,并针对重点场景的标杆客户进行对外服务,主要目的是发现那些看起来“不起眼”,但产业应用中又非常关键的问题;第三步,针对严肃商业场景将大模型能力对外开放。

图片

今年上半年,京东大模型走过了第一步,并在第二个阶段有了初步尝试,处于在第二个阶段的深化和逐步向第三步迈进的状态。

大模型不是一天能炼成的。

在 ChatGPT 证明 AGI(通用人工智能)的可能性之前,AI技术长期面临着技术突破遥遥无期、商业落地困难等问题,甚至AI行业自己也一度质疑过人工智能的价值。

但在今年光锥智能观察到一个现象,就是:

人工智能,已经不再是独立的人工智能实验室,而是泛化到所有业务当中。

当 AI 离开实验室,才是价值绽放的开始。

图片

京东对大模型的价值,有自己的理解。许冉在峰会上提出,“大模型的价值=算法×算力×数据×产业厚度的平方”的公式,她强调,当产业效率和产业的边界得到质的提升后,大模型才有了更重要的实际价值和意义,将不亚于又一次工业革命。

欢迎关注“光锥智能”CSDN号,关注前沿科技!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_331313.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java使用JNI实现C文件的调用

1.使用IDEA新建工程 构建最基本的maven类型就行,文件结构如下: 其中最主要的类如下: package org.linx;public class TestJNI {static {/*** 加载jni库,有一个重要的点就是生成的为libnative.so,下面加载代码需要消…

【Maven三】——maven生命周期和插件

系列文章目录 Maven之POM介绍 maven命令上传jar包到nexus 【Maven二】——maven仓库 maven生命周期和插件 系列文章目录前言一、什么是生命周期&why1.三套生命周期2.clean生命周期3.default生命周期4.site生命周期5.命令行与生命周期 二、插件目标三、插件绑定1.内置绑定2…

将媒体公司资产迁移到 Amazon S3 的技术方案

随着媒体公司的发展,他们在仓库中积累了大量的旧磁带和未数字化的视频。这些资产可能很有价值,但以目前的形式很难访问和货币化。此外,将这些资产存储在仓库中既有风险又昂贵。 媒体企业可以通过将其资产迁移到云存储来解决这些问题&#xf…

【C++】面试基础搬运

c/c c三大特性 封装 最开始接触代码是C语言,那么开始写一些逻辑代码的时候会很麻烦,因为你要在函数中定义变量,然后按顺序写对应的逻辑,接着可以将逻辑封装成函数。当时会感觉很麻烦,因为很散装,知道后面…

Nacos报错Could not resolve placeholder ‘order.name‘ in value “${order.name}“怎么解决?

出现这个原因有两个: 1.首先在Nacos配置中心,写入yml配置文件的数据和后端服务在取数据的时候名称不一致 如下图,现在我的配置中心为order-service 看看其中的文件内容信息: 再看看后端是怎么取的: 看出上面错误了吗…

C# IEnumerator 用法

一、概述 IEnumerator 是所有非泛型枚举器的基接口。 其泛型等效项是 System.Collections.Generic.IEnumerator<T> 接口。 C# 语言的 foreach 语句&#xff08;在 Visual Basic 中为 for each&#xff09;隐藏了枚举数的复杂性。 因此&#xff0c;建议使用 foreach 而不…

[每周一更]-(第54期):Go的多版本管理工具

参考 https://zhuanlan.zhihu.com/p/611253641https://learnku.com/articles/78326 前文概要 Go语言从开始使用从1.13起步&#xff0c;随着泛型的支持&#xff0c;带领团队在转型Go的时候&#xff0c;做基础组件架构选型使用1.18&#xff0c;但是Go版本不断迭代想使用最新版本…

3Ds max入门教程:创建尼亚加拉大瀑布模型

推荐&#xff1a; NSDT场景编辑器助你快速搭建可二次开发的3D应用场景 初学者在3ds Max中为尼亚加拉大瀑布建模 这次您将学习通过几个简单的步骤在3ds max中对尼亚加拉大瀑布&#xff08;从远处看起来很逼真&#xff09;进行建模。所以&#xff0c;让我们开始吧&#xff01; …

Flutter:EasyLoading(loading加载、消息提示)

前言 官方虽然提供了内置的加载指示器和提示信息&#xff0c;但是功能比较简陋&#xff0c;这里推荐&#xff1a;flutter_easyloading CircularProgressIndicator CircularProgressIndicator()加粗样式 ScaffoldMessenger.of(context).showSnackBar(const SnackBar(// 提示…

怎么用电脑做动图?常见动图的制作方法

常见的gif图片有两种&#xff0c;一种是通过gif合成功能制作&#xff0c;另一种是由视频转gif动图&#xff0c;那么对于日常不是专业设计出身的小伙伴&#xff0c;该使用什么样的gif制作功能&#xff0c;能够满足两种动图制作呢&#xff1f;下面这款gif制作器&#xff08;https…

UE4 常用控制台命令

ue4执行控制台命令有两种方式&#xff0c;一是在运行时按~呼出控制台输入命令后回车执行&#xff0c;二是调用蓝图函数ExecuteConsoleCommand函数传入参数执行命令&#xff0c;需要注意shipping包无法执行控制台命令 常用命令&#xff1a; Stat FPS 显示帧率 Stat Slate 显示…

快速而简单的视频格式转换方法

在数字时代&#xff0c;我们经常需要将视频文件从一种格式转换为另一种格式。无论是因为兼容性问题&#xff0c;还是为了在特定设备上播放视频&#xff0c;视频格式转换是一项非常常见的任务。本文将介绍视频格式转换的基本知识和步骤。 首先&#xff0c;了解不同的视频格式非常…

【数据结构】之红黑树

红黑树 红黑树的概念红黑树的性质红黑树的插入操作&#xff08;核心&#xff09;情况一&#xff1a;uncle存在且为红情况二&#xff1a;uncle不存在/存在且为黑&#xff08;在同一侧&#xff09;情况三&#xff1a;uncle不存在/存在且为黑&#xff08;在两侧&#xff09;总结 红…

03插值与拟合

9.已知飞机下轮廓线上数据如下&#xff0c;分别用分段线性插值和三次样条插值求x每改变0.1时的y值。 x035791112131415y01.21.72.02.12.01.81.21.01.6 %9.已知飞机下轮廓线上数据如下&#xff0c;分别用分段线性插值和三次样条插值求每改变0.1时的y值。x [0 3 5 7 9 11 12 1…

简单工厂模式详解

文章目录 前言一、简单工厂模式定义二、举个例子三、简单工厂模式的缺点总结 前言 本篇我们了解一下简单工厂模式&#xff0c;它是设计模式的雏形&#xff0c;是学习设计模式的开端&#xff0c;我会结合案例说明它的设计思路。 一、简单工厂模式定义 简单工厂模式并不是GoF23…

【运维工程师学习五】数据库之MariaDB

【运维工程师学习五】数据库 1、常用的关系型数据库2、C/S结构3、MariaDB图形客户端4、安装MariaDB5、启动MariaDB及验证启动是否成功6、验证启动——端口7、验证启动——进程8、MariaDB配置文件路径主配置文件解读&#xff1a; 9、MariaDB的配置选项10、MariaDB客户端连接1、在…

华为云子网路由表作用及价值

子网路由表 子网路由表作用云专线、VPN的配置与子网路由表强关联&#xff0c;本质是在相应的子网路由表中添加了一条路由Nat路由表问题地址变更问题snat和dnat 子网路由表作用 子网内部作为一个二层网络&#xff0c;通过mac地址互通&#xff0c;不通过路由互通。跨子网&#x…

微信小程序安装和使用 Vant Weapp 组件库

微信小程序安装和使用 Vant Weapp 组件库 1. Vant Weapp 介绍2. Vant Weapp 的 安装2.1. 通过npm安装2.2. 构建npm2.3. 修改 app.json2.4. 修改 project.congfig.json2.5. 测试一下&#xff0c;使用Vant Weapp提供的组件 1. Vant Weapp 介绍 Vant 是一个轻量、可靠的移动端组件…

Three.js环境光,平行光,点光源,聚光灯的创建和灯光辅助线的使用

Three.js中的灯光API使用 1.环境光&#xff08;AmbientLight&#xff09;2.平行光&#xff08;directionalLight&#xff09;3.PointLight(点光源) 4.聚光灯&#xff08;SpotLight&#xff09;5.材质平面&#xff08;PlaneGeometry&#xff09;用于接收&#xff08;平行光和聚…

JavaWeb项目【SpringBoot】——图书项目4.0【源码】:SpringBoot版本 springboot相关技术 项目应用

目录 项目简介思考 & 改进1.Jsp都是同步请求---->改成异步Ajax【完成】2.前端用Jsp技术落后----->用Vue框架【完成】3.架构问题&#xff1a;配置数据和Java代码耦合【完成】3.SQL语句和Java代码耦合【完成】4.架构问题&#xff1a;servlet只能处理一个请求5.响应方式…