追赶ChatGPT,我们的差距在哪里?

news/2024/5/1 6:16:09/文章来源:https://blog.csdn.net/MBNews/article/details/129924295

又一家中国互联网巨头在追赶ChatGPT了。

 3月底举行的博鳌亚洲论坛上,腾讯集团高级执行副总裁汤道生披露,腾讯正在研发AIGC以及大模型相关技术,类ChatGPT的对话机器人也在酝酿中。

百度、华为,如今再加上腾讯,ChatGPT出现之后,中国的互联网科技企业似乎一夜觉醒。不光公司,还有资本及创业大佬。

3月19日,创新工场董事长兼CEO李开复在朋友圈高调宣布,正在亲自筹组中文版ChatGPT公司“Project AI 2.0”。重燃创业野心的也不止李开复,美团王慧文、阿里贾扬清、搜狗王小川、京东周伯文均亲自下场,赶赴大模型赛道。

“大佬攒局”往往是赛道火热的信号,仅今年前三个月,上万家新注册的公司在经营范围中写上了人工智能。企业如雨后春笋般涌现,人才紧俏起来。应了周鸿祎那句话:一人捅破窗户纸,千军万马独木桥。

这一次不光是资本生意,还有需求催生。在人工智能上,以OpenAI为代表的抢跑选手引领自然语言大模型风潮,从产品上甩开中企老远,而中国还没有合格的ChatGPT满足各行各业对AIGC的体验。

腾讯们、李开复们现在做大模型还来得及吗?投入10年的李彦宏说,应用更靠谱。但真正稀缺的,仍然是底层基础设施。

互联网大佬带头组队

作为目前全球最火的自然语言大模型产品,ChatGPT至今不对中国用户开放,背后的算法、芯片、数据更是全部被控制在美国公司手中。国产ChatGPT进入需求井喷期,一大批中国公司赶来,有互联网大厂,有资本大佬,也有创业公司,谁都不想错过这一次的AI革命。

3月19日,创新工场董事长兼CEO李开复在朋友圈宣布,成立Project AI 2.0公司,“不仅仅要做中文版 ChatGPT,”他这个公司定位为AI 2.0全新平台和AI-first生产力应用的“世界级公司”,野心颇大。

一个月前,美团联创王慧文在朋友圈发“英雄帖”,出资5000万美元,要创立新公司打造中国版OpenAI。此外,阿里巴巴“框架大神”贾扬清、搜狗前任CEO王小川、京东曾经的AI掌门人周伯文都表明了同样的意愿。

互联网大佬蜂拥入局,中国企业重燃热情,包括创业企业和上市公司。

企查查数据显示,近三个月共有108601家新注册业企业在经营范畴中标注了人工智能,同比增长超24%。《元宇宙日爆》统计,截至今年3月,已有20家上市公司布局了AIGC相关应用,涉及世纪虚拟人、AI写作、AI视频、AI绘画、AI营销等。

 国内上市公司AIGC相关布局

AIGC创业公司千帆竞发,涉及领域包括上游的底层框架与工具、中游的行业服务、下游的包括文字、图像、视频、音频、游戏等应用场景,创业方向也从C端的娱乐游戏拓宽至工业、金融、医疗、教育等2B领域。不同应用场景已出现了一批代表性的玩家。

 国内创业公司AIGC相关布局

而在底层大模型上,中国互联网科技巨头的动作则最受瞩目,包括百度、华为、腾讯在内大厂均有自然语言大模型布局。

3月16日,百度履行承诺,发布基于文心大模型的生成式AI产品文心一言,27日又面对企业发布了智能云AI底座文心千帆。

3月27日,华为云官网显示,旗下的盘古系列AI大模型即将上线,涉及NLP(自然语言)大模型、CV(计算机视觉)大模型和科学计算大模型(气象大模型)。

3月30日,腾讯集团高级执行副总裁汤道生披露,腾讯正在研发AIGC以及大模型相关技术,并向澎湃新闻表示,正在研发类ChatGPT的对话机器人,对于对于腾讯的聊天机器人是集成到QQ、微信,还是通过腾讯云向B端用户服务,汤道生说:“都会有。”

国内AI“三算”与海外存差距

人工智能在当下的中国展现出全面开花的热闹。而资金雄厚、人才济济的大厂被视作最能与OpenAI比肩的选手。但最早发布产品的百度,其文心一言在文本、代码生成上尚不及ChatGPT的体验,图片生成的效果则被Midjourney拉开了距离。

赛道火热,产品不佳。中国的人工智能发展进入至暗时刻。缺的不仅是有实力的大模型,还有与之直接相关的人才和AI“三算”,即算力、算法、算据。

先是业内爆出,百度文心大模型团队内的研发人员近期受到了其他公司的疯狂追捧,有3年左右相关经验的员工,可以直接给到原先年薪的两倍。而有涉及海内外人才市场的猎头称,诸多互联网大厂的第一诉求就是就是想找OpenAI项目里的华人。猎聘大数据研究院的统计数据也显示,近一年,AIGC相关新发岗位同比增长了42.5%。

抢人大战不仅在国内上演。

由于一大批硅谷AI大牛排着队挤进OpenAI,谷歌一度遭遇AI人才流出。据外媒体统计,近几个月OpenAI已经雇用了超过12名谷歌的AI人才。

但从公开消息看,到目前为止,还没有哪位OpenAI背景的华人专家流入中国大厂。

AI人才紧俏,以芯片为核心硬件基础的算力一直被视为“卡脖子”的状态,而国产大模型的算据也与GPT-4存在肉眼可见的差距,预训练等大模型算法的距离直接以“肉眼可见”的产品拉胯摆在了用户面前。

在算据上,国产大模型也与GPT-4存在差距。

在自然语言大模型中,参数是衡量一个深度学习模型复杂度和能力的重要指标。参数多,意味着模型能够处理更多的数据,学习更多的知识。国外有研究人员将GPT参数规模与大脑神经元做类比,GPT-3的规模与刺猬大脑类似,GPT-4拥有100万亿个参数,基本达到人类大脑的规模。

 大模型参数对比

再看国产大模型,即使是排名靠前的M6大模型,其参数规模也仍与GPT-4相差一个数量级,更多的大模型仍在“原始阶段”。

GPT-4百万亿的参数需要强大的算力来完成训练。算力,同样是AI的核心竞争要素,核心的核心是芯片。

在AI芯片竞争方面,英伟达处于垄断地位,该公司推出的A100与H100是目前性能最强的数据中心专用GPU,市面上几乎没有可替代的方案。ChatGPT的训练用的正是英伟达顶配版A100。

然而,在中美竞争下,A100与H100已被限制出口中国,中国厂商只能用阉割版A800芯片,数据传输速度被降低了30%,影响着AI集群的训练速度和效果。而国产优质芯片,虽能够为预训练大模型提供算力支撑,但仍存在明显差距。

 芯片性能对比

以OpenAI为例,该公司使用了数万块英伟达A100进行海量数据训练和推理。如果以1万枚英伟达A800 GPU为标准,仅CPU采购成本就超10亿美元。

如此现状下,国内的大模型研发机构面临两种选择,“烧钱”购买更多的芯片,等待国产芯片的算力突破。但现在的竞争态势下,等已经等不起了。

高昂的前期投入成本绝非普通创业公司可以负担,还要具备绝对顶尖的研发技术。很显然,AI大模型仍是巨头的游戏。但掌握先发优势的OpenAI以“日更”速度向前跃进,互联网巨头与资本面临着一场“烧钱”硬仗。

OpenAI抢跑 中企如何赶超?

回顾ChatGPT的迭代,OpenAI至少进行了三次技术路线的"自我革命"。

从2018年GPT-1的推出到今年的GPT-4,OpenAI用了近5年。而百度在自然语言大模型的研发上用了10年。

连李彦宏也认为,中国基本不会再出现一个OpenAI,“没有必要再重新发明一遍轮子”,在他看来,“大模型时代,最大的创业机会在应用,”他的判断基于上一次的移动互联网变革,“操作系统其实没几个,最成功的是微信、抖音、淘宝这些应用。”他指出,未来10年,应用领域可能诞生10倍价值的机会。

周鸿祎也在公开场所表示,目前中国发展GPT技术,首先要占据应用场景,同步全力发展核心算法技术。为什么要同步?如果等算法赶上GPT-4再上马,市场就错过了。

另辟赛道,在现有大模型的基础上创新产品应用可能是大部分企业的超车机会。

就像移动互联网时代,尽管中国没有自己的操作系统,但仍有Tiktok这样的超级应用在海外市场杀出一片天。应用先行的优势是能快速的将AI生产力转化为商业价值,这是在移动互联网时代中国互联网企业探索出的超车捷径,也是在激烈的AI竞争中,大部分中企们赶超ChatGPT最经济、最现实的路径。

但由于GPT-3之后,OpenAI的所有模型就没有再开源,GPT-4的运行机制是什么,国内企业仍无从得知。

面对竞争对手全面的科技封锁,中国人工智能想要长期发展就不能没有“根”。旷视科技CEO印奇认为,中国攻坚 AI 大模型目前最重要的是要先能把GPT-3.5复现出来,"这是所有事情的起点"。

无论如何,发展好自身的硬实力,不在关键技术上被“卡脖子”,将是AI时代下中企们无法逃避的“必修课”。

针对国产AI大模型,周鸿祎指出:“发展大语言模型,别人已经指明了技术路线,剩下的就是长期主义指导下的时间问题,”他认为,“中国有能力发展自己的GPT,差距大概2年。”

百度有文心大模型,阿里有M6,华为的盘古大模型箭在弦上,腾讯的混元大模型也在不断迭代。当李开复、王慧文等一众互联网大佬也亲赴大模型战场时,底层的重要价值已经不言而喻了。

就像《三体》故事里的明喻一般,“基础科学”一旦被“智子”锁死,人类便永远失去探索宇宙真相的机会。底层大模型就是那个基础科学,在人工智能上,中国想要超越,不光需要资本、巨头,更需要的是能顶得住研发压力的“面壁人”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_280042.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vuepress复杂网站开发后记

前段时间写了一篇vuepress2的开发文章,很多前端小伙伴看,给了我很多鼓励,写这个的原因是我们的百家饭OpenAPI平台是用vuepress搭建的,最开始选型是因为开始的时候觉得只是一个介绍性的产品网站,所以选型用了类似vue的v…

折叠洗衣机亚马逊美国站UL60335报告如何办理?

洗衣机是利用电能产生机械作用来洗涤衣物的清洁电器,按其额定洗涤容量分为家用和集体用两类。中国规定洗涤容量在6千克以下的属于家用洗衣机:家用洗衣机主要由箱体、洗涤脱水桶(有的洗涤和脱水桶分开)、传动和控制系统等组成&…

绝不告诉你!黑客如何攻击你的Facebook账户

Facebook是全球使用最广泛的社交网络之一。然而,这也意味着黑客会不断寻找攻击用户并窃取他们信息的漏洞。在这篇文章中,我将介绍一些黑客攻击Facebook账户的常见方法,并提供一些保护自己的提示。 1.假冒登录页面 黑客们可以伪造Facebook的…

mycat2 安装 jDK

文章目录进入解压的JDK路径查看完整路径1、卸载系统自带的OpenJDK以及相关的java文件输入java-verison可以看到系统自带的OpenJDK版本信息。命令说明:rpm   管理套件-qa   使用询问模式,查询所有套件grep  查找文件里符合条件的字符串java   查找…

Melis4.0[D1s]:4.测试笔记 - 内嵌的显示命令

文章目录1.配置将显示测试源码包含进工程(默认是包含了)2.不要启动melis桌面系统3.开始测试3.1 disp 命令3.1.1 disp不带参数时,打印显示信息:3.1.2 disp -c 0 8 测试4种颜色3.2 disp_layer_cfg 命令3.3 disp_mem 对显示内存写入内…

企业电子招标采购系统源码Spring Boot + Mybatis + Redis + Layui + 前后端分离 构建企业电子招采平台之立项流程图

项目说明 随着公司的快速发展,企业人员和经营规模不断壮大,公司对内部招采管理的提升提出了更高的要求。在企业里建立一个公平、公开、公正的采购环境,最大限度控制采购成本至关重要。符合国家电子招投标法律法规及相关规范,以及…

如何远程连接SQLServer数据库

如何远程连接SQLServer数据库 准备工作 1.打开 选中如下的连接方式 连接成功后就会出出现 2.连接成功后:右键设置属性 安全性设置:如下图所示 设置连接属性: 设置完成之后点击完成!!! 3.打开 启动sqlSe…

分布式系统事务一致性解决方案

开篇 在OLTP系统领域,我们在很多业务场景下都会面临事务一致性方面的需求,例如最经典的Bob给Smith转账的案例。传统的企业开发,系统往往是以单体应用形式存在的,也没有横跨多个数据库。我们通常只需借助开发平台中特有数据访问技…

一、MySQL 数据库设计

一、MySQL 数据库设计 1.1 为什么需要设计数据库 良好的数据库设计 降低应用程序的开发难度具备高效的查询效率具备良好的扩展性 糟糕的数据库设计 出现数据操作异常、修改复杂、数据冗余等问题影响程序的性能,甚至会导致程序崩溃 数据库设计是对数据库中实体以…

利用 Visual Studio 2022 加速虚幻引擎应用开发

自上次官宣对虚幻引擎的支持后,我们的开发团队一直在努力构建新一代的虚幻引擎集成功能。今天,我们很高兴地向你展示我们所开发的一系列用于提升游戏开发效率的各种新特性。在下面的文章中,你将了解如何查看流式日志,查看 Visual …

【redis】数据同步:主从库如何实现数据一致

如果redis实例宕机了,在恢复期间,无法服务新来的数据存取请求。 redis高可靠性: 数据尽量少丢失(AOF、RDB)服务尽量少中断(增加副本冗余量)-将一份数据同时保存在多个实例上 redis提供了主从模…

系统分析师高频错题集

软件架构设计---软件架构评估 信息系统评价要素包括:功能、成本、可靠性、可用性、存储容量、效率、响应时间等。不同的应用,首选评价指标是不同的,如银行系统,应该重点考虑系统的可用性和可靠性。 软甲架构设计---软件架构评估 …

android BatteryHistorian使用

android BatteryHistorian使用 Batterystats 工具和 Battery Historian 脚本的基本用法和工作流程Batterystats 是包含在 Android 框架中的一种工具,用于收集设备上的电池数据。您可以使用 adb 将收集的电池数据转储到开发计算机,并创建一份可使用 Batt…

了解Mysql

存储引擎 从上图我们可以查看出 MySQL 当前默认的存储引擎是InnoDB,并且在5.7版本所有的存储引擎中只有 InnoDB 是事务性存储引擎,也就是说只有 InnoDB 支持事务。 InnoDB和MyISAM的区别 MyISAM是MySQL的默认数据库引擎(5.5版之前)。虽然性…

2017百度世界大会 爱奇艺创始人CEO龚宇演讲速记

2017百度世界大会如期而来。(好像不对,Robin 说往年都是夏季办)那就改成千呼万唤始出来。 以下是爱奇艺创始人CEO龚宇演讲实录,小编全文呈上,请各位查收: 各位来宾,大家好! 很高兴今…

深力科本周知识小课堂【分立半导体】晶体管(上)基础知识,微电子人的狂欢

深力科本周知识小课堂【分立半导体】晶体管(上)基础知识,微电子人的狂欢 今天,东芝深力科电子将为大家说明一下双极晶体管和绝缘栅双极晶体管。 晶体管大致分为三种类型:双极型、场效应型和绝缘栅双极型。 双极晶体管…

Linux下的JavaEE开发(xftp传输安装、wget安装)

目录 一:jdk的安装(xftp传输安装) 二:Tomcat的安装(不需要配置环境变量) 三:Idea的安装(不需要配置环境变量) 四:Mysql的安装(wget网络安装&am…

千寻驰观亮相公路行业权威年会,开启2023全国路测第一站

千寻驰观亮相中国公路学会养护与管理养护与管理分会第十二届学术年会2023年3月28日至29日,在中国公路学会养护与管理养护与管理分会第十二届学术年会上,千寻位置面向行业全面展示了千寻驰观-道路智能巡检系统“车道级”目标位置估计、像素级的面积计算、…

linux系统编程(5)--进程间通信

1.进程间通讯概念 进程是一个独立的资源分配单元,不同进程之间的资源是独立的,没有关联,不能在一个进程中直接访问另一个进程的资源。 但是,进程不是孤立的,不同的进程需要进行信息的交互和状态的传递等,…

ASP.NET动态Web开发技术第3章

第3章C#编程基础一.预习笔记 1.C#语言概述 using指令表示引用命名空间 //:表示单行注释 /* */:表示多行注释 2.变量和常量 Camel和Pascal 3.数据类型 值类型:简单类型、结构类型、枚举类型,其中简单类型又包含了整数类型&a…