下一个“AI王炸”,别只盯着OpenAI,DeepMind也在憋大招

news/2024/5/6 8:32:45/文章来源:https://blog.csdn.net/R5A81qHe857X8/article/details/130037107

5f272aa824568d64a391dfdb2e02d8c2.jpeg

过去几个月,OpenAI风头无两,各大科技公司争先恐后地跟进大语言模型(LLM)这一技术路线。

对比之下,OpenAI的老对手DeepMind,显得有些低调和沉默。微软靠OpenAI打了一场胜仗,而谷歌推出的Bard翻了车,和谷歌同属AlphaBeta的DeepMind却没有出来力挽狂澜的意思。

同样是半学术、半企业科研性质的前瞻性AI Lab,DeepMind也瞄准了通用人工智能AGI,但实现路径上,却有着和OpenAI不同的选择。

这段时间我们能看到科技圈在集体“追风口”,大量资源(注意力、算力、人才、政策等)都被投入到OpenAI引领的大语言模型热潮中,有些高校甚至出现了“不做LLM就没有算力用”的局面。“中国没有自己的OpenAI”也被认为是创新滞后的现实证明。

有人说OpenAI的AI属于“精英教育路线”,一路砸钱供它读到博士,一毕业就是王炸,惊艳全场,这点确实没错,也是非常值得很多国内AI Lab学习的。

追逐OpenAI的赛道已经十分拥挤。别忘了,DeepMind默默烧钱、长期锚定的很多研究方向,也非常具有前沿性和想象力,2016年的AlphaGo、2020年的AlphaFold都曾一鸣惊人。下一个“AI王炸”,可能就是DeepMind做出来的。

75ccf7e6c8020a314b71bae5b99c0164.png

大家知道有种新闻叫“震惊体”,每一次出现“AI王炸”级产品,就会有大量“震惊体”出现,比如“阿尔法狗要取代人类”“AlphaFold抢了生物学家的工作”“有了ChatGPT人类还有价值吗?”

感到“震惊”,有时真的只是因为知道的太少、太晚,在这些“AI王炸”技术尚在成长阶段,忽视了它们,等能力发展到实用程度,又开始恐慌、焦虑。

届时,我们会不会又会陷入新一轮的追逐跟风,接着抱怨“中国没有自己的DeepMind”呢?

所以,我们不妨来预测一下,DeepMind正在憋的大招里,哪些可能成为下一个王炸,读者们可以有个心理准备,提前对“震惊体”脱敏。

AI要取代科学家,

够不够震惊?

3157b8f303da4bbbd3f5f630e5923bf2.png

ChatGPT走红之后,很多白领人士都担心自己的岗位要被取代了。而科学家可是智力水平站在金字塔顶端的人类,职业生涯肯定稳稳的吧?

AI+科学,正是DeepMind长期锚定的赛道,已经产出了很多突破性的研究成果,覆盖了数学家、物理学家、生物学家的专业领域。

已经问世的AlphaFold和AlphaFold 2就在生物学界掀起了海啸级的影响,彻底改变了蛋白质结构预测的传统方法,也引发了各大高校和科研机构的复现、优化、应用。基于这一新技术,DeepMind一夜之间改变了生物制药行业,也因此成为“数字生物学”这一新兴领域的先驱。

目前,AI+生物学的潜力还没有完全释放出来,AI技术在生物制药和生命科学中的应用,还停留在少数环节中探索、案例级尝试的阶段。DeepMind也正在与行业展开合作,比如与Isomorphic Labs 合作,以“AI-FIRST”原则重构药物发现过程,在著名的生物医学研究中心弗朗西斯·克里克研究所(Francis Crick Institute),建了一个湿实验室,加强AI技术与生物实验的结合,同时还在不断扩大AI for science团队,加快基础生物学的研究。

或许,下一个抗癌新药、生物计算领域的大突破,就会在DeepMind诞生。

5324c90099bab459511ac384d93a8b40.png

(AlphaFold揭示了蛋白质宇宙的结构)

 你可能会说,生物学是一门实验科学,有成熟的程式,被AI技术改变很合理。数学、物理这样的基础科学,突破几乎来自天才式的直觉和灵感,有的数学家甚至是在梦中取得突破。比如阿基米德就是在洗澡时灵光一现,发现了浮力定律;拉马努金在梦中发现了3900个公式……AI估计就不好使了吧?

数学、物理,这些涉及抽象世界和人类深层直觉的领域,DeepMind也已经取得了突破。

帮助数学家发现他们从未发现的发现——DeepMind发表在《自然》杂志上的一篇论文显示,研究人员与顶级数学家合作,为一个几十年来都没有结局的数学猜想,通过机器学习(ML)找到了突破口。

使用AI来处理海量或无法直接推理的数据,可以大大增强数学家的洞察力,从而更快地找到证明猜想和新公式的方法,已经被DeepMind证明是可行的。

牛津大学数学系教授Marcus Du Sautoy形容AI技术在纯数学中的应用,“就像伽利略拿起望远镜,能够深入凝视数据宇宙,看到以前从未发现过的东西”。

未来随着探索的增多,很多未被证实的数学猜想,都有可能因AI的加入而突破。希望届时大家不会又以为AI进化出了什么超能力,被“AI取代数学家”之类的标题给骗了。

42b4de588507ca9c084c9ceddce3926e.png

AI参与核聚变的研究进程——核物理无论从学术还是社会政治经济的角度,都是非常重要的。大家可能都听过中国核物理学家造原子弹的艰苦故事,其中很多工作和牺牲能不能由AI来代劳呢?DeepMind还真搞成了。

它们与瑞士等离子体中心,合作开发了一个AI系统,通过强化学习,控制系统可以很好地协调TCV(由许多磁线圈组成),确保等离子体永远不会接触容器壁,这样就可以减少核聚变的热量损失。同时,还能将等离子体精确地雕刻成不同的形状,方便科学家研究等离子体在不同条件下的反应,从而提高对核聚变反应堆的理解。

e3371c9e3966d9f15cfd3b5038afccef.png

总之,在过去的几年里,DeepMind在数学、物理、化学、生物学、量子、气象、材料等多个科学领域,创造性地探索了大量AI for science的可能,带来了全新的科学研究方法,必然会催生全新的科学发现和技术突破,下一个“AI王炸”很可能就在其中。

cffebb82af8ccb3b2e6aeeb62f15cdb3.png

现实版《西部世界》

够不够炸裂?

DeepMind的目标也是实现通用人工智能。具体怎么做呢?OpenAI专心搞语言,DeepMind就专注“训狗”——搞强化学习。

弱人工智能,只能在有限的环境中解决特定问题,没有发展出人类身上那种通识智能。那种“通用”智能的机器,大概就类似于《西部世界》或者《底特律》中的机器人,能够在复杂的环境里执行任务。

实现AGI,OpenAI是用大量数据和充分训练来促成大语言模型的“智能涌现”,而DeepMind则选择了“正向教育”——希望通过强化学习,给AI系统以“奖励最大化”的刺激,驱使智能体自主去学习复杂的能力。因为只有表现出这些能力,智能体才能获得奖励(比如生存下去)。

听起来,是不是跟工作犬执行主人的口令,主人根据结果来进行奖励或惩罚是一个路子?

在一篇论文中,DeepMind的研究人员写道:“奖励足以推动智能体表现出通用智能的迹象和行为,包括学习、感知、社会智能、语言、概括和模仿。”

上一只震惊世界的狗是击败人类棋手的“阿尔法狗(AlphaGo)”,而下一只可能就是被DeepMind用强化学习训练出来的AI了。

e42441fcde04b83304cdbddd2a1d30da.gif

(ANYmal机器人的运动技能是通过模仿狗MoCap来学习的)

比如这只机器狗,就通过强化学习不断试错,从而具备了两个重要的能力:

一是使用历史经验,一般来说电机控制的AI智能体,一开始不知道对每个关节施加什么力,需要大量数据才能迈出步子,不然就会随机抽搐并迅速摔倒,而借助RL可以利用以前学到的运动技能,从而缓解“起步”时的尴尬。

二是减少特殊行为,此前智能机器人一般会用一种很不自然、不够人性化的方式来避障,虽然看起来很有趣,但不够实用。DeepMind采用强化学习训练,偏向于让智能体学习更多的自然行为,可以安全高效地控制真实世界的机器人/机器狗,将机械控制与认知智慧相结合。

类似的强化学习实验还有很多,比如让智能体在网络游戏中展开随机互动,让智能体在模拟的三维世界里搭积木、打扫房间……基本逻辑都是基于人类反馈的奖励模型。

ChatGPT只能解决语言问题,《西部世界》里的人机融合新物种,更灵活的通用家政机器人,可能还真得靠DeepMind的强化学习路线来实现。

像人脑一样思考的AI,

够不够有趣?

e1f7fb33abaaeae5b56d875b2c39ad71.png

DeepMind虽然没有跟风推出类ChatGPT的大语言模型,但并不代表它对这个领域毫无建树,只不过二者关注的技术方向不太一样罢了。

随着使用者的增多,大家可能都发现了类ChatGPT模型的一些限制,比如非常注重数据和语料。

深度学习靠规模数据、庞大算力、充分训练而“大力出奇迹”的暴力美学,在大模型时代发挥到了极致。

这带来了一系列问题,比如中文语料不足,训出来的大模型效果不好,有的中文LLM会用英文语料进行训练,再将答案翻译回中文,这种做法当然是符合业界常规的,但问题在于很多价值观、常识性的东西,是没有办法对齐和翻译的。

而且“暴力计算出奇迹”的大炼模型,打造的语言模型是不可解释的黑盒,金融、政务、工业等行业是不敢用的,无法支撑可靠的决策。

不知道OpenAI和国内厂商打算怎么解决“暴力计算”的弊病,反正DeepMind倒是一直在琢磨不同的路线——不搞暴力美学,大搞神经科学。

0bad1e00eef4758137712261d1ff47e8.png

DeepMind认为大脑才是机器智能模仿的对象,希望通过对脑科学、神经运动学、元学习等“人类本位”的研究,来提升深度学习模型的鲁棒性、可解释性、可靠性等,让AI达到人类水平的理解能力。

比如重新认识大脑的工作机制,借鉴多巴胺通过调节神经元之间突触连接的强度,提出了一种基于奖励的强化学习理论;在3D游戏世界中创建了模拟心理学实验室Psychlab,能够实施经典的心理实验,显著改进了智能体UNREAL的性能;发现在人工神经网络倾向于避开精确设计的代码,倾向于对成本函数进行暴力优化(不追求奖励最大化,而是追求成本最小化,不做错就没有损失),而人脑的机制却往往会专注在任务实现和奖励上,从这个角度去优化深度神经网络的结构。

2023年发表的一篇新论文中,DeepMind则针对大脑中的回放(replay)机制,提出这是一种组合计算的形式,可以衍生出新的知识,在神经网络中整合回放机制,有望让AI用极少的数据学到新东西,提高认知智能,更接近“智能涌现”。

大脑的智慧让人类爬上了万物之灵的宝座,AI不靠人工而靠智能,为什么不可能呢?

d36d2bccd91bcadedf7a42dca187797e.png

当初OpenAI要走NLP这条“冷门”的路,很多人也觉得不可能,直到产品虽不成熟、但能力十分惊艳的ChatGPT出现,人们才开始纷纷夸赞OpenAI的长期主义。这些年DeepMind默默搞的研究,可能就是下一个“王炸”。

我们都希望中国AI也能诞生影响世界的元创新,其实AI领域并没有那么多独门秘技,很多灵感或技术路线都是公开的,但我们为什么总是听过就算、见过就忘呢?

除了灵光一现的idea, OpenAI和DeepMind不断投入的耐心,强大的工程能力,前沿研究与商业化的平衡,也是值得学习和借鉴的。

不能总是热泪盈眶,总是不长记性,直到下一个《震惊!XXX的XXX又颠覆世界了》……

e18b5c30f63ebb537e0f987c6340bea0.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_283900.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

5.5G,运营商能接受吗?

2月份,我在巴塞罗那参加MWC 2023时有个发现。欧洲通信设备商大多在宣传和讨论6G相关技术,中国通信设备商却在重点展示5.5G,或者叫做5G-Advanced。而全球各国的运营商则都普遍处在比较观望的状态里,两头考察,多样化尝试…

中间表示- 到达定义分析

基本概念 定义(def):对变量的赋值 使用(use):对变量值的读取 问题:能把上图中的y替换为3吗?如果能,这称之为“常量传播”优化。 该问题等价于,有哪些对变量y…

OPNET Modeler 例程——创建一个移动无线网络

文章目录一、例程概述二、创建天线模型三、创建指向处理器四、创建节点模型1.发射机节点模型2.干扰发射机节点模型3.收信机节点模型五、创建网络模型六、收集统计量并运行仿真七、查看仿真结果总结一、例程概述 OPNET 无线模块支持地面和卫星无线系统的构建。在此例程中将构建…

【C++】基础篇

C基础篇什么是C命名空间命名空间的三种使用方式C的输入和输出缺省参数缺省参数分类函数重载引用引用的使用场景常引用指针和引用的区别auto关键字auto使用细则auto不能推导的场景基于范围的for循环范围for的使用条件指针空值nullptr什么是C 1982年,Bjarne Stroustr…

微服务+springcloud+springcloud alibaba学习笔记【Eureka服务注册中心】(3/9)

Eureka服务注册中心 3/91、服务注册与发现1.1 什么是服务治理:1.2 什么是服务注册与发现:1.3 Eureka服务注册与发现2、单机版eureka2.1 创建module2.2改pom依赖2.3写yml配置文件:2.4主启动类2.5 修改服务提供者 cloud-provider-payment8001 模块&#xf…

GFS的卷类型与集群实验文档

GlusterFS 支持七种卷,即分布式卷、条带卷、复制卷、分布式条带卷、分布式复制卷、条带复制卷和分布式条带复制卷。我们常用的有前五种,今天我们就来看一看这五种卷都有什么优缺点。 一、分布式卷(Distribute volume) 文件通过 H…

【模型复现】resnet,使用net.add_module()的方法构建模型。小小的改进大大的影响,何大神思路很奇妙,基础很扎实

从经验来看,网络的深度对模型的性能至关重要,当增加网络层数后,网络可以进行更加复杂的特征模式的提取,所以当模型更深时理论上可以取得更好的结果。但是更深的网络其性能一定会更好吗?实验发现深度网络出现了退化问题…

python玄阶斗技--tkinter事件

在前一篇文章中,我们已经了解是tkinter的一些标签的使用,但一个GUI程序除了让别人看到,还要有一些交互操作,实现人机交互的方法我们称为事件,通过事件分为:鼠标事件,键盘事件和窗口事件。接下来…

Neo4j初学者使用记录(在更)

打开Neo4j cmdR 输入neo4j console 浏览器中输入框中网址:http://localhost:7474/即可打开 新建库 服务器版需要更改配置文件,若neo4j服务正在运行,则按Ctrlc,停止该服务。 配置完后,再重新开启服务,刷新…

如何利用ventoy制作Linux to go (把deepin放到U盘里)

准备工作 最新版本 – 深度科技社区 (deepin.org) deepin镜像官方下载即可 Releases ventoy/vtoyboot GitHub ventoy启动插件选择1.0.29版本 Downloads – Oracle VM VirtualBox VirtualBox虚拟机官网 ventoy下载 VentoyRelease (lanzoui.com) 选择下载1.0.29版本 vento…

第五十八章 线段树(一)

第五十八章 线段树(一)一、树状数组的缺陷二、线段树的作用三、线段树的基本构成1、节点定义2、线段树的结构四、线段树的重要函数1、构造线段树——bulid函数2、查询区间——query函数3、单点修改——modify函数五、例题一、树状数组的缺陷 在前面两个…

对于电商行业来讲,真正决定它的并不是规模,而是载体

纵然是在现在这样的情况之下,我们依然无法用「格局已定」来形容和阐述现在的电商市场格局。这一点,我们可以从以抖音、快手为代表的电商新势力的崛起当中,看出一丝端倪。对于电商行业来讲,真正决定它的并不是规模,而是…

Dart中的异步

一 事件循环 flutter 就是运行在一个root isolate 中 程序只要运行起来,就有一个事件循环一直在运行 ,直至程序退出。 EventLoop 先从mrcro 对列中取任务,取完任务再去 event 队列中取任务。队列任务是FIFO。 二 认识Future abstract clas…

[JavaEE]----Spring03

文章目录Spring_day031,AOP简介1.1 什么是AOP?1.2 AOP作用1.3 AOP核心概念2,AOP入门案例2.1 需求分析2.2 思路分析2.3 环境准备2.4 AOP实现步骤步骤1:添加依赖步骤2:定义接口与实现类步骤3:定义通知类和通知步骤4:定义切入点步骤5:制作切面步骤6:将通知…

C++内存管理(new和delete)

目录 1. new/delete操作内置类型 2. new和delete操作自定义类型 3. operator new与operator delete函数 4 .new和delete的实现原理 1 .内置类型 2 .自定义类型 new的原理 delete的原理 new T[N]的原理 delete[]的原理 5. 定位new表达式(placement-new) 6. malloc/f…

使用Process Explorer和Clumsy定位软件高CPU占用问题

目录 1、问题描述 2、使用Process Explorer初步找到CPU占用高的原因 3、使用Clumsy工具在公司内网环境复现了问题 4、根据Process Explorer中的函数调用堆栈,分析源码,最终找出了问题 5、总结 在排查项目客户的视频图像闪烁问题时,无意中…

Centos7安装部署Jenkins

Jenkins简介: Jenkins只是一个平台,真正运作的都是插件。这就是jenkins流行的原因,因为jenkins什么插件都有 Hudson是Jenkins的前身,是基于Java开发的一种持续集成工具,用于监控程序重复的工作,Hudson后来被…

JavaScript基础-02

常量(字面量):数字和字符串 常量也称之为“字面量”,是固定值,不可改变。看见什么,它就是什么。 常量有下面这几种: 数字常量(数值常量)字符串常量布尔常量自定义常量…

【MATLAB数学建模编程实战】Kmeans算法编程及算法的简单原理

欢迎关注,本专栏主要更新MATLAB仿真、界面、基础编程、画图、算法、矩阵处理等操作,拥有丰富的实例练习代码,欢迎订阅该专栏!(等该专栏建设成熟后将开始收费,快快上车吧~~) 【MATLAB数学建模编…

[LeetCode周赛复盘] 第 340 场周赛20230409

[LeetCode周赛复盘] 第 340 场周赛20230409 一、本周周赛总结二、 6361. 对角线上的质数1. 题目描述2. 思路分析3. 代码实现三、6360. 等值距离和1. 题目描述2. 思路分析3. 代码实现四、6359. 最小化数对的最大差值1. 题目描述2. 思路分析3. 代码实现五、 6353. 网格图中最少访…