全球无人驾驶大洗牌,百度Apollo Day宣告Robotaxi进入2.0时代

news/2024/4/30 4:54:54/文章来源:https://blog.csdn.net/shenzhoubb2017/article/details/128107446

作者 | 德新

编辑 | 王博


c1937df51548735fd693b0a23c4d35f8.jpeg

1. 全球无人驾驶大洗牌,Robotaxi越发向头部聚集

全球无人驾驶落地正呈现两幅面孔。随着资本热潮褪去,一部分公司在资金和研发上已经难以为继,Robotaxi落地的资源和希望,正无限向头部公司聚集。

10月,Argo宣告关闭,员工将分流至福特和大众,并转向量产自动驾驶的研发;

9月,Aurora Innovation寻求出售,目前市值已跌至15亿美元,不足其鼎盛期的1/10;

ZOOX卖身亚马逊之后,一部分研发转向无人配送,而今年又有消息传出,亚马逊关闭了部分无人配送项目。

假如把L4无人驾驶比喻成一座山峰,过去五六年间涌现的那些技术公司们,正在进入更难更险的路段。

观察头部公司们的表现,实现「无人化」的突破是一个关键的分水岭。那些跨过「无人化」的公司仍在快速挺进,与行业中的裁员、关停呈现完全不同的一番景象。

Waymo近期获得加州CPUC批准在旧金山、湾区部分城市等区域向公众提供无人驾驶网约车服务;并且宣布了和极氪合作的新进展,基于概念车ZEEKER M-Vision打造量产车,车型将在2024年具备量产条件。

继今年早些发布量产车Apollo RT6之后,百度也在本周举行Apollo Day,第一次完整系统地向外界阐述了Robotaxi无人化落地新阶段的思考。多位技术大牛,分享了大量百度在过去十年中的珍贵经验和独到的技术判断。

百度也宣布,2023年将扩大业务规模,在更多区域开展全无人自动驾驶运营,着力打造全球最大的全无人自动驾驶运营服务区。

浪潮滚滚向前,头部公司们吹响了Robotaxi大规模落地的冲锋号。


2. Robotaxi 2.0时代:百度Apollo的技术判断

本届百度Apollo Day的一大看点,是百度Apollo以及百度研发体系的多位大牛集体登场。

更精彩的部分是基于百度的AI、计算机视觉、地图等的技术体系,Apollo的思考和技术判断。

非官方的说法是,这是一场「价值百万」的技术分享。以百度十年千亿级的研发投入来说,这场分享价值百万毫不为过。

我们先从陈竞凯的分享讲起,他首先纲领性地抛出了Apollo的几个技术选择:

bb4feeb7baab796e9e0ae4ec4676f31b.jpeg

  • 工程化的技术体系

打造能大规模落地的Robotaxi,核心是搭建安全、可规模化、智能高效的自动驾驶系统。从系统设计上有两种思路:一种是偏向学术派的,统一建模、端到端的解决方案;另一种是工程导向的,做系统拆分,逐个突破。

端到端的解决方案存在很大的不确定性,虽然技术发展迅速,但到底在未来两年还是十年能取得突破仍是未知的。目前百度Apollo的技术搭建仍然沿着工程化的思路,将车载体系大致分为:地图、感知、预测决策、规划控制四个大块。

  • 高精地图不是阻碍,而是助力

行业今年提出了「重感知、轻地图」的思路,原因是地图资质难、成本高、难获取。而百度认为高精地图≠高成本的阻碍,难点在于车辆第一次通过已经变更的现实世界时,如何安全通过,解决方案是实时地图与离线高精地图的融合。

  • 多模态前融合感知,而非纯视觉

以特斯拉为代表,行业今年在传感器选择上出现了较大分歧。百度的判断是,充分发挥各传感器的优势,并且在发展过程中将后融合方案转为前融合方案。

  • 学习型PnC是实现全无人的必由之路

百度最初的预测和决策是分立的两个系统模块。预测由数据驱动,而决策规划控制是基于规则的方案。规则系统的问题是随着系统迭代,策略分叉导致投入产出比越来越低,且面对城市扩张、场景变化时,不仅需要分支节点的调整,而是需要从主干到分支的全面调整,基于规则的PnC是难以规模化的。

因此,百度的思路以渐进的方式,以学习型的系统来吸收规则系统,数据驱动PnC的迭代,同时规则也作为安全的兜底。

  • 数据是仿真系统的灵魂

仿真系统的价值不仅是针对单一场景进行模拟,而是对每次迭代带来的系统表现变化进行完整的评价。

因此仿真系统结合大规模的数据分布来构建是必须的,数据是仿真系统的灵魂。将真实世界事件发生的概率与仿真挂钩,才能在仿真系统一个相对扭曲的分布中,获得更准确的对系统能力的度量。


3. 迈向全无人:Apollo的核心技术支柱

随着百度在重庆、武汉开展全无人的商业运营试点,以及Apollo RT6的量产推进,百度下一阶段的目标是:持续扩大业务规模,在更多区域开展全无人运营,打造全球最大的全无人驾驶运营服务区。

Apollo Day上也展示了面向更大范围的无人化,百度Apollo当前几个关键的技术支柱。


3.1  轻成本、重体验的地图,是L4系统达到99.99%的关键

当下「重感知、轻地图」的趋势,是一种从成本出发的技术主张。而百度Apollo坚定认为只有用上了高精地图,L4自动驾驶才能达到99.99%的成功率。比如当道路标识出现遮挡、污损、新旧重叠时,单靠实时感知无法应对。

Apollo的勇气来自于,百度是行业内唯一一家既懂地图又深耕自动驾驶的公司。

4902c0529074c016e7d9a042f5af7f69.jpeg

高精地图要大规模应用,首先要降本。从百度的经验看,2020 - 2022年Robotaxi高精地图单公里生产成本逐年明显下降。目前,百度高精地图构建自动化率达到96%

大规模地图生产的难点是自动化的数据融合,关键是融合的绝对/相对精度要达到厘米级。在数据融合上,百度做了3方面的技术创新:多层级的图优化;场景化关联和匹配;以及基于学习的匹配算法。

其次是提升体验。

百度地图本身有超过1200万公里的路网覆盖,日均20亿公里的轨迹数据,通过向数亿的司机学习,形成全路网级的驾驶知识图谱。这个图谱包括:行驶速度、变道时机、变道轨迹等等。这一层输入,是自动驾驶由笨拙变得顺滑的关键。

第三是通过百度地图和智能交通技术,提高通行效率。


3.2 文心大模型,2.0时代的多模融合感知体系

「大模型,已经成为自动驾驶能力提升的核心驱动力。」这是王井东的观点。

百度Apollo自动驾驶感知1.0,是以激光雷达为主,加入环视、毫米波的后融合感知方案,后融合是以规则驱动的,因此泛化能力不够。

感知2.0是多模态、前融合、端到端的方案为主;除此之外,补充以远距离的视觉感知以及近距离的鱼眼感知。大模型在其中发挥的作用,包括数据挖掘、数据标注等等。

自动驾驶有几类典型难题:

· 远距离物体感知;

· 激光雷达升级点云变化,引发的数据重标注挑战;

· 长尾数据挖掘,比如异形车、行人、低矮物体等;

文心大模型的应用,主要是用大模型提升车载小模型的感知能力;并且可以利用弱监督预训练的方式挖掘长尾数据。

自动驾驶数据集中,2D数据容易获取,3D数据获取相对困难。可以利用2D标注数据和3D标注数据,迭代自训练的方法得到一个效果不错的感知大模型,再利用大模型对数据进行3D的伪标注,同时使用模型蒸馏的方法,获得感知效果比较好的小模型。


3.3 高提纯、高消化的数据闭环是如何设计的?

无人车跑得越远,会遇到各种意想不到的场景,比如羊群过马路。解决罕见、长尾场景,是数据闭环的价值。与感知、规控、决策的技术栈相比,大规模数据闭环的建设是行业里的崭新命题。

6549781f4ee347d23f94e2f41580c5c9.jpeg

数据闭环的前半是大量数据带来的存储和标注的压力,后半是大规模数据用于训练的计算量需求暴增。百度Apollo设计的数据闭环,核心是解决「高提纯、高消化」的问题。

在数据提纯上,百度的方案是利用车端小模型+云端大模型,做高效的挖掘和自动化标注;数据消化架构,实现自动化训练,具备联合优化和数据分布理解的能力,利用高纯度的数据进一步提升自动驾驶系统的整体智能水平。除此之外,训练、推理以及数据分布在数据消化过程中,形成有效的反馈机制,进一步提升数据消化的整体效率和效果。


3.4 L4与L2+共生,百度的独家秘技

百度是行业内第一家同时具有L4 Robotaxi技术和量产L2+辅助驾驶方案的公司。

其内部的判断是:2023年具备城市道路辅助驾驶能力的产品上市后,会带动C端用户需求,并在2025年引发消费者对高阶辅助驾驶/自动驾驶的需求爆发。

百度的L2+ 领航辅助驾驶产品ANP 3.0 将在2023年夏天在首家客户的车型上量产上市,支持复杂城市道路场景,并且衔接融通高速和泊车场景。

ANP 3.0的硬件是双Orin-X芯片,部分配置800万像素摄像头,搭载半固态激光雷达。从技术特点来讲,ANP 3.0的视觉感知和激光雷达感知,是两套独立运行、低耦合的系统。

背靠百度Robotaxi的数据积累,ANP 3.0在BEV的数据供给上有先天优势,融合LiDAR信息的L4感知结果可以作为BEV模型的标注数据,直接用于模型预训练。目前,百度Robotaxi的累计里程超4000万公里。

其次ANP使用了一套为智驾规模化轻地图方案,提升安全,也降低制图成本。

百度内部认为实现无人驾驶商业化的最佳路径是:

前期在限定区域实现技术积累,通过技术降维和L4数据,为L2+产品做热启动

更长期看,利用L2的规模优势,提前收集L4泛化所需要储备的长尾问题

内部预期未来3 - 5年内,百度领航辅助驾驶产品搭载量有望突破百万,百万级的车辆营造的数据壁垒也将有效成为L4的技术护城河。


3.5 One more thing:自研昆仑芯片

目前,百度自研的昆仑芯片已经量产了两代,实现数万片的商业化部署。第三、第四代产品都在研发中,三代芯片预计明年量产,四代芯片后年量产。

a38b71da971a481f1fd581abc2b59b39.jpeg

作为一款云端通用人工智能计算处理器,昆仑芯CEO欧阳剑介绍,昆仑芯主要是几大优势:是业界为数不多大规模部署的AI芯片,具备完善的生态,灵活易用。

自动驾驶的业务和模型算法复杂度不亚于数据中心,而昆仑在数据中心积累的优势可以很好地移植到自动驾驶上。

目前昆仑芯二代已经在百度的Robotaxi系统上进行了完整的适配,并开始道路测试。


4. 什么样的公司有望无人驾驶落地的胜利?

今年无论是特斯拉的AI Day,还是百度的Apollo Day,众多科技公司的开放日都变得极其技术化。

一方面,面对自动驾驶、机器人这些尖端前沿的话题,行业公司尝试开放一部分的思考加速整个行业的技术推进;另一方面,公众对无人驾驶的商业应用、技术实现和使用体验也逐渐显露出了浓厚的兴趣。

无人驾驶/自动驾驶/高阶辅助驾驶的落地,是安全、成本、体验的极致平衡。与无人驾驶相比,辅助驾驶更重成本和体验;而无人驾驶首重安全和成本

一位业内人士评价:L2与L4之争,好比是飞机和火箭。L2进阶,飞机越飞越快、越飞越远,但仍然难以到达月球,这是本质上架构设计的不同。头部的L4公司已经淌过了近10年的坑,在无人驾驶落地上将持续领先。

目前L4 Robotaxi已经可以在国内的部分城市在特定区域,可以开展无人化的商业运营,下一阶段的难点是:成本下降和规模部署。

好消息是:

成本下降,已经点连成线。依托辅助驾驶的大规模量产,在关键零部件上激光雷达、大算力芯片的成本已经大幅下降。以百度为例,第六代量产无人车Apollo RT6成本仅为25万元,相当于一辆普通新能源汽车的价格。

法律法规也逐渐开放。重庆、武汉落地无人化试点,北京在本月开放了前排无人,深圳试点L3立法,广深发放首批城市高精地图许可。

什么样的公司能迎来无人驾驶落地的胜利?要有雄厚的资金资源实力持续投入;体系化的AI能力积累;工程能力与对汽车安全的深入理解。

过去一年,百度萝卜快跑的运营范围遍及北京、上海、重庆、武汉等10多个城市,超过了Waymo等厂商,成为全球最大的自动驾驶出行服务提供商。

萝卜快跑累计订单量达到140万单,上个季度公众累计乘车47.4万次;在部分地区,单车每日完成15次以上出行服务,已经与传统网约车服务相当接近。

无人驾驶在技术研发上遇到的问题越来越难,头部公司也越发看到胜利的曙光。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_228013.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OVS DPDK VXLAN隧道处理

在学习OVS VXLAN实现之前,我们先回顾一下传统VTEP设备是如何处理VXLAN报文的。如下图所示: vxlan报文进入交换机端口后,根据报文头部信息进行vxlan隧道终结。隧道终结后,根据underlay信息进行overlay映射,得到overlay的…

鲲鹏devkit性能分析工具介绍(四)

鲲鹏devkit性能分析工具介绍(四) 前面我们已经介绍了鲲鹏devkit性能分析工具的全景分析、热点函数分析、进程/线程分析、微架构分析、和访存分析,由此可见进行性能调优绝对不能够仅仅去进行一方面的考察而是需要全方面的数据分析进行一定的舍…

8、多进程之间的通信

多进程之间的常用通信方法有两种,及Queue和Pipe 一、Queue Queue([maxsize]):创建共享的进程队列。maxsize是队列中允许的最大项数。如果省略此参数,则无大小限制。底层队列使用管道和锁定实现。另外,还需要运行支持线程以便队列中…

[附源码]计算机毕业设计springboot基于Web的软考题库平台

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

[论文阅读] Curriculum Semi-supervised Segmentation

[论文地址] [代码] [MICCAI 19] Abstract 本研究调查了半监督CNN分割的课程式策略,它设计了一个回归网络来学习图像级信息,如目标区域的大小。这些回归被用来有效地规范分割网络,约束未标记图像的softmax预测,使其与推断的标签分…

16-JavaSE基础巩固项目:拼图小游戏

阶段项目-拼图小游戏 一、项目介绍 1、目的 锻炼逻辑思维能力,让我们知道前面学习的知识点在实际开发中的应用场景。 1、为了学习一个新知识:GUI GUI全称:Graphical User Interface(又称图形用户接口)是指采用图形化…

【Android进阶之旅】内存泄漏的危害有哪些?(案例分析)

随着计算机应用需求的日益增加,应用程序的设计与开发也相应的日趋复杂; 开发人员在程序实现的过程中处理的变量也大量增加,如何有效进行内存分配和释放,防止内存泄漏的问题变得越来越突出 例如: 服务器应用软件&#x…

Redis 内存淘汰和过期删除策略

提起使用Redis的优点,大家可以列举出许多,比如:数据存储在内存,读写速度快,性能优异。比如数据持久化,便于数据备份及恢复等等。 分布式服务系统平台发展至今,Redis活跃在平台的各个领域&#…

RabbitMQ事务消息

通过对信道的设置实现 channel.txSelect();通知服务器开启事务模式;服务端会返回Tx.Select-Ok channel.basicPublish;发送消息,可以是多条,可以是消费消息提交ackchannel.txCommit() ;提交事务;…

mmdetection3d SUN RGB-D数据集预处理

SUN RGB-D是普林斯顿大学发布的一种关于室内场景理解的数据集,共包含了10335个样本,其中训练样本和验证测试样本数量分别为5285和5050。每个样本包含了彩色图像(RGB)和深度(D)信息,并且分别进行…

基于BDD的接口自动化框架开箱即用

1、背景说明 项目思想:BDD 行为驱动开发的思想褒贬不一,这里不多说。遵循的宗旨能解决业务痛点的思想就是好思想。 接口测试工具在实际的业务测试场景中往往会遇到一些使用上的局限性,自定义扩展要求技术较高,如果二次开发工具…

小程序瀑布流实现

什么是瀑布流布局 瀑布流布局,一般等宽,不等高的列表排列 原理是找出高度之和最小的那一列,在高度最小列继续添加元素 可以通过 absolute 定位实现,动态计算每一项的 top 和 left 封装瀑布流方法 function getAllRect(context…

[附源码]Python计算机毕业设计Django的疫苗接种管理系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

c#、wpf开发中页面在win10下被缩放125%引起页面错乱的解决办法。

正常情况下,我们开发的页面页面应该是100%缩放的,这样程序在win7和win10下保持一致,但是win10里面会根据显示器的情况自动调整“缩放与布局”,这使得桌面程序有时候会发生页面错乱,怎么调整就是个问题。 如图:在“缩放与布局”100%显示如下: 而在 “缩放与布局”125%显…

基于AD Event日志检测LSASS凭证窃取攻击

01、简介 简单介绍一下,LSASS(本地安全机构子系统服务)在本地或域中登录Windows时,用户生成的各种凭证将会存储在LSASS进程的内存中,以便用户不必每次访问系统时重新登录。 攻击者在获得起始攻击点后,需要获取目标主机上的相关凭证…

小程序中的confirm-type设置键盘的确认按钮

详情: confirm-type是很多小程序组件中的一种设置,用于改变输入键盘右下角的确认按钮。比如说,正常情况下,键盘上的默认提示可能是完成,但是你可以通过confirm-type将其设置为发送,搜索等,在特…

搬砖日记:关于sync用不了的问题

自己封装了个输入框的组件&#xff0c;想要实现的输入框的值的修改可以实时修改到父组件的值 印象中看到过人家用.sync修饰符去实现这个功能&#xff0c;大抵是 //父组件 <searchInput :value.sync"value"></searchInput> //子组件 <input v-model&qu…

Redeis缓存查询基于元注解与AOP结合使用——不过时的优雅

Redeis缓存查询基于元注解与AOP结合使用 根据优化需要&#xff0c;数据查询的时候无法避免的使用Redis基于缓存查询&#xff0c;进而减少对于数据库的查询压力&#xff0c;对于过多的方法基于缓存存储&#xff0c;为提高代码的复用性&#xff0c;采用一种不过时的写法。 整体的…

一文详解,数据仓库、数据库、数据中台、数据湖的区别

数据时代&#xff0c;各行业的企业都已经开始通过数据库来沉淀数据&#xff0c;但是真的论起数据库、数据仓库、数据中台&#xff0c;还是新出现的数据湖&#xff0c;它们的概念和区别&#xff0c;可能知道的人就比较少了&#xff0c;今天我们详细来比较了解一下。 数据仓库是…

你的数据库到底应该如何存储密码?

最近接手公司一个之前的服务&#xff0c;竟然发现用户密码是明文存储在数据库中&#xff01; 说实话还是有点吃惊的&#xff0c;这可不兴学 CSDN 呀&#xff08;手动狗头&#xff09;&#xff0c;至少也得搞个 MD5 存一存吧。 不过 MD5 其实也没啥用&#xff0c;今天我们就来…