【当前独家】全球最佳!提出感知决策一体化端到端自动驾驶大模型 上海科研团队闪耀AI顶会
温哥华当地时间6月21日,全球人工智能和计算机视觉领域顶级国际会议CVPR 2023正式公布奖项。上海人工智能实验室、武汉大学及商汤科技联合研究成果《以路径规划为导向的自动驾驶》从9155篇投稿论文中脱颖而出,获得本届CVPR最佳论文奖。该论文首次提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构先河, 为自动驾驶技术与产业的发展提出了新的方向。
(相关资料图)
这是近十年中国学术机构作为第一单位首次获CVPR最佳论文奖,也是近十年计算机视觉三大顶级会议(CVPR、ICCV、ECCV)的最佳论文奖首次颁给第一单位为中国的学术机构。
CVPR是计算机视觉和人工智能领域公认的顶级会议。CVPR最佳论文是计算机视觉领域学术研究的顶级荣誉,对技术和行业发展将产生重要影响。根据谷歌学术统计,CVPR在所有学术期刊和会议中位列《自然》(Nature)、《新英格兰医学杂志》(The New England Journal of Medicine)和《科学》(Science)之后排名第四。
2023年CVPR会议在加拿大温哥华举行,今年CVPR会议共计9155篇投稿,2359篇论文被接收(接收率25.78%)。在本届CVPR上,上海人工智能实验室和商汤科技以一篇最佳论文、一篇最佳论文候选、54篇论文被接收的优异成绩单,在国际学术舞台上展现了中国AI实力。
自动驾驶是一个高度复杂的技术体系,不仅需要多个学科领域的知识和技能,包括传感器硬件、机器学习、多模态融合等内容,还需要适应不同国家与地区的道路规则和交通文化,与车辆及行人进行良好的交互,以实现高度的可靠性和安全性。自动驾驶系统包含三大主任务:感知、预测和规划。当前,业界主流的方案架构分别采用不同的模块来处理这些具体任务,但由于各模块并非以驾驶为最终目标进行优化,因而自动驾驶系统的整体性能提升受到了很大限制。
在UniAD中,研究人员首次将感知、预测和规划等三大类主任务、六小类子任务(目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划)整合到统一的基于Transformer的端到端网络框架下,实现了全栈关键任务驾驶通用模型。在nuScenes真实场景数据集下,UniAD的所有任务均达到“领域最佳性能”,尤其是预测和规划效果远超之前的最佳方案。其中,多目标跟踪准确率超越“领域最佳性能”20%,车道线预测准确率提升30%,预测运动位移和规划的误差则分别降低了38%和28%。
上海人工智能实验室青年科学家李弘扬介绍,凭借其充分的可解释性、安全性、与多模块的可持续迭代性,UniAD是目前为止最具希望实际部署的端到端模型。基于UniAD的纯视觉自动驾驶方案可为产业界提供全新的研发思路,在节省大量硬件成本的同时,有助于提高出行的安全性与舒适性。该科研成果在产业界的落地应用,将有力地推动自动驾驶技术与产品的规模化发展。
自动驾驶是通用智能大模型“书生”重要的落地应用领域之一,近年来,上海AI实验室自动驾驶团队不断突破创新,挑战各项自动驾驶研究任务,在多模态、时空融合、端到端、多任务等方面提出了新思路、新模式。“以原始创新引领技术突破,上海AI实验室作为人工智能领域的新型科研机构,致力于通过开展战略性、原创性、前瞻性的科学研究与技术攻关,目标成为享誉全球的人工智能原创理论和技术的策源地。”上海人工智能实验室主任助理乔宇表示。
新民晚报记者郜阳
标签: