开发商城网站想要做个公司网站

张小明 2025/12/30 7:32:31
开发商城网站,想要做个公司网站,个人网站 可以做淘宝客吗,网站开发到上线点击下方卡片#xff0c;关注「3D视觉工坊」公众号选择星标#xff0c;干货第一时间送达来源#xff1a;3D视觉工坊「3D视觉从入门到精通」知识星球(点开有惊喜) #xff01;星球内新增20多门3D视觉系统课程、入门环境配置教程、多场顶会直播、顶会论文最新解读、3D视觉算法…点击下方卡片关注「3D视觉工坊」公众号选择星标干货第一时间送达来源3D视觉工坊「3D视觉从入门到精通」知识星球(点开有惊喜) 星球内新增20多门3D视觉系统课程、入门环境配置教程、多场顶会直播、顶会论文最新解读、3D视觉算法源码、求职招聘等。想要入门3D视觉、做项目、搞科研欢迎扫码加入0.这篇文章干了啥这篇文章提出了VR-Drive一种具备视角鲁棒性的端到端自动驾驶E2E-AD框架旨在解决现有E2E-AD系统对不同相机视角泛化能力不足的问题。核心创新在于将3D场景重建作为辅助任务联合学习以实现规划感知的视图合成。该框架采用前馈推理策略支持从稀疏视图进行在线训练时的数据增强无需额外标注。为提高视角一致性引入了视角混合内存库和视角一致蒸馏策略前者促进不同视角特征的时间交互后者将原始视图的知识转移到合成视图。VR-Drive由原始视图学习、新视图学习和感知规划学习三个组件构成通过多种损失函数进行端到端训练。文章还发布了一个新的基准数据集用于评估E2E-AD系统在新相机视角下的性能。实验表明VR-Drive在nuScenes数据集和CARLA模拟器上均取得了领先性能在不同相机视角和分布外条件下表现出强大的鲁棒性和可扩展性为端到端自动驾驶系统的实际部署提供了有效的解决方案。下面一起来阅读一下这项工作~1. 论文信息论文题目VR-Drive: Viewpoint-Robust End-to-End Driving with Feed-Forward 3D Gaussian Splatting作者Hoonhee ChoJae-Young KangGiwon Lee等作者机构KAIST42dot论文链接https://arxiv.org/pdf/2510.232052. 摘要端到端自动驾驶E2E-AD已成为一种很有前景的范式它将感知、预测和规划统一到一个整体的、数据驱动的框架中。然而实现对不同相机视角的鲁棒性仍然是一个悬而未决的问题这是由于车辆配置多样而在现实世界中常见的挑战。在这项工作中我们提出了VR-Drive这是一种新颖的端到端自动驾驶框架它通过将三维场景重建作为辅助任务进行联合学习以实现规划感知的视图合成从而解决视角泛化问题。与以往特定场景的合成方法不同VR-Drive采用前馈推理策略支持在无需额外注释的情况下从稀疏视图进行在线训练时增强。为了进一步提高视角一致性我们引入了一个视角混合记忆库以促进跨多个视角的时间交互并提出了一种视角一致的蒸馏策略将知识从原始视图转移到合成视图。VR-Drive以完全端到端的方式进行训练有效减轻了合成引起的噪声并改善了视角变化下的规划。此外我们发布了一个新的基准数据集用于评估在新相机视角下端到端自动驾驶的性能从而实现全面分析。我们的结果表明VR-Drive是端到端自动驾驶系统在现实世界部署中的一种可扩展且鲁棒的解决方案。3. 效果展示图1一个周围车辆在交通信号灯前停下的示例场景。在原始训练视角下我们的VR-Drive与DiffusionDrive均能较好地感知周围车辆并进行规划。然而当相机高度降低时DiffusionDrive无法检测到周围车辆导致其规划出的轨迹与前方车辆发生碰撞存在安全风险。相比之下VR-Drive仍能保持准确的感知除因相机高度降低而被遮挡的部分并像在原始视角中一样有效地规划轨迹。 「3D视觉工坊」编译图4测试时采用的相机视角与原始训练分布不同。 「3D视觉工坊」编译4. 主要贡献通过联合学习三维重建以实现规划感知视图合成解决了端到端自动驾驶E2E-AD中的视点鲁棒性问题实现了跨不同视点的训练数据增强并提高了对未见相机配置的泛化能力。推荐课程面向自动驾驶领域的3D点云目标检测全栈学习路线(单模态多模态/数据代码)。提出了一个视点混合内存库使来自不同视点的特征能够进行时间交互并引入了一种视点一致的蒸馏策略将原始视点图像的知识转移到其对应的增强新型视图合成图像的三维空间中。引入了一个用于端到端自动驾驶的新基准数据集以评估在训练期间未见的新型相机视点下的鲁棒性。5. 基本原理是啥1. 联合学习3D场景重建以实现规划感知视图合成VR-Drive将3D场景重建作为端到端自动驾驶E2E-AD中的辅助模块化任务进行联合学习以增加相机视角的多样性。采用前馈推理策略确保效率将其集成到端到端框架中作为联合模块化任务减少训练复杂性。通过这种方式在不需要额外注释的情况下实现新颖视图合成同时防止视图合成中的错误传播并降低最终规划性能。2. 基于3D高斯溅射的整体框架原始视图学习训练时以原始视图作为默认输入图像编码器ResNet50提取原始多视图特征图。基于原始3DGS框架用高斯基元表示场景通过前馈方式直接从输入图像预测基元联合学习深度作为E2E-AD框架的一部分用预测的深度图和图像特征图输入到高斯网络预测高斯基元的其余参数前馈设计支持对新颖视图的在线推理和对新输入的泛化。新颖视图学习VR-Drive旨在为训练期间未观察到的相机视角生成一致的特征表示。随机采样相机外参使用从原始视图生成的高斯基元从任意视角渲染多视图特征图用与原始视图共享的图像编码器生成新颖视图特征。由于新颖视图特征分布可能与原始视图不同引导模型生成与原始视图紧密对齐的特征表示还采用循环重建损失训练模型从新颖视图重新生成原始视图。感知-规划学习VR-Drive在训练期间选择性地在原始和新颖视图上进行训练以实现跨不同相机视角的鲁棒性。将所选视图提取的图像特征传递给感知和规划头采用3D对象检测和映射作为感知任务使用基于锚点和实例特征的稀疏架构。在感知管道中插入视点鲁棒模块包括视点混合内存库和视点一致蒸馏策略通过额外的检测解码器细化视点鲁棒特征以获得最终感知结果最后采用特定的运动规划器进行规划。3. 视点混合内存库为促进从具有不同分布的不同视角的图像输入中学习规范的3D特征采用内存库策略存储和更新来自不断变化的新颖视图的特征。使用注意力机制融合内存库和当前视图的特征得到混合特征表示混合特征进一步通过自注意力机制处理然后传递到视点一致蒸馏模块。视点混合内存库通过选择最终细化后的前K个高置信度实例进行更新同时以先进先出的方式丢弃库中最旧的实例。4. 视点一致蒸馏新颖视图合成可能导致合成图像包含渲染伪影尤其是在遮挡或无纹理区域。采用蒸馏策略利用原始视图中更可靠和信息丰富的特征引导新颖视图的学习。通过计算每个实例的可学习偏移和权重来提取代表性对象特征将3D采样点投影到每个相机视图的图像平面上并提取图像特征对原始视图和新颖视图都进行此操作。将新颖视图采样特征与原始视图对应特征之间的均方误差损失作为视点一致蒸馏损失将蒸馏损失限制在高置信度锚点上以避免在背景或噪声框中进行蒸馏。5. 损失函数设计运动预测和规划采用赢家通吃策略规划任务中引入额外的回归损失处理自我状态。分类和回归分类使用焦点损失检测和映射任务的回归使用L1损失深度估计也使用L1损失。渲染损失使用L2和LPIPS损失作为渲染目标。根据是否使用新颖视图增强采用两种替代策略应用渲染损失包括原始重建损失鼓励模型使用高斯基元从输入图像渲染新颖视图和循环重建损失当新颖视图作为感知-规划头的输入时采用循环渲染策略从新颖视图重建原始视图。6. 实验结果1. 开环规划性能评估数据集使用nuScenes基准。因该数据集无不同相机视角图像对测试序列进行离线场景优化获取不同视角数据经人工检查后选取146个测试序列用于未知视角测试。评估指标平均位移误差ADE和碰撞率。对比模型AD-MLP、BEV-Planner、VAD、SparseDrive和DiffusionDrive。结果在原始和未知领域的性能对比中DiffusionDrive在未知领域的ADE和碰撞率显著增加而VR-Drive在未知视角下表现与原始视角相当在更具挑战性的相机视角和未知分布下仍能保持良好性能。2. 消融实验组件效果通过对比不同设置下的性能发现仅启用场景重建的联合学习就能提升原始视角的性能表明基于3DGS的在线联合优化有助于提高E2E-AD系统的可扩展性。使用场景重建生成的新视角作为额外输入时性能提升显著。所提出的模块进一步提升了性能且不会在提升新视角性能时牺牲原始视角性能说明新视角在训练中是有效的增强形式引入的模块有助于模型学习更好的表示。随机外参范围研究了训练和测试时相机视角多样性的分布偏移。设置了“Superset”扩大训练传感器范围和“Subset”限制传感器范围两种情况VR-Drive在“Superset”“Subset”和原始设置下表现一致证明其对连续视角变化具有鲁棒性。3. 闭环评估实验设置使用CARLA 0.9.10.1模拟器采用Town05-Nov基准进行评估。对比模型包括ST-P3、TCP、AD-MLP、BEV-Planner和基线模型。评估指标驾驶得分DS和路线完成率RC。结果现有端到端自动驾驶方法在未知测试场景中规划困难DS指标受影响更大感知性能在新视角输入下下降。而VR-Drive在未知测试中的表现与原始视角相当。VR-Drive在不同相机视角和分布外条件下表现出强大的鲁棒性在未知视角下性能与原始视角相当能应对更具挑战性的相机视角和未知分布。良好的可扩展性基于3DGS的在线联合优化有助于提高系统的可扩展性新视角增强有效。对连续视角变化的适应性在不同相机视角多样性分布偏移设置下表现一致。7. 总结 未来工作总结在这项工作中作者提出了VR-Drive这是一个统一的端到端自动驾驶框架利用了新颖视图合成和视点鲁棒学习。据作者所知他们是首个研究端到端自动驾驶中相机视点变化以用于实际应用的团队。作者在nuScenes数据集和CARLA模拟器上对VR-Drive进行了基准测试在不同相机视点和分布外条件下均实现了最先进的性能。未来展望VR-Drive的性能会受到相机校准精度的影响。虽然校准误差可能会导致不理想的结果但可以使系统对这些误差更具鲁棒性。解决这一问题并提高系统对校准不准确的鲁棒性可能是未来工作的一个重要重点。本文仅做学术分享如有侵权请联系删文。3D视觉1V1论文辅导3D视觉1V1论文辅导来啦3D视觉学习圈子「3D视觉从入门到精通」知识星球(点开有惊喜) 星球内新增20多门3D视觉系统课程、入门环境配置教程、多场顶会直播、顶会论文最新解读、3D视觉算法源码、求职招聘等。想要入门3D视觉、做项目、搞科研欢迎扫码加入3D视觉全栈学习课程www.3dcver.com3D视觉交流群成立啦扫码添加微信备注方向单位邀你入3D视觉交流群
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

网上哪个网站做的系统好用国外极简网站

终极深岩银河存档编辑器使用指南:打造个性化游戏体验 【免费下载链接】DRG-Save-Editor Rock and stone! 项目地址: https://gitcode.com/gh_mirrors/dr/DRG-Save-Editor 想让你的深岩银河冒险更加自由随心?存档编辑器这款强大的工具能帮你轻松自…

张小明 2025/12/26 16:36:35 网站建设

常德网站制作建设百度 网站描述

技术实践观察地址: FIRE之旅 财务计算器 摘要: 财务独立、提前退休(FIRE)的实现,其核心驱动力并非绝对收入,而是储蓄率(Savings Rate)。本文将从数学推导的角度,深入分析…

张小明 2025/12/26 16:36:35 网站建设

关于电影网站的论文摘要专做海岛游的网站

Wan2.2-T2V-A14B与PixVerse、Kling等国产模型横向评测 在短视频日活突破8亿、AIGC内容渗透率加速攀升的今天,一个现实正变得愈发清晰:人工拍摄不再是视频生产的唯一路径。从抖音上的AI动画短剧,到品牌方批量生成的千人千面广告,文…

张小明 2025/12/26 16:36:36 网站建设

广州南沙建设和交通局网站做简单最网站的软件是

你是否在开发UI界面时遇到过这样的困扰:用户想要选择文本,但你的应用却无法提供流畅的交互体验?从鼠标按下到选区渲染,每个环节都需要精准处理。本文将带你深入探讨在C语言高性能UI库中实现文本选择功能的核心技术,让你…

张小明 2025/12/26 16:36:38 网站建设

天津制作企业网站的网站用户群

Saber框架:现代化Android MVVM开发的智能注解解决方案 【免费下载链接】Saber 🏄 帮助你快速使用Android的LiveData与ViewModel,已支持SavedState 项目地址: https://gitcode.com/gh_mirrors/saber2/Saber 在Android应用架构不断演进的…

张小明 2025/12/26 7:07:17 网站建设

备案主体负责人 网站负责人太原网站建设地图

探秘!宜宾这5家家电门店,质量好到超乎想象!在宜宾,家电市场的繁荣为消费者提供了众多选择。然而,要找到质量上乘的家电门店并非易事。今天,就让我们一同探秘宜宾这5家质量超乎想象的家电门店,其…

张小明 2025/12/25 18:51:54 网站建设