Fully Sparse Fusion for 3D Object Detection (TPAMI 2024)

目前流行的多模态3D检测方法通常依赖于密集检测器,这些检测器通常使用密集的鸟瞰图(BEV
)特征图。然而,这种BEV特征图的成本与检测范围的平方成正比,使得它在长距离检测上不具可扩展性。近来,仅使用LiDAR的完全稀疏架构因其在长距离感知方面的高效性而受到关注。在本工作中,我们研究如何开发一种多模态完全稀疏检测器。具体来说,我们提出的检测器将研究成熟的2D实例分割集成到
LiDAR侧,与仅LiDAR基线中的3D实例分割部分平行。所提出的基于实例的融合框架在保持完全稀疏性的同时,克服了仅LiDAR全稀疏检测器相关的限制。我们的框架在广泛使用的nuScenes数据集、Waymo数据集和远距离Argoverse 2数据集上展示了最先进的性能。值得注意的是,我们提出的方法在长距离感知场景下的推理速度比其他最先进的多模态3D检测方法快2.7倍。

全稀疏多模态3D检测器

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Zhaoxiang Zhang © 2020