Pseudo-LiDAR from Visual Depth Estimation:Bridging the Gap in 3D Object Detection for Autonomous Driving
- 作者:Yan Wang, Wei-Lun Chao, Divyansh Garg, Bharath Hariharan, Mark Campbell, and Kilian Q. Weinberger
- 机构:Cornell University, Ithaca, NY
- 出处:CVPR 2019
主要贡献
- 激光雷达数据过于昂贵,而单目数据在3D目标检测中变现较差,打破主要原因是深度估计不准确的思想局限
- 实验证明雷达点云的数据表示形式比深度图的形式要好,并且在实验中效果大大提升,从22%到74%,证明了其将单目深度估计图转换为虚假雷达点云的有效性。
写作笔记
stereo imagery data:立体成像数据
hefty premium:高额费用
quadratically:平方的
posit:假设
agnostic:不可知的
研究价值
- 雷达代价高,费用高
- 过度依赖一种传感器是有安全隐患的,需要有另外的传感器在雷达失效之后继续恢复使用
- 光学相机价格低,且能生成密集的深度图,而不是像雷达一样生成稀疏的深度图
雷达点云与深度图输入对比
- 基于图像的深度被密集地估计为每个像素,并且通常表示为附加的图像通道,使得远处的物体更小,更难检测
- 深度图的像素邻域将来自三维空间遥远区域的点聚集在一起。没有按照深度来分层处理
网络流程
未来工作
- 更高分辨率的立体图像
- 速度上可以有所提升
- 可以融合雷达点云数据和光学相机产生的伪雷达数据,更好的提升3D物体检测的效果