设置

关灯

第682章 提示和设想(第3节)

系,而不是依赖我们人工预设的规则去分割目标、匹配特征。”

随着笔尖持续移动,在白板中央画出一个代表三维空间特征(3D FeatUreS)的立体区域,并标注了“BEV (Bird'S-Eye-VieW) RepreSentatiOn”。

“在模型内部,自然生成统一、稠密的鸟瞰图(BEV)空间表征。

在这个统一的BEV空间里,激光雷达点云也好,毫米波雷达目标也好,甚至未来的V2X车路协同信号也好,都只是作为辅助的‘特征’(FeatUre)。

通过跨模态注意力机制(CrOSS-MOdal AttentiOn)自然地融入、补充、增强这个由视觉主导构建的三维空间理解。”

他在BEV空间周围画上代表激光雷达、毫米波雷达、V2X的符号,用虚线箭头指向中央的BEV空间,并在连接处标注了“AttentiOn”。

“最终输出的是什么?”陈默的笔尖用力地在BEV空间下方画了一个输出箭头,重重写下两个词:“OCCUpanCy Grid(占据栅格)”、“FlOW PrediCtiOn(运动流预测)”。

“不是一个个孤立的、需要后期费力融合的‘目标框’(BOUnding BOX)和‘轨迹线’(TraieCtOry)。

而是这个三维空间中,每一个‘体素’(VOXel)是否被占据的概率,以及占据物未来的运动趋势!

这才是最接近人类驾驶员对周围环境空间和运动态势的直觉感知方式。

这才是通往L3级以上高阶智能驾驶的真正钥匙!”

“沙沙”声停止了。

陈默放下笔,转过身。

会议室内一片死寂。

落针可闻的死寂。

时间仿佛被按下了暂停键。

所有人都僵住了,如同被施了定身法。

会议室里

本章未完,请点击"下一页"继续阅读! 第3页 / 共4页