视觉AI是专门针对2D/3D图像数据训练的,处理的是像素级的视觉信息包括颜色、纹理、光影等,雷达数据是完全不同的数据形式,是基于电磁波反射的点云或距离数据。两种数据提供的信息维度和类型完全不同。这就像让一个精通中文的人自然就能读懂俄语一样,是不成立的假设。
视觉AI的核心是提取视觉特征如边缘、纹理、形状。其神经网络结构比如卷积层是专门为处理图像数据优化的,处理雷达数据需要完全不同的网络结构,我没做过雷达相关项目,具体不太了解。
不过视觉AI通过大规模视觉数据集训练,学习的是视觉世界的规律。雷达数据的特征提取和理解需要专门的训练方法和数据集。不能期望一个只见过图像的模型自然就懂得解释雷达信号。
目前所有带激光雷达的智驾,使用激光雷达的部分都是模块化的。这也证明了目前没有合格的能用了处理完全不同类型的传感器数据的统一的AI系统。
关注数量超出限制,
请先删除部分内容再尝试