9月24日,由本汽车、牛车网、汽车智能、汽车注意杂志共同主办的第7期词汇自沙龙、牛车网第4期汽车智能沙龙“无人驾驶,未来什么时候来”在清华大学旧经管报告厅举行。 国内学术前沿专家、自动驾驶行业创始人、知名投资者和权威解体师对“无人驾驶、未来何时到来”进行了精彩的介绍和讨论。 其中minieye联合创始人王启程发表了“无人驾驶中视觉识别会发生什么”的主题演讲,详细介绍了视觉在目标识别中的地位和优势,会场观众对视觉识别有了更深入的理解。
以下是现场演讲复印件的实录。
大家好! 我是minieye共同创始人王启程。 minieye是一家专注于车载视觉识别技术的企业。 我今天共享的主题也和我们做的事件很一致,是“无人驾驶中基于视觉的目标识别技术”。
一、视觉目标识别的产生背景
我相信大家都不知道无人驾驶。 除了高百度,谷歌,这些企业在无人驾驶行业有一点动静和布局。 无论是google还是百度,无论是为了实现无人机而一步一步地前进的飞机,如果像以前流传下来的汽车制造商那样从l1到l4阶段性地前进,在这两条路径中视觉模块就会高度一致,也就是说,
在这个过程中视觉不可或缺的是,首先camera比lidar和radar分辨率高,分辨率更高意味着越来越多的数据和更详细的细节,细节在无人驾驶中非常重要。 除了越来越多的细节之外,camera还可以提供越来越多维的新闻,除了形状轮廓新闻之外,还可以提供目标纹理、颜色、灰度等,基于camera的更好的目标识别、车道、交通标线、信号
在这样的高速场景和比较清洁的情况下,只有lidar和radar才能满足无人驾驶对环境的诉求,但要改变比较多的复杂场景,这样的城市环境camera是不可或缺的。 因为在这样多的复杂环境下实现目标识别非常困难,需要高阈值,所以现在是这样大的市场mobileye相对垄断的理由之一。 在这种场合识别目标需要非常专业的视觉团队。 否则,我们只能得到五六十分非常低端的东西,不能满足前端的控诉。
二、视觉目标识别的快速发展过程
视觉上进行目标识别,从概念的提出到实用化处理了实际问题,经过了长达50年的技术发展。 第一个概念是mit教授在1966年提出的,他希望能连接照相机和电脑,自动识别电脑用照相机拍的复印件。 这是当时非常有挑战性的任务。 幸运的是,经过这么多年的技术推广,我们才能完成实际任务。
在这样长达50年的技术进展中,发现了一些趋势。 首先,学习在目标认识中起着越来越重要的作用。 这里,用大家熟悉的面部检测的例子进一步证明90年代之前是如何检测出面部的吗? 我们通过经验建立体颜模型。 就这样,脸上有两只眼睛,左右轮廓。 根据这样构建的模型识别脸,有利益明显的物理意义直观,宣传性不强,能识别正面脸的缺点,但是如果立场和光线稍微改变的话,可能就不能很好地工作了。
进入90年代以来,这个领域最重要的进展之一是将“学习”的概念引入目标认识,在这里我们不是直接定义模型,而是先定义基本特征。 再收集1000个或1万个面部样本,训练基础特征,学习哪个特征能更有效地表现面部特征,用这些特征描绘我们的面部。 很明显这种方式宣传性有点强,但它也有增加的问题。 是我们的基础特征还是人工选择的? 如果我们选择的特征不合适的话,可能无法顺利工作。 例如,使用面部检测中常见的h特征检测人体时存在问题,因此需要改变特征。
入年后,大家都很了解一个概念。 被称为“深度学习”。 深度学习最重要的优点是以前我们必须人工定义的基础特征也可以通过学习的方法得到。 回顾迄今为止的三个阶段,在这个过程中,“学习”发挥着越来越重要的作用,可以说从一开始我们就人工定义模型,到最后只人工定义特征,机器学习模型,甚至到最后都是机器学习的。
另一个趋势是我们认识到的副本更细致。 最初采用image classification。 我认识到这有车和摩托车。 如果你想知道更多的车在图像的哪个位置,请使用bounding-box detection,知道有车,指明车的位置。 如果想得到更多的细节,想知道这张图像中像素属于哪个目标,就用pixel labeling。 这显示行人、车辆和路面。 从实用的角度来说,在驾驶辅助阶段bounding-box detection已经非常方便了,随着汽车的无人化,pixel labeling提供得越来越详细,所以细节是我们的无人驾驶对环境最有用
三、视觉目标识别面临的课题
目标识别作为通用技术有很多应用,可以用于安全、工作等,在车载场景中对目标识别提出了越来越多的挑战。 这个挑战只是来自两个矛盾,首先是正确性和类别内的差异矛盾,正确性得到很好的理解。 例如,用于识别人脸的工作系统没有被识别,没有任何结果。 但是,如果车载场景无法识别前面的车,可能会发生碰撞,导致人身和财产损失。 因此,正确性是环境中最重要的。 什么是类别内差? 我们必须认识到的目标之间的差异是,在工作系统中,脸和脸的差异不太大,不仅仅是眼睛、鼻子、嘴,但是在车载环境中人有可能有不同的姿势,行人有可能挡住,有光照,天气不同
另一个矛盾是实时性和计算资源之间的矛盾,已知交通事故的发生通常是0点几秒,为了比较有效地预防交通事故,系统数据解决速率至少要求30帧以上。 对应的汽车电子设备通常要求采用汽车级的芯片,与成熟的成本级的芯片相比计算能力弱,价格也高,以尽量减少预算而不影响安装为前提的诉求也是非常大的课题。
责任:范赫
标题:【车讯】MINIEYE王启程:无人驾驶中的视觉识别
地址:http://www.clctq.com/news/18753.html