每一位考过驾照的老司机,或多或少都会回想起当年被科目二支配的恐惧——看着车库线却总是无能为力,总会压到左边或右边。如果是侧方位停车,那么回正方向盘的角度与时机更加不好掌握。
但在智能辅助驾驶越发普及的当下,这一困扰大多数司机的问题有望被解决。一些车企已经率先推出解决的方案,利用车辆周围的传感器,搭配无人泊车技术,来解放司机的泊车困扰。
9月23日,威马与百度、科大讯飞联合举办了一场自动泊车技术展示。展示中,威马W6(参数|询价)可以在车上无人的情况下,全自动通过侧方位停车以及倒车入库的测试。技术展示环节后,汽车之家与威马、百度、科大讯飞方面进行了对话。
自动泊车两代演进
无人泊车技术,威马已经默默进行了两代升级。
当前,威马W6所使用的是第1代无人泊车,名为HAVP(Home AVP),也叫“无人自主学习泊车”。HAVP可简单理解为使用固定路线进行无人驾驶泊车,用户带领威马W6学习一次泊车路线,系统便会通过一系列传感器,在本地及云端自动记忆行驶轨迹和预设车位的位置,实现无人情况下的自动泊车入位。
而当车主召唤威马W6时,它也能自己规避障碍,避让行人,自动接驾。
HAVP大多适用于类似于家或公司这种起点与终点路线都固定的泊车场景。而在威马即将推出的第2代无人泊车技术上,其命名为PAVP(Public AVP)。
PAVP的中文名称为“无人高精地图泊车”,可实现非固定车位场景的无人驾驶泊车,这相比于HAVP要自由很多,但是技术难度也更大,因为这项技术需要高清地图与云端算力的协助。
在大型商场、写字楼等非固定车位场景下,升级到PAVP的威马W6,在特定停车场环境内可自主完成绕行障碍物、跨层巡航并自动泊入车位。威马称,PAVP功能将在年内通过OTA升级推送给用户。
『威马W6』
PAVP的应用,会进一步拓展泊车场景和适应停车场,但这个功能也是一个行业挑战,因为它对停车场提出了较高的要求。光线、标志非常杂乱的老旧停车场,可能会让PAVP难以应对。
针对这样的问题,威马研究院的工程师表示,威马首先要把一些比较规范的停车场进行轻度改造,让停车场一个一个去适应这项技术。另外,在技术和应用层面,威马会逐步地拓展应用场景,包括商业停车场、政府和第三方的停车场。
“整个路线就是不断地拓展场景、适用更多的场景。”威马工程师说。而对于PAVP技术,百度规划接下来先在国内一线城市开放落地,在今年底、明年初,会有一批商业停车场的测试和运营的计划披露。
第三代泊车处于研发中
与威马合作开发自动泊车技术的是百度,时至今日,百度在国内的自动驾驶累计里程已经突破了1400万公里,在自动驾驶方面拥有一定的技术基础。
百度方面对汽车之家表示,第一代HAVP解决的是固定停车位场景,第二代产品PAVP解决的是商业停车场场景,比如商场泊车场景。
“第三代叫做UAVP(Urban AVP)。”百度工程师说,前两种都是在停车场里面,第三种UAVP可以实现在距停车场较远的地方(比如1公里),有自然需求的停车点,用户可以随意地去招车和还车。
“当然这需要更多技术的协助,比如说车辆协同、高精地图以及更强的感知能力,我们希望通过更深的技术提升,能够达到基本上完全自主的低速场景下的自动驾驶泊车能力。”百度方面表示。
『中:百度智能汽车事业部-功能安全解决方案资深经理 王亚丽』
目前,HAVP只需要车端的感知,不需要场端。这带来了一个疑问——在未来,场端的功能是否会遭到弱化,车端与场端之间应如何进行融合?
对此百度方面表示,开放PAVP时需要弱场端,“就是说可能会有一些改造,例如高精地图的改造。”
“等到我们开放UAVP的时候,因为会面对一些开放道路,所以需要一部分场端能力。现在有两种技术方案,包括车端或者场端,我们觉得这两种技术路线到最高级别的泊车场景肯定是互相融合的、需要去提升的。”
但是百度方面也表示,从安全角度来说,车端与场端不是互相替代,而是互相融合的关系。
什么叫多模语音交互?
在威马W6上,搭载了全新的WIMI语音助手。
WIMI语音助手支持自然唤醒、关键词唤醒、快捷指令唤醒等多种交互方式,可实现超过120余项常用功能语音控制。此外,还具备左右双区音源识别能力,并支持15秒连续自然语音对话,一次唤醒后可多次自由打断。
据了解,这套系统是威马与科大讯飞联合研发,科大讯飞在这一语音助手上投入了“多模语音交互技术”,针对这一技术,科大讯飞做出了解读。
『科大讯飞智能汽车事业部-智能交互产品线总监 邢猛』
科大讯飞表示,在语音识别准确率影响因素中,噪声影响因素占20%,其次才是方言的12%。克服噪音,一直都是提升语音识别准确性重要途径。
“有时候,高噪场景下的用户语音识别效果会受到当前技术瓶颈的影响。因为在高噪场景下,语音信号受道路噪声的影响是很大的。在造成影响的情况下,如果单纯依靠语音信号一个维度去识别判断用户的指令,是非常困难的。”科大讯飞工程师说。
这种场景下的识别精准度问题怎么解决?科大讯飞将技术路径瞄准了图像识别技术。
“用户说话的时候,不仅有声音发出来,他的嘴唇也会动。如果我看到他的嘴唇在动,就开始接收到他的语音信号,然后用唇部动作叠合声音,这两者结合在一起,就可以把高噪场景下的交互体验、识别正确率提升上去。”
所以,在高噪场景下,用到的核心技术是唇语。通过识别嘴唇动和语音信号相结合,来提高识别率。
车内自然交互是科大讯飞要攻克的第二场景。自然交互不需要唤醒词,所以一般情况下免唤醒功能会受到很多的干扰,比如在用户不说话的情况下,有可能外面一个喇叭声同样能把车机触发。
解决这一问题,同样需要语音和图像相结合的多模语音技术。科大讯飞工程师说,“我们会同步观察车主的嘴唇动了没有。当车机发现一个声音,会看一下主驾的嘴唇有没有动,如果嘴唇没有动,加上有无声音,大概就可以判断这个声音有可能是干扰,这样就可以把干扰项区分出来。”
通过多模语音交互,可以大大提升语音识别的准确性,同时解决掉复杂场景的干扰,让免唤醒以及交互功能可以获得更高的用户满意度。
同样,科大讯飞的工程师也在畅想语音交互的未来。“如果未来通过自动驾驶,把驾驶者的精力释放出来了,会不会有座舱办公场景、更多的协同办公、更多的外部连接,在这里面语音起到什么作用?我们也在进一步思考。”
在智能化与网联化不断普及的当下,判断一辆车是否智能的标准也在发生变化。从泊车到语音交互场景,业内通过一点点技术的改进,不断提升用车的驾驶体验,这才是推动产业向前发展的正确方案。
而随着用户痛点被不断解决,一个真正属于智能汽车的时代,或许将在我们的注视下来临。(文/汽车之家 程功)