解决科目二？对话威马自动泊车研发专家

每一位考过驾照的老司机，或多或少都会回想起当年被科目二支配的恐惧——看着车库线却总是无能为力，总会压到左边或右边。如果是侧方位停车，那么回正方向盘的角度与时机更加不好掌握。

但在智能辅助驾驶越发普及的当下，这一困扰大多数司机的问题有望被解决。一些车企已经率先推出解决的方案，利用车辆周围的传感器，搭配无人泊车技术，来解放司机的泊车困扰。

9月23日，威马与百度、科大讯飞联合举办了一场自动泊车技术展示。展示中，威马W6(参数|询价)可以在车上无人的情况下，全自动通过侧方位停车以及倒车入库的测试。技术展示环节后，汽车之家与威马、百度、科大讯飞方面进行了对话。

自动泊车两代演进

无人泊车技术，威马已经默默进行了两代升级。

当前，威马W6所使用的是第1代无人泊车，名为HAVP（Home AVP），也叫“无人自主学习泊车”。HAVP可简单理解为使用固定路线进行无人驾驶泊车，用户带领威马W6学习一次泊车路线，系统便会通过一系列传感器，在本地及云端自动记忆行驶轨迹和预设车位的位置，实现无人情况下的自动泊车入位。

而当车主召唤威马W6时，它也能自己规避障碍，避让行人，自动接驾。

HAVP大多适用于类似于家或公司这种起点与终点路线都固定的泊车场景。而在威马即将推出的第2代无人泊车技术上，其命名为PAVP（Public AVP）。

PAVP的中文名称为“无人高精地图泊车”，可实现非固定车位场景的无人驾驶泊车，这相比于HAVP要自由很多，但是技术难度也更大，因为这项技术需要高清地图与云端算力的协助。

在大型商场、写字楼等非固定车位场景下，升级到PAVP的威马W6，在特定停车场环境内可自主完成绕行障碍物、跨层巡航并自动泊入车位。威马称，PAVP功能将在年内通过OTA升级推送给用户。

『威马W6』

PAVP的应用，会进一步拓展泊车场景和适应停车场，但这个功能也是一个行业挑战，因为它对停车场提出了较高的要求。光线、标志非常杂乱的老旧停车场，可能会让PAVP难以应对。

针对这样的问题，威马研究院的工程师表示，威马首先要把一些比较规范的停车场进行轻度改造，让停车场一个一个去适应这项技术。另外，在技术和应用层面，威马会逐步地拓展应用场景，包括商业停车场、政府和第三方的停车场。

“整个路线就是不断地拓展场景、适用更多的场景。”威马工程师说。而对于PAVP技术，百度规划接下来先在国内一线城市开放落地，在今年底、明年初，会有一批商业停车场的测试和运营的计划披露。

第三代泊车处于研发中

与威马合作开发自动泊车技术的是百度，时至今日，百度在国内的自动驾驶累计里程已经突破了1400万公里，在自动驾驶方面拥有一定的技术基础。

百度方面对汽车之家表示，第一代HAVP解决的是固定停车位场景，第二代产品PAVP解决的是商业停车场场景，比如商场泊车场景。

“第三代叫做UAVP（Urban AVP）。”百度工程师说，前两种都是在停车场里面，第三种UAVP可以实现在距停车场较远的地方（比如1公里），有自然需求的停车点，用户可以随意地去招车和还车。

“当然这需要更多技术的协助，比如说车辆协同、高精地图以及更强的感知能力，我们希望通过更深的技术提升，能够达到基本上完全自主的低速场景下的自动驾驶泊车能力。”百度方面表示。

『中：百度智能汽车事业部-功能安全解决方案资深经理王亚丽』

目前，HAVP只需要车端的感知，不需要场端。这带来了一个疑问——在未来，场端的功能是否会遭到弱化，车端与场端之间应如何进行融合？

对此百度方面表示，开放PAVP时需要弱场端，“就是说可能会有一些改造，例如高精地图的改造。”

“等到我们开放UAVP的时候，因为会面对一些开放道路，所以需要一部分场端能力。现在有两种技术方案，包括车端或者场端，我们觉得这两种技术路线到最高级别的泊车场景肯定是互相融合的、需要去提升的。”

但是百度方面也表示，从安全角度来说，车端与场端不是互相替代，而是互相融合的关系。

什么叫多模语音交互？

在威马W6上，搭载了全新的WIMI语音助手。

WIMI语音助手支持自然唤醒、关键词唤醒、快捷指令唤醒等多种交互方式，可实现超过120余项常用功能语音控制。此外，还具备左右双区音源识别能力，并支持15秒连续自然语音对话，一次唤醒后可多次自由打断。

据了解，这套系统是威马与科大讯飞联合研发，科大讯飞在这一语音助手上投入了“多模语音交互技术”，针对这一技术，科大讯飞做出了解读。

『科大讯飞智能汽车事业部-智能交互产品线总监邢猛』

科大讯飞表示，在语音识别准确率影响因素中，噪声影响因素占20%，其次才是方言的12%。克服噪音，一直都是提升语音识别准确性重要途径。

“有时候，高噪场景下的用户语音识别效果会受到当前技术瓶颈的影响。因为在高噪场景下，语音信号受道路噪声的影响是很大的。在造成影响的情况下，如果单纯依靠语音信号一个维度去识别判断用户的指令，是非常困难的。”科大讯飞工程师说。

这种场景下的识别精准度问题怎么解决？科大讯飞将技术路径瞄准了图像识别技术。

“用户说话的时候，不仅有声音发出来，他的嘴唇也会动。如果我看到他的嘴唇在动，就开始接收到他的语音信号，然后用唇部动作叠合声音，这两者结合在一起，就可以把高噪场景下的交互体验、识别正确率提升上去。”

所以，在高噪场景下，用到的核心技术是唇语。通过识别嘴唇动和语音信号相结合，来提高识别率。

车内自然交互是科大讯飞要攻克的第二场景。自然交互不需要唤醒词，所以一般情况下免唤醒功能会受到很多的干扰，比如在用户不说话的情况下，有可能外面一个喇叭声同样能把车机触发。

解决这一问题，同样需要语音和图像相结合的多模语音技术。科大讯飞工程师说，“我们会同步观察车主的嘴唇动了没有。当车机发现一个声音，会看一下主驾的嘴唇有没有动，如果嘴唇没有动，加上有无声音，大概就可以判断这个声音有可能是干扰，这样就可以把干扰项区分出来。”

通过多模语音交互，可以大大提升语音识别的准确性，同时解决掉复杂场景的干扰，让免唤醒以及交互功能可以获得更高的用户满意度。

同样，科大讯飞的工程师也在畅想语音交互的未来。“如果未来通过自动驾驶，把驾驶者的精力释放出来了，会不会有座舱办公场景、更多的协同办公、更多的外部连接，在这里面语音起到什么作用？我们也在进一步思考。”

在智能化与网联化不断普及的当下，判断一辆车是否智能的标准也在发生变化。从泊车到语音交互场景，业内通过一点点技术的改进，不断提升用车的驾驶体验，这才是推动产业向前发展的正确方案。

而随着用户痛点被不断解决，一个真正属于智能汽车的时代，或许将在我们的注视下来临。（文/汽车之家程功）

解决科目二？对话威马自动泊车研发专家

追寻复原力：上半年大类资产表现回顾与启示

记者的标题是建立的最受欢迎的策略表示，编辑公会表示

大摩：维持腾讯“增持”评级目标价820港元

CCI清除Facebook-Jio交易

亚洲LNG价格上涨较高，中国需求

解决科目二？对话威马自动泊车研发专家

追寻复原力：上半年大类资产表现回顾与启示

记者的标题是建立的最受欢迎的策略表示，编辑公会表示

大摩：维持腾讯“增持”评级 目标价820港元

CCI清除Facebook-Jio交易

亚洲LNG价格上涨较高，中国需求

大摩：维持腾讯“增持”评级目标价820港元