一龙双太子,星纪元和智界语音能力如何?
语音助手的设计初心在于简化人们的日常操作与互动。
它让用户即使在忙碌或视线受阻的情况下,也能轻松执行各种任务,极大提升了车与人的交互效率。
对于汽车制造商而言,语音助手不仅是座舱用户体验的一张王牌,更是实现个性化服务与产品独特性的核心所在。
对消费者而言,语音助手代表着便捷、前沿科技和个性化表达的象征,它不仅迎合了智能车生活的趋势,也能在确保行车安全与便捷性方面发挥着重要作用。
因此,车载语音助手已成为现阶段新能源汽车领域中不可或缺的重要功能。
一、工作流程
智能座舱的语音系统(VOS)是智能座舱的一个重要组成部分,它基于语音交互技术,为用户提供车内环境下的语音控制服务。
VOS系统包括语音识别(Automatic Speech Recognition, ASR)、自然语言理解(Natural Language Understanding, NLU)、对话管理(Dialogue Management, DM)、语音合成(Text-to-Speech, TTS)等技术,可以代替实现车辆控制、地图导航、音乐及多媒体应用、系统设置等功能的多种人车触摸式交互。
语音指令的使用可以解放手指,无需偏移视线,提高行车安全。并且整个系统包括车端系统、云端系统、语音运营管理平台和训练与分析模块,可通过运营平台和训练分析,对系统进行优化和改进。
二、竞品选择与分析
1. 竞品选择
首先,语音助手在争夺用户关注方面的重要性日益凸显。
从2019年至2023年1-9月,车载语音的装配数量和装配率持续攀升。2023年前三个季度,前装车载语音的搭载量接近1200万辆,装配率高达80%。
此外,下图也清晰地展示了近几年汽车语音交互领域专利数量的激增。
其次,从公开技术信息来看,华为的盘古大模型于2023年9月发布,拥有千亿级别的参数规模,特别强化了对中文语言的理解。
而科大讯飞的星火大模型于2023年5月推出,虽然具体参数规模尚未公开,但侧重于特定场景下的实际应用效果。
且截至2024年2月,星纪元ES和智界的全国销售量分别为482和784辆,市场反响相当。
而奇瑞作为资深国产汽车制造商,华为作为互联网技术巨头,以及科大讯飞作为语音识别行业的领导者,三者在不同商业模式下的合作催生了两种截然不同的车型。
从车辆定位到产品卖点,它们各有特色。
因此,本文将基于智界S7与星纪元ES这两款车型的语音助手,探讨在实际功能应用上的表现,以及语音助手将如何发挥其作用。
2. 定位分析
智界S7与星纪元ES均由奇瑞所打造,不同点在于智界所搭载的车载系统是华为最新的鸿蒙座舱系统,而星纪元ES搭载的是奇瑞联合科大讯飞共同研发的大模型车载系统LION OS。
3. 语音部分能力分析
在笔者本人的用户画像的基础上,结合语音助手的必要性与功能性,笔者简单挑选了几个主要场景类别,并进一步细化到具体的使用场景。
这些场景涵盖了语音助手的核心能力项,旨在评估智界S7与星纪元ES的语音助手在实际应用中的表现。并通过对这些细分场景,笔者将设计出一套体验测评项目,并制定相对应的评分标准,以实现对语音助手体验的量化评估。
4. 评分标准
- 交互使用便利性:确保用户通过语音助手进行交互的便利性,使其操作比传统的触摸操作更为简单快捷。这一指标衡量的是语音助手能对用户所说的话给予反馈用户在使用语音助手时,能否以更少的步骤和更高的效率完成任务。
- 指令翻译准确性:优秀的语音助手必须能够准确理解用户的语音指令,这包括对语句意思的准确把握。这一指标衡量的是语音助手能够明白用户的意图。
- 指令执行完整性:除了理解指令,语音助手还应当能够彻底执行用户的指令,并在任务完成后提供明确的反馈,让用户知道操作结果。这一指标衡量的是语音助手能对用户所说的话给予反馈。
- 指令结果可用性:是指指令执行后产生的结果是否符合用户的预期。这一指标衡量的是用户对语音助手的信任度和满意度。
- 语音助手拟人化:主要是为了提升用户体验,使语音助手具备拟人化的特质,让用户愿意与之交流,并在人与车的交互中更愿意使用语音助手。这一指标衡量的是用户使用语音助手的意愿程度。
- 可持续发展性:通过集成先进的AI技术,语音助手可以实现长期的发展,使助手能够学习并适应用户的习惯,实现与用户的共同成长。这一指标衡量的是语音助手的自我迭代。
以上评判标准具体量化标准划分采用5分满分制,设置三个等级,分别为:及格(3分)、良好(4分)、优秀(5分)。在后续的体验中会以该标准对语音助手进行评分,最后汇总得出结果。
三、产品体验
1. 体验过程
笔者对智界S7与星纪元ES的语音助手进行了多次的实车体验,累计制作了约7GB的视频素材,通过模拟日常使用场景,详细记录了语音助手的工作流程和互动体验,体验记录部分截图如下:
2. 体验小结
尽管两款车型在技术基础上有所共通,但在实际应用中,即使是同一车型,其语音交互功能的稳定性与表现力也是参差不齐,具体表现如下
- 便利性:两车在基础语音唤醒和车控指令执行上均达到行业标准,但在处理语音助手无法直接执行的功能时,智界S7的触摸操作逻辑更为用户友好,提供了更友好的保底策略;
- 准确性:星纪元ES可能得益于科大讯飞的技术背景和芯片算力,在语音指令的NLU理解和执行速度上稍优于智界S7,但两者均属于实用级别;
- 完整性:产品定义上的差异导致两车在完整性方面表现不同。智界S7相对保守,对于复杂指令的执行和反馈不够充分。相反,星纪元ES展现出更全面的“助理”角色,能够准确执行并给予用户明确反馈;
- 可用性:在指令执行结果的可靠性方面,智界S7更为稳妥,仅执行确认能够完成的任务,避免了错误执行。星纪元ES虽然会尝试执行所有指令,但有时会导致结果偏离用户本意。
- 拟人性:星纪元ES在拟人性方面显著领先,提供丰富的语音助手形象,而智界S7的语音助手形象较为单一(笔者在体验过程中意外发现银河E8的语音助手还可以更换人物声音)。
- 发展性:星纪元ES的语音助手能够根据用户使用习惯推荐高频指令,并调整推荐内容,显示出较强的学习和发展能力。相比之下,尽管智界S7属于后发,但在发展性上并未体现出明显优势。
综上所述,星纪元ES在准确性、完整性、拟人性和发展性方面占优,而智界S7在便利性和可用性上表现出色。
四、总结与改进
在深入体验了导航、车辆控制及多媒体的语音交互功能后,我发现智界与星纪元在语音交互设计上均展现出一定程度的“拧巴”,但各自的策略差异使这种“拧巴”呈现出不同面貌。同时,二者在提高人车交互效率方面也展现出不相上下的实力。
智界的“拧巴”主要表现为过于严谨的操作逻辑,有时显得不够智能。例如,尽管用户记住了复杂菜单下的指令关键词,系统却无法直接执行,仍需用户手动导航至相应指令层级界面再语音操作,但语音助手在处理同级页面其他操作时却又可以直接响应。在收藏地点的过程中,智界虽支持通过语音助手设置收藏地点,但却缺少执行指令后的反馈。并且智界拥有华为支付优势,但鸿蒙系统在第三方应用支付流程上的优化仍有待提升。
而星纪元的“拧巴”则体现在其语音助手的过度主动上。虽然其提供了类似nomi的拟人化交流体验,符合“伴我成长”的产品理念,但有时会擅自更改用户指令,导致执行结果与用户初衷背道而驰。
在新能源汽车迅猛发展的当下,智界与星纪元的“拧巴”现象,在我看来,是完全可以理解的,因为这些在体验过程中遇到的问题,大多可以通过后续的OTA升级得到解决和优化。
但从产品完成度来看,星纪元在产品定位、运营宣传以及具体功能实现上都略胜一筹,这也让我对其语音系统更加青睐。
而对于两车未来的发展方向,我认为星纪元应着重加强自然语言理解(NLU)的培训,以提升对用户意图的精准识别能力。至于智界,则应当在对话管理(DM)和文本转语音(TTS)技术方面注入更多人性化的元素,从而使得交互体验更加自然和流畅。
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!