营业厅大屏+数字人产品运用深度解析

本文旨在收集、分析银行行业在营业厅大屏上的数字人运用的情况(案例与需求),以便更好地了解市场趋势和用户需求。

一、银行网点情况分析

1. 银行网点情况

根据《中国零售银行发展策略》报告,2022年,中国零售银行营业厅中大屏设备的普及率达到了70%,表明大屏设备在银行营业厅中的应用已经相当普遍。

  1. 如建设银行的年度报告,其中提到该行在2021年共设有14,315个网点,其中包括5,585个自助银行和9,389台自助设备,以及2,960个智能柜台。
  2. 农业银行的年度报告则提到该行在2021年共设有22,765个网点,其中包括6,587个自助银行和19,070台自助设备。

银行网点数量与人员的变化情况:

2022年,国有大行及部分股份制银行合计裁撤约2800家银行网点,创下历史新高。其中,六大行网点净减少1000余家,县域及农村金融机构减少幅度最大,达1516家,占网点总减少量的54%。

银行统计2022年人员数量减少的情况因各家银行而异,总体上降幅在0.5%至1.5%之间,举例如下:

  • 工商银行:员工总数从43.41万人减少到42.76万人,降幅约为1.5%;
  • 农业银行:员工总数从45.52万人减少到45.22万人,离职人数约3000人;
  • 中国银行:员工总数没有提及,但提到比上年末减少8200人;
  • 建设银行:员工总数从28.73万人减少到28.59万人,降幅约为0.5%;
  • 邮储银行:员工总数从9.35万人减少到9.18万人,降幅约为1.8%。

银行营业厅智能硬件升级趋势:

  • 进行数字化、智能化升级,提供更加便捷、高效、安全的金融服务。
  • 越来越多的银行开始引入大屏设备以提升客户体验和服务效率。如数字人在银行领域的应用场景包括客户服务、业务咨询、金融教育等。
  • 运用数字人能够进行多轮语音交互,协助客户办理业务、解答客户疑问,并准确定位相应回答,高效满足客户需求。

2. 线下大屏客群情况

1) 线下大屏用户画像

主要面向的是中老年人群:他们对于新技术的接受度相对较低,更喜欢通过线下渠道进行业务办理。

用户群体特质分析:

  • 中老年人群通常有较多的储蓄和投资需求,
  • 可能包括企业主、高级管理人员、专业人士这些用户群体
  • 以上群体具有较高的金融需求和消费能力,对金融产品和服务有较高的关注度。

用户需求分析:

  • 实时更新金融信息;
  • 方便查询和办理业务;
  • 协助大堂经理,提高服务效率,进行业务分流;
  • 提升品牌形象等。

2) 客户痛点

银行角度来说:

  • 大屏产品需要满足以下特点:高清画质、稳定性好、易于维护、操作简便等。
  • 需要针对不同场景和客户需求,还可以提供定制化的解决方案。
  • 大屏会存在信息更新不及时、操作复杂、设备故障等问题。
  • 数字化转型的挑战:传统大屏设备需要升级换代。

用户角度来说:

  • 需要提供各种金融服务,如存款、贷款、理财、保险等。
  • 设备的拾音,语音或者触屏交互要稳定且有效;
  • 智能客服、智能机器人需要能理解说的内容,并能提供一个简单易懂的输出内容;
  • 可以有文本+图文+视频等多形式的输出;

二、大屏

1. 常见大屏的类型

1) LED屏

LED大屏以其高亮度、高分辨率、大屏幕、长寿命以及低能耗等特点,独树一帜。由数以万计的LED灯珠组成,它能够呈现出清晰、细腻的图像和视频。无论是在明亮的阳光下还是在黑暗的环境中,LED大屏都能保证画面的清晰度和色彩的鲜艳度。LED大屏主要特点是高分辨率、无缝拼接等显示效果,以及灵活多变的外形、可搭载触摸显示等优势。

目前在各种银行、政务大厅等场景最常见,作为其智能数字化的一个最直接的体现。

结合数字人呈现效果,通过LED大屏呈现出来的数字人,整体的清晰度可以达到4K,在数字人精度足够高的情况下,呈现出来的效果就十分逼真。

2) 全息仓

全息舱是一款裸眼3D终端显示设备。该设备是利用空间错视原理,对于2d拍摄图像进行分层透视处理,结合空间的纵深感,产生裸眼3D的效果的投放设备。它能够为用户提供逼真的三维图像和沉浸式体验。它是由一个封闭的空间组成,内部配备了高分辨率的全息投影装置。

结合数字人呈现效果,通过全息仓呈现出来的数字人,整体的清晰度因为光线原因会呈现出不同效果,但是在3D立体感上面就,以裸眼的视角去观看,就会感觉真的站了一个人在你的面前。

2. 大屏常见第三方集成能力

1)语音模块

  • 语音识别(ASR):用于大屏设备,来听懂用户说的内容;
  • 知识库(NLP)或者大模型:基于ASR获取的问题,去NLP或者大模型获取对饮的答案,这个也是考研最终输出的答案正确性以及易懂性的关键。目前因为今年大模型的快速发展,已经可以输出更加易懂与人性化的内容了。当然基于银行这类金融行业的特殊性,业务甲方还是会考虑回答内容的准确性,所以更多的还是会选择NLP(因为风险可控)。
  • 语音播报(TTS):在获取需要播报的内容后,通过语音播报的方式与客户交互,可以理解为语音的输出,一般可以配置音色、语速等。

2) 智能交互模块

  • 摄像头识别:可以理解为大屏设备的眼睛,用于很多业务交互的设计,比如识别到有效对象,触发部分特定业务。
  • 去除回声与降噪:常见的会有两种方案,一种是收音设备本身就会自带降噪或者说音色识别等能力,另外一个就是通过算法来实现。
  • 语音唤醒:通俗易懂就是类似“小度小度”此类,关键词语唤醒或者打断原有播报。

3)数字人模块(本文主要阐述与数字相关的大屏方案)

数字人形象:

  • 数字人大屏终端渲染:数字人渲染直接在大屏上基于大屏的硬件条件,实时渲染数字人的效果,包括数字人的口唇驱动,全身驱动,背景等要素的驱动。
  • 数字人云端渲染:在云服务器上进行数字人渲染。

需要对接第三方推拉流厂商,数字人的渲染是用的云端服务器的性能,在通过推拉流的服务推送到“房间”。

推拉流在大屏终端嵌入推拉流SDK,端上的SDK也进入“房间”实现通讯。

3. 大屏的最优设计建议

1)大屏使用距离

为了让数字人真实存在于场景中,与用户建立舒适安全的沟通,我们需要探究合适的人物身高与大小以保障用户与虚拟人之间距离适中交互自然。——在大屏的使用场景中,用户与屏幕需保持 50cm 左右的操作距离。

2)大屏交互方式

①主动服务

当用户进入与数字人的交互区域,大屏自动通过图像人脸识别获取用户信息,数字人进入服务状态,主动说话并推出服务卡片,让用户能够快速建立服务认知,聚焦任务操作。

②指引明确

屏用户天然习惯点击操作,在信息输入方式上,对于不同类型的任务需要引导用户使用 GUI 操作还是语音输入表达诉求,强调:“试试说 ” 与 “选择” 的引导差异。同时在交互中的每一个状态下,都需要让用户明确我现在可以做什么,如何做,可以获取什么结果。要求数字人与用户交互的每一个节点明晰,引导通俗易懂,操作简单。

③渐进式引导

为减少用户理解成本,我们在信息与操作的引导上采用单一路径,用户只需要跟随虚拟人的逐步引导,傻瓜式操作即可流畅完成服务。

④分支处理

在一问一答的语音交互中,有很多潜在分支需要处理才可以还原自然体验。比如用户在服务进行中长时间未给出明确操作,至少会有两种情况:1.我们认为用户可能存在困惑,虚拟人会主动引导用户进行限定内容选择或聚焦提出问题。2.本身反馈内容较复杂冗长用户未操作则可能是还在消化信息,虚拟人需要延长等待时长等等。

3)大屏最佳操作区的设定

根据人因工程学,确定出大屏的最佳交互区域最佳可视区,来展示核心卡片信息。以 55 寸大屏,1.68m 平均身高用户来进行方案探索。依照人体站立不屈膝,右侧大臂可旋转横向和纵向角度计算出最佳交互区域。

根据最佳交互区,我们可以将核心交互卡片放置于此,次级交互放置于外沿,边缘区域不适合放置操作内容。

4)大屏最佳可视区的设定

水平可视区域:

双眼区域大约在左右 60° 以内,观察超出左右 60° 的物体时,则需要集中精力才能识别物象,因此核心内容区域在左右 60° 视角内较为合理。

垂直可视区域:

基于对交互区和可视区的计算测量,在页面布局中,我们将信息卡片最大程度的置于有效视区和次级交互区的重叠区域,用户可以最舒适的状态进行阅读和操作;

4. 典型客户案例分析

1)浦发银行

个人评价:

  • 能用逼真的语气、语调进行多轮自然对话;
  • 利用 3D 合成技术,复刻真实人物,有逼真的外形、表情、肢体动作;
  • 可感知环境且做出实时反应。
  • 浦发数字人正在用自己的“亲和力”提升数字金融服务的内涵,让浦发的用户感受科技金融、数字金融带来的魅力。

2)农业银行

个人评价:

  • 实时语音对话交互,识别效果较好。
  • 不确定在嘈杂环境下,此模式的实际效果。
  • 数字人的对话框以及内容展示区域较为一般。
  • 数字人没有肢体动作,较为死板,交互感一般。

5. 数字人大屏优势

本文作者 @毅鸣

版权声明

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部