AI产品必读:扎克伯格的“元宇宙”必备八要素
编辑导语:近来Facebook改名Meta的新闻想必不少人有所耳闻,可以看到,抛开其他因素,元宇宙这一赛道的确吸引了众多玩家入局。那么关于元宇宙,我们可以如何理解?不妨来看看扎克伯格提出的元宇宙几大要素,也许可以让你对这一概念及其未来发展有一个更清晰的认知。
最近作者沉溺于美股、A股、港股三大资本市场风云变幻,看到的最大新闻莫过于Facebook改名叫“Meta”,all in 元宇宙。
上一个互联网巨头高调all in的还是李彦宏说百度要all in 人工智能、无人驾驶,四年之后,由于该业务体量太小,对主体业务贡献不足2成,资本市场并不买账,股价在年初的昙花一现后进入下跌通道、甚至一度沦为互联网公司的计量单位。
反观大洋彼岸,facebook由于社交霸主地位被tiktok挑战,再加上其近两年在政治立场、避税、竞争、垄断、侵犯个人隐私权及知识产权等问题,另其保守批评,在资本市场上的关注度也逐步下滑、甚至已经被挪到赌桌边缘。于是改名叫“META”,all in 元宇宙,似乎是扎克伯格的最后奋力一搏,要赌就赌全部身家。
我们姑且对于这种all in云宇宙背后的动机是势力方的博弈还是扎克伯格真的看好这个赛道按下不表,但是从扎克伯格的演讲中总结的“元宇宙”八大要素,个人认为非常值得各位产品经理同学们认真做笔记、拆解分析,看看这些方向如何跟自己的产品工作相结合,并帮助未来更好的甄选赛道、甚至是选股投资。
扎克伯格提出元宇宙需要具备的八要素如下:Presence开发平台/套件、虚拟化身(Avatars)、家庭空间(Home space)、隔空传输(Teleporting)、跨平台互操作(Interoperability)、隐私与安全(Privacy and safety)、虚拟商品(Virtual goods)以及自然界面(Natural interfaces)。
一、Presence平台
首先presence指的是Facebook推出的构建元宇宙的平台,旨在帮助开发者在oculus构建XR,提供工具。
其中presence提供了三款主要的工具集,分别是insight sdk、interaction sdk和voice sdk。
insight sdk基于空间锚点和场景理解技术,可以帮助开发者在真实的空间中进行虚拟物体的摆放、且符合物品之间的空间关系、遮挡关系,类似google推出的google AR core和苹果的AR kit。
interaction sdk主要基于手部动作的交互,具体操作包括指、戳、捏、投射等。
voice sdk是由wit.ai 自然语言平台提供支撑,可以为开发者提供语音导航和搜索等功能。
interaction sdk基本操作:
二、虚拟化身 avatar
虚拟化身这个概念大家应该并不陌生,比如iPhone最早推出的Memoji,虽然只是针对通过捕捉用户面部关键点进行进行虚拟重建,但是可以通过真人表情动作进行驱动,根据用户脸部特征进行风格迁移,生成具有用户特征的虚拟形象,也支持用户自定义捏脸;OPPO今年也推出了类似产品omoji。
而腾讯因为当年的爆款产品QQ秀,自诩为数字孪生的始祖,自己想了想,觉得这话没毛病。
数字孪生-avatar始祖——qq秀:
苹果上周新发布的macOS12 monterey支持Memoji账号形象的定制:
OPPO在本周结束的ODC2021开发者大会上宣布将开放Omoji能力给开发者调用:
随着手机厂商的大力推广,相信下一步衍生的基于虚拟面部形象的应用会越来越丰富,除了现在的视频通话、社交、视频录制等场景之外,在meta的元宇宙的场景中更多是以一个完整的人身(面部+身体)虚拟重建,参与游戏或者是与其他伙伴协作办公、创作等等。
最近小红书上又有一款现象级的身体重建产品叫3D body visualizer,支持用户根据自己实际的身高、体重、运动频次等重建3d虚拟身体,本人亲测基本跟实际的体形十分吻合,下一步之需要通过动作捕捉camera对人体的关键点检测跟踪就可以驱动虚拟人身了。
body visualizer
未来可以期待的虚拟化身类似头号玩家的样子,每个人在数字孪生的空间中拥有另一个自己的形象,由现实中的自己驱动虚拟世界中的自己与世界和他人交互。
头号玩家——元宇宙成功时候的样子:
三、家庭空间 home space
家庭空间在扎克伯格的元宇宙中扮演重要角色,是元宇宙假设成立的“人、物、场”当中的场。
由于疫情逐渐常态化,社交隔离已经成为人们日常生活中的一部分,人们在家中娱乐、玩游戏、社交、远程办公、会议,而oculus产品本身已经承载上面的全部功能,oculus的主要使用场景就是家庭、家庭空间则是用户与oculus交互的核心场景。
如何在已知的场景中让产品更好地为用户提供服务。oculus在使用交互中最重要的一个步骤就是划定用户活动边界,因为当用户完全沉浸到元宇宙中时是完全看不到真实空间的,但是用户还是会在场景中进行活动,家中摆放的家具就可能会让实际活动中的用户发生意外。
此外在家中由于环境的差异会产生不同的声场,因此空间音频也会是影响用户判断物体方向的重要一部分。苹果就在其产品上竭力打造spatial audio的基于三维空间方位的声音交互,其目的可以猜测也是为了打造更加真实的元宇宙。
oculus支持用户自定义真实环境边界,并实时感知防止用户“越界”发生危险:
苹果专利——空间音频:
四、隔空传送 teleporting
teleporting这个词最早存在于科幻小说中,描述的是把人或物从一个地方一瞬间移动到另一个地方,类似哈利波特的飞路粉和传送门或者是哈利波特的任意门。
早年间微软也提出过这个概念,比如说全息通信,包括Google前段时间的开发者大会也发布了project starline,即使相隔千里也有这个人就坐在你面前的即视感。
扎克伯格在会上承诺通过meta一定可以实现,并且就像连接网络一样容易。这里最最重要的就是临场感、沉浸式。
一切交互都是实时的,你与其他的角色、与虚拟的场景交互考虑到网络延时抖动、数据上传/下载、素材渲染、算法计算等等都必须是毫秒级别进行处理,只有高可靠、低延时、大并发、高带宽的计算能力才能支撑presence的场景。比如5G连接、千兆光纤连接、Wi-Fi6,再比如云-边-端协同的计算方式,因为在要求实时性很高、计算量很大的情况下,完全依赖云端算力是完全不可行的。
而teleporting主要依赖的VR头显不能过重,因此边端协同显得极为重要。端侧需要有传感器的输入、本地的跟交互相关的算法(姿态、位置、手势、眼动、触控、声音、触控等等)、端侧同样要进行场景的渲染,数据通信、数据缓存等等。
microsoft mesh-holography:
google——project starline:
meta提出的元宇宙健身场景:
五、设备互操作 interoperability
因为元宇宙接入设备的种类各式各样,我们在元宇宙中也需要操作现实中的设备,如何实现多设备之间的互联互通?
举个例子,我在meta元宇宙中开会,需要打开我现实生活中的电脑,找到相应的ppt并打开展示到元宇宙的会议室大屏上,让大家可以一起讨论。
比如说我在元宇宙中需要把我手机上的某张照片share到元宇宙场景里,让大家都可以看到他实际挂在会议室墙上的样式、大小、比例、光影。
这些都是元宇宙能成立的基础功能。
很多人可能会说,苹果、华为很多厂商不都可以实现多设备互联么?比如通过AirDrop各种文件的互传,比如我在手机上复制的一行文字、这个时候我操作我的MacBook可以直接在浏览器里打开这个网站。
但是大家需要注意的是,每个产品由于其的输入方式的不同、导致其交互方式千差万别。比如笔记本是生产力工具、其主要人机交互方式是通过键盘鼠标、单机双击拖拽滚动,而手机和平板类的交互方式主要是通过点击、滑动、长按等等,在vr场景中的交互方式又变成了用手势手柄指向、捏、拿等等,再比如在自动驾驶场景里人们的交互方式又变成了语音交互为主。
如何让这些不同的设备除了数据层面的互联互通(这个目前应该已经都实现了)而且还能做到交互层面的无缝衔接,这个应该是元宇宙的产品设计者需要考虑的最核心的问题之一,难点之一。
六、隐私和安全 privacy and safety
隐私和安全这个不需要赘述,因为云宇宙的个体不仅仅是传统互联网意义上的账号、密码、个人信息等等,他是数字孪生的个体,你的虚拟世界的1:1复刻,包括你的生物信息等等这些都会承载于此,如果被盗用或者是篡改的严重性可以理解成为在生活中被他人冒名顶替,因此数据安全、用户信息的隐私和安全至关重要。
这也是Facebook之前被人诟病的一部分,希望通过meta元宇宙事业,扎克伯格可以一改公司在行业中的认知。
七、虚拟物品 virtual goods
metaverse之所以成为一个verse,跟我们现实生活是一样的是由物质/物体组成的,或者我们称之为素材、海量的与现实世界一样的虚拟数字资产,而这部分内容的创造肯定需要相应的生态,meta做了个全球最大的元宇宙的台子(全球保有量最高的VR产品oculus),需要邀请各家在meta上创造内容和素材。meta的相关负责人也会投入150亿美元去训练和构造相应的内容生态。
同时人们还是在元宇宙的世界中跟现实的物体进行交互,只不过你看到的是现实物体在元宇宙的数字复刻,这就需要相应的计算机视觉中小物体重建的相关技术。
八、natural interfaces
在Facebook的connect会议上,除了提到改名的事情外,Facebook还计划发布一款手表,通过佩戴该手表用户可以通过手写相关字母就可以实现文本的输入,包括我们前面提到的通过手部动作、眼动、语音交互等等这些符合我们现实生活当中的更加自然的交互方式,是未来元宇宙的必备元素。
我们肯定希望人们是没有任何学习成本的,将现实生活中人们的天然交互方式无差异的移植到/继承到元宇宙的交互当中,这就需要技术上积累多传感器的融合计算技术,比如带深度的/红外的/灰度的/眼动跟踪的各种摄像头,比如可以检测动作、速度的重力传感器/加速器/陀螺仪、温度传感器、麦克风、多方位部署的喇叭等等,高清晰度的高帧率的大视角的显示技术等等。
元宇宙的必备要素——自然交互方式
手表支持手写输入
通过上述八要素的技术迭代与演进,相信未来元宇宙的世界很快就会到来。读者们有没有研究相关技术或者相关产品的呢,或者你对于元宇宙的观点是如何的呢?欢迎留言分享交流。
作者:大仙河,7年AI产品相关经验;微信号 :大仙河知识学堂
作者 @大仙河
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!