扎克伯格的贾维斯没那么牛? 那我们关注它干嘛?

最近,扎克伯格终于将亲自编程的AI管家“贾维斯”以视频的形式公布于众,又在社交网站上一起一片热议和围观。

腾讯视频

收起视频

转到视频页

扎克伯格的贾维斯不止能够控制室内温度、亮度、播放音乐,甚至请来了好莱坞著名演员摩根·弗里曼来配音,这位老艺术家曾在《冒牌天神》中扮演过上帝。

每天听着上帝的声音对你说“Good morning”“Good night”该是多么神奇的体验。

然而小扎在自己的贴文中也说了,视频中展示的贾维斯的功能也有突出“幽默”的一方面,真正的贾维斯其实还需要不断的完善。这一点在贾维斯披露之前也被印证了。FASTCOMPANY曾受邀进入了小扎的家现场体验了贾维斯的“服务”,写下了这样的报道:

扎克伯格还建立了响应语音指令的系统,并通过定制iOS应用控制。但这部分展示不太理想,他重复了四次指令才让系统弄明白:天黑前不要开灯。扎克伯格略显尴尬地说:“喔,这应该是它最失败的表现了!”

不过,贾维斯播放音乐的展示还算成功。扎克伯格下令:“给我们放段音乐吧!”几秒钟后,大卫·库塔(David Guetta)的《Would I Lie to You》 开始通过客厅扬声器响起来。他说了两次“把音量调高”后,系统照做无误。最后,他同样说了两次才让系统停止播放。

这非常有意思,因为从新闻来看“天黑前不要开灯”和“把音量调高”的失误显然都不是命令理解(语义)上有问题,否则你说八百遍贾维斯该不好使还是不好使。如果不是语义的问题,那显然就会和各大公司所宣称的已经被解决的问题:语音识别有关。

标准环境解决≠真实效果好

关于语音识别的精度今年官方的报道一般是这样的:

11月21日到23日,搜狗、百度和科大讯飞三家公司接连召开了三场发布会向外界展示了自己在语音识别和机器翻译等方面的最新进展。值得注意的是,这三家公司几乎在同一时段宣布了各自中文语音识别准确率达到了97%。

类似的报道也会发生在微软等的身上,我们假设Facebook做的不是太差,水平也与此类似达到97%的准确率。

▲视频中小扎对贾维斯说“shoot me a new grey t-shirt ”,贾维斯就为他投出了一件T恤

97%的具体含义是100个单词上只有3个错误(删除、被替换、被插入),那么问题就来了,如果真实环境里真的达到了这个精度,那么小扎的演示可能会比上面的视频演示更加犀利——比如在开party的时候听主人的命令调节音乐和灯光啊,无论走到家里哪个角落都能响应主人的指令啊这样。

那问题出在那里?

关键问题并不复杂,扎克伯格用手机当做家庭里的终端,这样距离稍微一远,环境稍微嘈杂一点,那再好的手机也没办法帮Jarvis听清楚你在说什么。

▲对着各种手机助手努力说过话的你一定能懂

手机本身是设计给近场(近身场景:包括距离话筒距离近、环境音单纯)用的,手机上的语音识别基本也是给近场优化过的,怎么也不能弥补远场上带来的不适应。

扎克伯格对此非常坦诚,他在贴文中说语音识别更多时候是专门场景下好用,想做一个万能的版本仍然还很遥远。语音识别只能做限定场景的最佳。

▲比如在夜深人静的时候给自己开个灯什么的

目前贾维斯还属于扎克伯格的个人作品,尚有不完善的地方也能让人理解。不过实际上小扎在其充满学习乐趣的分享之中,很直接地向世人灌注了他对未来的想像,并且通过实作让大家知道,即便是一人之力,也能通过各种资源将未来的世界带至自己的身边,将梦想化为理想。

同时作为Facebook的CEO,如果他利用手边所拥有的全球顶尖的工程师之力与社交网站所取得的深度学习资源,要说哪天贾维斯真的跟复仇者联盟的故事发展一样进化成为真正的超人幻视,似乎也不见得是痴人说梦的事情。

文/科技画报TechShot

关键字:业界动态, 产品经理, 贾维斯

版权声明

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部