从领先到落后,苹果 Siri 和它动荡的 7 年时光
从被仰慕到被调侃,Siri 足足花了七年时间。而Siri 的未来会走向何方,也许只有苹果自己才知道。
2011 年,在 iPhone 4s 面世的当天,苹果 Siri 也以智能语音助手的身份初次正式亮相,并成为当时发布会上最大的亮点。三年后,亚马逊的 Alexa 初试啼声,又过了两年,Google Assistant 姗姗来迟。
但 7 年时间过去了,这个最早登场、并被大众所熟知的语音助手正在不断被后来者弯道赶超。仅仅问世 2 年的 Google 在今年年初已经表示,旗下的语音助手 Assistant 将在年底前支持 30 种语言,相比之下,目前 Siri 仅支持 21 种语言。
在此前《从 iPod 到 HomePod》一文里,我们提及了最新的 HomePod 并没有将智能语音助手作为主打功能,而是将重心放在了音乐上。一方面,流媒体服务关系到苹果的音乐核心;而另一方面,Siri 现在的表现的确很难在和亚马逊 Alexa 和 Google Assistant 的竞争中获得优势。
从最初的领先者,到不断被后来者居上,苹果 Siri 到底经历了什么?背后是否有其它的隐情和故事?
《The Information》近期通过采访多名苹果前员工,向我们展示了这 7 年里苹果 Siri 团队内部的纷争和混乱,以及它是如何一步步浪费掉了自己的“首发优势”。
LONDON, ENGLAND – OCTOBER 14: A man uses ‘Siri’ on the new iPhone 4S after being one of the first customers in the Apple store in Covent Garden on October 14, 2011 in London, England. The widely anticipated new mobile phone from Apple has seen customers queue in cities around the world for hours to be amongst the first to buy the device. (Photo by Oli Scarff/Getty Images)
仓促上阵的半成品
在 iPhone 4s 上首发亮相后,Siri 当仁不让地引发了一股智能语音助手的潮流。但当用户对待这个新生事物不再怀着“调戏机器人”的好奇心、而是逐渐回归理性后,Siri 也开始暴露了它在自然语义理解上的不足。
事实上,在 iPhone 4s 发布前,苹果 Siri 团队并未做好充分的准备。面对当时的半成品,团队在到底是“推倒重来”还是“继续改进”的问题上产生巨大的分歧,归根结底,当时的 Siri 呈现出的效果距离团队所希望实现的定位还有很远距离:
“Siri 应该是一个能快速准确地获取信息的助手,或是熟知如何处理复杂任务的助理。”
NEW YORK, NY – MAY 09: CEO and co-founder of Viv Dag Kittlaus speaks onstage during TechCrunch Disrupt NY 2016 at Brooklyn Cruise Terminal on May 9, 2016 in New York City. (Photo by Noam Galai/Getty Images for TechCrunch)
(图片来源:The Information)
我们都知道,Siri 的前身是一款语音助手应用,在 2010 年被苹果花费 2 亿美金收入囊中,而这一项目背后主导者便是乔布斯。Siri 公司的创始人之一 Dag Kittlaus 在描述自己与乔布斯的接触时,曾表示他和乔布斯在家里“聊了 3 个小时关于未来的超现实主义话题”。乔布斯对人工智能的未来充满憧憬,他让 Siri 的初创成员相信:
“Siri 最终会在宇宙中留下自己的痕迹”。
为了保证 Siri 能够和 iPhone 4s 一同按期发布,早期的 Siri 团队不得不搁置了一项名为“App Store for AI”的计划,这是一项面向第三方开发者的计划,可初期乔布斯希望 Siri 更专注于苹果能够完全掌控的领域,并承诺之后会基于 Siri 建立一个第三方生态系统。
但在 Siri 正式发布的第二天,乔布斯去世了。Siri 团队从此失去了一位重要的支持者。这意味着 Siri 团队最初的计划被全部打乱,也为后续的混乱状况埋下了种子。
“史蒂夫的离世,让他们失去了方向,宏伟蓝图不复存在。”
更糟糕的是,一位苹果的前员工表示,由于苹果多年以来的封闭文化影响,导致开发者在最初根本无法为 Siri 开发第三方应用服务。直到 2016 年的 WWDC 大会上,苹果才向开发者推出了 Siri SDK,也就是 SiriKit。这距离 Siri 的初次亮相已经过去了 5 年时间。
选择封闭,很大程度源于苹果公司所一直注重的隐私安全,因此在每一次面对“开放”这个话题时,苹果都显得保守而谨慎。与之相对,谷歌的语音助手平台则选择向开发者提供全部的对话文本。
在选择开放还是封闭策略这个问题上,亚马逊也曾面临过类似的困扰,目前在 Alexa 服务上,亚马逊则是希望能够在数据共享和隐私上取得一个平衡。
如果 Siri 想要实现最初的愿景,成为一个真正的人工智能助手,建立一个必要的开放平台已经是当务之急。
囿于“办公室政治”的囚笼
Siri 现在的状况,和一路走来团队的人事频繁变动不无关系。
乔布斯的离世固然对 Siri 团队造成了不小的打击。不过乔布斯只是将 Siri 带进苹果的引路人,另一位参与并支持 Siri 业务的是 iOS 的前高级副总裁 Scott Forstall。这位因苹果地图和 Siri 事件则而饱受指责的苹果前高管,在 2012 年 10 月被迫离开了苹果。
业内普遍认为,Scott Forstall 的离开,苹果地图和 Siri 表现不尽如人意只是个导火索,更多是因为他和乔布斯类似的粗暴性格,造成了与其它高管间的关系交恶。
SAN FRANCISCO, CA – JUNE 11: Apple Senior VP of iPhone Software Scott Forstall speaks during the keynote address at the Apple 2012 World Wide Developers Conference (WWDC) at Moscone West on June 11, 2012 in San Francisco, California. Apple unveiled a slew of new hardware and software updates at the company’s annual developer conference which runs through June 15. (Photo by Justin Sullivan/Getty Images)
(图片来源:The Next Web)
但初期的 Siri 主要问题暴露在更新过慢和服务器不稳定上,几名受访的前员工说,协助 Scott Forstall 管理 Siri 团队的新主管 Richard Williamson 在 Siri 的换代更新上,采取了和 iOS 一样的策略 —— 即通过每年一次的方式进行大版本升级,但对于一款需要不断获得实时改进的智能语音服务来说,一年一次的更新根本无法跟上发展的步伐。
另一位负责改进 Siri 后端服务器的员工则表示,在 Siri 刚刚上线时,苹果还未构筑起足够稳定的服务器来承受初期庞大的用户流量,而在改进了代码后,原本需要 500 台服务器的 Siri 请求任务被缩减到了 5 台。
最终,在 Siri 发布的第一年里,虽然在服务器稳定性和性能上都获得了一些提升,但其内部架构依旧没有发生变化。而受地图事件事件影响,Richard Williamson 之后也被苹果所解雇。
不过,被多名前员工指责的 Richard Williamson 在回复《The Information》邮件中表示,这种说法是“完全错误”的。他称自己更多是负责让“Siri 团队恢复正轨”,而相关软件和服务决策则是来自于更下位的员工。
另外,他曾希望团队尽快实现 SiriKit ,并获得来自第三方开发者的支持,但被以“原生软件还没有准备好”的理由而遭到抵制。对于 Siri 初期的糟糕表现,他认为这更多来自于团队本身,而非他个人的原因。
(图片来源:Wired)
Richard Williamson 和 Siri 团队在策略上的分歧,让一些 Siri 初创团队的成员心生去意,其中也包括了 Adam Cheyer 和 Dag Kittlaus。作为 Siri 最初的两位创始人,两人先后于 2012 年选择离职,还带走了 Siri 初创团队三分之一的工程师。
他们在 2014 年创办了一家名为 Viv Labs 的新公司,同样主打智能语音助手服务,这家公司于 2016 年被三星收购。
虽然现任苹果 CEO Tim Cook 表示,自己不喜欢搞办公室政治,而是希望有一个快速发展的公司。但事实上,办公室政治,已经在不断侵蚀着 Siri 的命脉。
搜索、语音识别、自然语义的派系纷争
按照乔布斯最初的想法,Siri 希望进入的是 AI 领域,而非打造成一个搜索引擎。一名 Siri 员工说,他希望最终将 Siri 打造成类似电影《Her》中的“萨曼莎”的样子,这部电影描述了一位优秀的虚拟智能语音管家,她为我们呈现出当人工智能拥有和人类一样的细腻情感后,人机相恋的一种可能性。
但智能语音助手和搜索引擎是相辅相成的,更聪明的搜索逻辑能够更快的帮助用户找到答案,这也是为什么 Google Assistant 能够快速发展的原因。
JOAQUIN PHOENIX as Theodore in the romantic drama “HER,” directed by Spike Jonze, a Warner Bros. Pictures release.
Scott Forstal 离开后,苹果挖来了亚马逊搜索部门以及广告业务的高管 Bill Stasior 来管理 Siri,主要负责语音识别、自然语义理解和搜索等多个 Siri 核心团队的管理工作。
从前员工的表述来看,Bill Stasior 显然更倾向于将 Siri 打造成一个世界一流的搜索引擎,他将当时苹果在搜索功能方面的资源和 Siri 聚合在一起,以进一步提升 Siri 的性能,包括在网页、媒体资源以及 Wiki 百科领域的搜索能力。
Bill Stasior 在 2013 年主导收购了社交网络分析公司 Topsy Labs,用于增强苹果在 macOS 和 iOS 系统中的 Spotlight 检索能力;2015年,苹果收购了人工智能公司 VocalIQ,之后被运用到了Siri 的日历提醒功能中。
但由于编程语言的不同,Siri 和 Topsy 之间的数据无法很好的进行整合,这导致用户当时在使用 Siri 和 Spotlight 进行搜索时会出现不同的结果,因为这背后完全是两种不同的搜索技术,甚至是源自两支不同的团队。
而在 Siri 十分重视的语音识别领域,苹果不希望将技术寄托在外包语音公司 Nuance 上,而是希望能自己打造了一支专门负责语音识别的团队,为此苹果挖来了多年为微软研究语言科技的 Alex Acero 来组建一支新的团队。
在 2014 年 4 月,苹果还另外收购了一家语音识别技术公司 Novauris,原计划就是让它和 Alex Acero 两者合作,以进一步提升 Siri 的语音识别能力。
但这个合作只持续了六个月就被中断,Alex Acero 继续负责带领语音识别团队,而另一支自然语义团队则交由来自于麦肯锡公司的 Anoop Sinha。在一些前员工看来,这位没有任何技术背景的管理者,更像是被派来参与到办公室政治纷争的人。
此后,这两支团队的负责人多次在会议上出现争论,这种状况逐渐演变成一种派系间的对抗,也直接引发了一连串的资深员工的离职事件。最终,Anoop Sinha 在 2016 年离开了苹果。
值得一提的是,Bill Stasior 同样对 Adam Cheyer 和 Dag Kittlaus 建立自己的新智能语音公司 Viv Labs 感到不满,为了预防出现挖角和跳槽,苹果之后还禁止这两位 Siri 创始人回到苹果园区和前同事打篮球。
计划外的 HomePod,可能是个新开始
回到苹果最新的产品 HomePod 上,此前《苹果 HomePod 秘闻》一文里曾提及,早在 2012 年苹果内部就提出了 HomePod 的概念:“一群 Mac 音频工程师希望能够打造一款媲美 Bose、JBL、哈曼·卡顿等大牌音频厂商的发烧级产品。”
实际上,Siri 团队直到 2015 年才知道这款音箱产品的存在,一场突如其来的会议要求 Siri 和 Beats 团队人员密切合作,将智能语音助手服务接入 HomePod。
或许苹果一开始并没有打算将 Siri 功能加入到 HomePod中,直到 2014 年底亚马逊推出了 echo 智能音箱。
但 HomePod 还是没有逃开苹果的封闭生态圈,Siri 表现出的“不开放”再次成为了众人指责的焦点。虽然 SiriKit 同样支持 HomePod,但对比亚马逊和 Google 的第三方软服务依旧十分有限,在此期间,苹果负责 SiriKit 的主管也已经换了两次人。
2017 年 9 月,苹果任命原主管操作系统开发工作的 Craig Federighi 为 Siri 的新主管,Bill Stasior 则向他汇报工作。这大概是个好兆头,意味着 Siri 更加被重视,而有了 Craig Federighi 的保驾护航,Siri 团队未来应该不会走得太坎坷。
从被仰慕到被调侃,Siri 足足花了七年时间。对于这个如今掌控着全球 5 亿活跃用户的智能语音服务来说,Siri 的未来会走向何方,也许只有苹果自己才知道。
作者:木斯
来源:爱范儿
关键字:语音助手, siri, 苹果, 语音
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!