苹果卷入大模型,手机行业借AGI「吃掉」软件层?

苹果重新定义了AI(Apple Intelligence)。

6月11日凌晨1点,苹果公司召开了今年的开发者大会WWDC,用了首场发布会将近一半的篇幅来讲AI如何整合到苹果系统中,将人工智能化于无形,融进Apple Intelligence。

媒体和资本评价两极化,一部分认为苹果这次出手,软硬件结合,在系统层面提供了AI能力,一夜之间灭了许多AI创业者的生路——毕竟在当下的节点,利用OpenAI 接口包装一个翻译插件或者脑图都算是创业,这可叫AI公司怎么活。

反方则认为苹果此次更新了无新意,原地雕花,不够炸裂,新功能还是基本集中在「文生图」、「文本总结」、「跨应用联动」这些老生常谈的功能上。从发布会后的股价上涨近7.26% 的表现来看,资本市场倒是对「苹果AI」基本满意。

无论Apple Intelligence有多么诱人 华丽,也只是苹果提前画的大饼,英文版今年秋天上线,其他语言要到明年才会有后续。半年时间,对AI公司来说可以做很多事。会有其他竞争者对苹果的蓝图提出挑战吗?

一、科技公司全面卷入AI

AI浪潮以来,美股七雄(Magnificent 7,即美国市场上市值最大的七家科技公司,包括Alphabet、亚马逊、苹果、Meta、微软、英伟达和特斯拉)分化明显,市值排序跌宕起伏。

在6月5日大涨后,「卖铲子」的NVIDIA市值超3万亿美元,超越苹果,距离3.15万亿的微软只需再涨不到5%;微软借AI登上第一,乘了OpenAI的东风,并乘势建立了更好的工具和商用系统,推出了AI-PC,23年营收达到惊人的2210亿美元;Meta用开源大模型造福了一票国内公司,用AI改进广告,内容审核和个性化推荐,利润翻了两番;亚马逊将AI整合到AWS框架中,意在企业级AI,它还投资了Anthropic,与NVIDIA合作Blackwell Gpu;Alphabet对标OpenAI节奏,但总感觉失之毫厘,略有涨幅;特斯拉掉队,苹果踟蹰不前,还在画饼。

大模型方面,科技公司都有fomo(fear of missing out)效应,人无我有,就很尴尬;产品和生态上,后发制人有优势。非盈利机构OpenaAI是最大造浪机,苹果与其合作,水到渠成。

苹果放弃造车后,一门心思钻研AI更广泛的应用,思路与其他 6 家不同,提出个人化AI(Personal),区别于微软的工具性AI(Azure/Microsoft365/Copilot),用尽生态优势,更重视操作的「非AI感」,理解用户身处的情境,和用户的生活交融,强调隐私保护。

苹果发布会上演示的例子是去机场接妈妈,Apple Intelligence可直接读取妈妈发来的航班信息,查询航班延误情况和机场交通,直接生成行动时间表并更新在日程中,本身要花好几分钟安排的事现在可以自动完成了。与siri类似,是生活工作小助手的定位,但更强大。

语言界面替代了操作界面,Apple版AI更理解人的需求和语言意味,而非仅仅在数值上更聪明,跑分更高。这是在让AI对齐人类生活方式,取巧,但又十分合理。

据「新皮层」报道,Apple Intelligence的模型架构主要由3部分组成,按调用的优先级,分别是自研的端侧模型、云端模型和GPT-4o等第三方模型。其中自研模型是苹果发布的一系列小型模型,包括可以读懂iPhone屏幕的多模态理解模型ReALM(Reference Resolution As Language Modeling),OpenELM(开源高效语言模型)等。苹果的模型能力不及OpenAI,是苹果选择接入第三方模型的原因。第三方模型可能不止GPT-4o。《华尔街日报》也曾于3月报道称,苹果还曾与百度初步谈判,以在其中国版设备(比如 iPhone)中使用后者的AI技术。苹果从未证实这一传闻。

这么看来,Apple Intelligence更像是多种模型组装的工具包,各司其职,各尽其用。AI在苹果生态里,与其说是对话唱歌画图的小软件,不如说是帮人完成一系列复杂操作的AI-Agent,它联通各平台设备,粘合使用体验——肯定有一部分是以智能家居的那种方式,另一部分就可以展开想象。

当然,AI的聚合、融合,还是依靠AI公司、资本、政府的高期望。对很多人来说,这个期望的化身,就是AGI。

如果把实现AGI当作最终目标,当下AI处在大投入大基建的状态:投算力、投新型的数据中心、投模型,三类投资分别对应的是生产GPU 卖GPU的云 用GPU训练模型的公司,也就是英伟达、AWS Azure和OpenAI等大模型公司。苹果算是其中的异类,既不开发新模型,甚至也没有推出新应用,只是整合。

但AGI的实现还很遥远。造富路上,AI公司开始破产、倒闭、求收购。

2024年第二季度还没有结束,曾经有10亿美元估值、180名员工、创造出Stable Diffusion系列模型的明星独角兽 Stability AI,就出现资金链断裂,寻求合并。前OpenAI和谷歌AI开发人员创立的AI公司Adept,也在谈判售价。在「洗牌期」,就算有足够资金支撑下去的AI公司,都开始了裁员和降本增效。

这些现象暴露出残酷的行业现状:包括巨头在内,所有AI公司/项目都盈利困难。连OpenAI也只能靠不断融资来支撑ChatGPT高昂的运行成本。「摸着 OpenAI过河」,将订阅模式和企业版模式作为行业统一标准的其他玩家,只会更艰难。Meta为AI建设增加了约100亿美元预算,但未来几年内依然不指望盈利。

据行研机构PitchBook 数据,AI创企在2021-2023年获得了约3300亿美元投资,同比增长2/3,但很多AI创企的钱仍不够花,高昂的AI建设成本、人工成本已经拖垮不少AI公司。

国内风景独好,炼制大模型的巨头无忧生存,却因竞争激烈,打起了价格战。5月6日深度求索(DeepSeek)发布的DeepSeek v2,提供的API定价仅为GPT-4-Turbo的近百分之一,之后智谱、字节、阿里、百度、科大讯飞和腾讯都纷纷下调了部分大模型的API价格。

考虑到国内大模型,大部分是针对企业用户和特定行业,也许是性能评测标准不够刺激,也可能是大模型落地难,性能遇到了瓶颈,只能同质化竞争,价格战成了国内大模型行业问题的缩影和最终解决方式。

国内的AI公司和产品,长时间对标OpenAI,希望自家养的AI在跑分、推理、表现都超过GPT系列,是否做到暂且不谈,但其中有一些误区。AI不同于搜索引擎、平台入口、内容站,它的技术性远高于后者,在实际进入应用领域前,是纯粹科学和技术的事,也是纯投入的事业。

国内环境,人们对于AI的实质和AI的真正用途之间,有一道「理解鸿沟」,这首先是大模型的黑箱性质所造成的,但同时,国内的AI产品,无论是豆包、元宝、Kimi,还是激进地投入整条赛道的阿里做出来的东西,目前所呈现出来的能力,很难让用户持续买单,更别说让企业级用户认同。毕竟GPT-4o和Midjourney早已设立了标准。

苹果AI的确为国内市场打开了一条思路:跑分再高也只是抽象能力,自研模型够用就好,多模型融合,多层级协同,让AI上手做事,融入整体应用环境才是正经事。

从理论上来说,AI可以与迄今为止人类制造的所有软件、系统、数据库、云、电子设备结合,并产生新的交互模式。AI掌握了搜索引擎的使用方法和用户需求,就诞生了新的流量和内容入口,搜索就变成了AI的子功能,以前的计算广告投放模式会受影响。

AI吞噬一切,重新安排其重要性。

是时候拥抱新世界,做些新东西。总比苹果做好一切,国内再模仿来得强。AI 时代与流量时代完全不同,起码「模仿式创新」一定会变难。

二、AI改变个人工作流,但尚未改变行业

生成式AI的冲击改变了科技行业的轨迹,但普通人视角下,冲击在ChatGPT发布之后就逐渐放缓。

文字工作者(比如我)和广义的内容创作者们,早已全面拥抱AI。尽管AI很难写出80分的作品,但它可以高效满足创作者工作流中的离散需求:快速生产大纲、和用户一起头脑风暴、模仿文风、文本修改、长文本翻译、文字 – 语音互转、信息获取、数据整理、梳理财报等等,这些方面AI又快又好。

在艺术、影视、教育、人文学术圈,AI颇受欢迎,它提供了快速试错过筛的工具,加上自身也是卖点和噱头,AI成了一种隐喻修辞,代表着机遇,以及危机感。

任何研讨会加个「AI时代」的名头都能多吸引点注意力和流量。

这一波生成式AI的发展可能会经历四个阶段:惊艳的玩具,(多样化且具备替代效应的)生产力工具,个人化系统,(具有网络效应)的生态系统。

目前的产品大多在从第一阶段到第二阶段过渡。

大部分AI产品,包括国外的,长期用下来,除了内嵌在应用和网页中的AI和特定用途AI以外(比如wiki AI,notion AI,memo AI,Perplexity),大多还是花里胡哨,重复造轮子居多。

AI在当下,尝鲜多于工作,助力于个人多于组织,它只改变了游戏的乐趣,并未改变游戏规则,犹如个人写东西用Word 还是Ulysses,只有体验的细微区别,无关乎生产力。工具需的组织化、社会化、网络化,才能最大化效能(比如微信和github)。

回到产业,AI尚未颠覆任何领域,干掉任何公司——除了做二次开发(套壳)的公司,在每次OpenAI发布新产品时都哀叹不已。行业替代性在客服、审核等岗位的确存在,只是尚未爆发,因为AI还未先进到重塑流程。

与互联网浪潮不同,大模型时代也许不需要Killerapp,无论AI多么强大,整体提升Workflow,提供端到端的输出,都比较难。这些流程依赖于长程推理、常识和行业Know-how,光靠语义链接的桥梁还远远不够。

大模型作为一个概率模型,在低容错率场景时仍然面临很多问题,远没有我们想的那么神奇:我在写这篇文章时,让GPT-4o查询NVIDIA近年股票和市值变化,一个看似简单的问题,它需要现将问题拆分成步骤,然后分别去搜相应的信息,再做一个总结,最后居然还是错的,还不如直接用搜索引擎快。

此外,很多定制化的工作,可能90%的文档都不能满足大模型Embedding时的质量要求,还要做大量的数据清洗才能用。大模型的注意力也不够稳定,经常被不相关的问题干扰,出现幻觉。

大模型的产品发展与互联网的产品发展还有一个截然不同的地方:边际成本非常高,模型成本要远远高于人力成本和买量成本。移动互联网时代的App可以在小步快跑式迭代,但基于底层大模型 开源小模型的鸡尾酒分层打法的App尚未找到类似路径。也因此,还未出现大公司被小公司弯道超车的可能性。

当然,假以时日,AI也许能在软件编写上有所建树。纽约市的风险投资基金Pace Capital的创始合伙人Chris Paik在「软件的终结」(The End of Software)一文里提出,大模型不一定会颠覆toC产品,但有可能颠覆软件生产,因为软件的成本在于开发人员,他们将人类语言翻译成计算机语言,大模型也许比人更擅长做这事,形成液态系统,建立中间层,链接一切。

「代码将变得灵活可塑,传统的技术栈概念将逐渐消失,取而代之的是由 AI 生成的微服务的流动海洋,这些微服务可以根据需要进行重新组合和再构」。

苹果说:我也是这样想的。

三、如果没有AGI,你还会期待AI吗?

不要太期待AGI。

在业界狂热讨论AGI何年达成之时,学界泼了三盆冷水。图灵奖得主、Meta首席AI科学家杨立昆(Yann Lecun)就并不认可AGI,他认为根本不存在通用智能,且大模型也不可能通向AGI。他还在X上说,「如果你是一名对构建下一代人工智能系统感兴趣的学生,不要研究大型语言模型(LLMs)」。

杨立昆并非唯一反对AGI的人。李飞飞从另一个角度论证了类似观点,她认为无论大模型有多少参数,AI都无法拥有「知觉」,即所有的感觉——饥饿、疼痛、坠入爱河,因此AI不可能拥有主观体验的能力,甚至不可能接近人类智能。

李飞飞曾经的老师,香港大学马毅认为,当前的生成AI其能力依靠规模定律(Scaling Laws)涌现其能力,但规模定律并非物理定律,而是一种偶然,早晚会失效,AI又不是只有喂数据堆参数这一种造法。

马毅在接受《晚点》采访时说,「如果你的信仰就是Scaling Laws,觉得把现在的系统做大就能实现AGI,我觉得你该改行了。因为你已经不可能有作为了,你就只能做一个螺丝钉」。大模型是有极限的,随着语料库耗尽,Scaling Law 失效,以及算力和电力几何级数增加,内部黑箱无法破解,也许有一天,生成式AI的发展出现停滞,不是不可能。

我想起,在AlphaGo/Zero大展威力的时代,人们对AI的能力感到格外惊奇和恐惧,代表人类最强棋手的李世石最后输给AI,似乎为碳基生命的命运写下最后注脚。但从现在回看,并没有那么悲凉。

当时,我偶然和人工智能早期先驱、《GEB》作者侯世达(Douglas Hofstadter)见过一面,我问他,你觉得Alphago是否实现了某种意义上的「智能」?他说,非也,即使Alphago战胜了人类,但相比于人类,AI还是太简单,如同缸中之脑,对现实一无所知。他确信深度学习无法抵达智能,但可以很好地解决一些问题。

Sora出现时,人们讨论它是否理解物理世界(尽管它内置了牛顿定律),物理主义者可能会认为 AI= 大脑 = 智能 = 有无限潜力的理解工具,但拥有常识的人则会认为这是错误的问题。

如果没有AI,AI前进的动力和目标在哪里?

OpenAI联合创始人Greg Brockman有一个很好的比喻,人工智能被「烘焙」进了经济之中。意思是,如何部署 AI,需要融入其他「原料」混合,它们以不同的方式运作,等待一段时间后,开始发挥作用。从消费者的角度来看,与 ChatGPT的对话只是调用一次API,就如同访问一次网站,下载一部电影。随着技术进化,公司把AI做细,AI融入软件之间、用户界面以及无数中间层,功能变得越来越细微,用户就会习惯AI。

Apple对AI深度整合,即使平庸,至少可用。在未来,也许AI能服务每个人的日常生活,最后,你无需感受到AI的存在。大模型还没有诞生杀手级应用,但手机形态可能会比大多软件商活得更久,这是2024WWDC能隐约看到的图景。

作者 | 向辉
编辑 | 周天

版权声明

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部