苹果卷入大模型，手机行业借AGI「吃掉」软件层？

周天产业分析 2024-06-24 12:34:46

苹果重新定义了AI（Apple Intelligence）。

6月11日凌晨1点，苹果公司召开了今年的开发者大会WWDC，用了首场发布会将近一半的篇幅来讲AI如何整合到苹果系统中，将人工智能化于无形，融进Apple Intelligence。

媒体和资本评价两极化，一部分认为苹果这次出手，软硬件结合，在系统层面提供了AI能力，一夜之间灭了许多AI创业者的生路——毕竟在当下的节点，利用OpenAI 接口包装一个翻译插件或者脑图都算是创业，这可叫AI公司怎么活。

反方则认为苹果此次更新了无新意，原地雕花，不够炸裂，新功能还是基本集中在「文生图」、「文本总结」、「跨应用联动」这些老生常谈的功能上。从发布会后的股价上涨近7.26% 的表现来看，资本市场倒是对「苹果AI」基本满意。

无论Apple Intelligence有多么诱人华丽，也只是苹果提前画的大饼，英文版今年秋天上线，其他语言要到明年才会有后续。半年时间，对AI公司来说可以做很多事。会有其他竞争者对苹果的蓝图提出挑战吗？

一、科技公司全面卷入AI

AI浪潮以来，美股七雄（Magnificent 7，即美国市场上市值最大的七家科技公司，包括Alphabet、亚马逊、苹果、Meta、微软、英伟达和特斯拉）分化明显，市值排序跌宕起伏。

在6月5日大涨后，「卖铲子」的NVIDIA市值超3万亿美元，超越苹果，距离3.15万亿的微软只需再涨不到5%；微软借AI登上第一，乘了OpenAI的东风，并乘势建立了更好的工具和商用系统，推出了AI-PC，23年营收达到惊人的2210亿美元；Meta用开源大模型造福了一票国内公司，用AI改进广告，内容审核和个性化推荐，利润翻了两番；亚马逊将AI整合到AWS框架中，意在企业级AI，它还投资了Anthropic，与NVIDIA合作Blackwell Gpu；Alphabet对标OpenAI节奏，但总感觉失之毫厘，略有涨幅；特斯拉掉队，苹果踟蹰不前，还在画饼。

大模型方面，科技公司都有fomo（fear of missing out）效应，人无我有，就很尴尬；产品和生态上，后发制人有优势。非盈利机构OpenaAI是最大造浪机，苹果与其合作，水到渠成。

苹果放弃造车后，一门心思钻研AI更广泛的应用，思路与其他 6 家不同，提出个人化AI（Personal），区别于微软的工具性AI（Azure/Microsoft365/Copilot），用尽生态优势，更重视操作的「非AI感」，理解用户身处的情境，和用户的生活交融，强调隐私保护。

苹果发布会上演示的例子是去机场接妈妈，Apple Intelligence可直接读取妈妈发来的航班信息，查询航班延误情况和机场交通，直接生成行动时间表并更新在日程中，本身要花好几分钟安排的事现在可以自动完成了。与siri类似，是生活工作小助手的定位，但更强大。

语言界面替代了操作界面，Apple版AI更理解人的需求和语言意味，而非仅仅在数值上更聪明，跑分更高。这是在让AI对齐人类生活方式，取巧，但又十分合理。

据「新皮层」报道，Apple Intelligence的模型架构主要由3部分组成，按调用的优先级，分别是自研的端侧模型、云端模型和GPT-4o等第三方模型。其中自研模型是苹果发布的一系列小型模型，包括可以读懂iPhone屏幕的多模态理解模型ReALM（Reference Resolution As Language Modeling），OpenELM（开源高效语言模型）等。苹果的模型能力不及OpenAI，是苹果选择接入第三方模型的原因。第三方模型可能不止GPT-4o。《华尔街日报》也曾于3月报道称，苹果还曾与百度初步谈判，以在其中国版设备（比如 iPhone）中使用后者的AI技术。苹果从未证实这一传闻。

这么看来，Apple Intelligence更像是多种模型组装的工具包，各司其职，各尽其用。AI在苹果生态里，与其说是对话唱歌画图的小软件，不如说是帮人完成一系列复杂操作的AI-Agent，它联通各平台设备，粘合使用体验——肯定有一部分是以智能家居的那种方式，另一部分就可以展开想象。

当然，AI的聚合、融合，还是依靠AI公司、资本、政府的高期望。对很多人来说，这个期望的化身，就是AGI。

如果把实现AGI当作最终目标，当下AI处在大投入大基建的状态：投算力、投新型的数据中心、投模型，三类投资分别对应的是生产GPU 卖GPU的云用GPU训练模型的公司，也就是英伟达、AWS Azure和OpenAI等大模型公司。苹果算是其中的异类，既不开发新模型，甚至也没有推出新应用，只是整合。

但AGI的实现还很遥远。造富路上，AI公司开始破产、倒闭、求收购。

2024年第二季度还没有结束，曾经有10亿美元估值、180名员工、创造出Stable Diffusion系列模型的明星独角兽 Stability AI，就出现资金链断裂，寻求合并。前OpenAI和谷歌AI开发人员创立的AI公司Adept，也在谈判售价。在「洗牌期」，就算有足够资金支撑下去的AI公司，都开始了裁员和降本增效。

这些现象暴露出残酷的行业现状：包括巨头在内，所有AI公司/项目都盈利困难。连OpenAI也只能靠不断融资来支撑ChatGPT高昂的运行成本。「摸着 OpenAI过河」，将订阅模式和企业版模式作为行业统一标准的其他玩家，只会更艰难。Meta为AI建设增加了约100亿美元预算，但未来几年内依然不指望盈利。

据行研机构PitchBook 数据，AI创企在2021-2023年获得了约3300亿美元投资，同比增长2/3，但很多AI创企的钱仍不够花，高昂的AI建设成本、人工成本已经拖垮不少AI公司。

国内风景独好，炼制大模型的巨头无忧生存，却因竞争激烈，打起了价格战。5月6日深度求索（DeepSeek）发布的DeepSeek v2，提供的API定价仅为GPT-4-Turbo的近百分之一，之后智谱、字节、阿里、百度、科大讯飞和腾讯都纷纷下调了部分大模型的API价格。

考虑到国内大模型，大部分是针对企业用户和特定行业，也许是性能评测标准不够刺激，也可能是大模型落地难，性能遇到了瓶颈，只能同质化竞争，价格战成了国内大模型行业问题的缩影和最终解决方式。

国内的AI公司和产品，长时间对标OpenAI，希望自家养的AI在跑分、推理、表现都超过GPT系列，是否做到暂且不谈，但其中有一些误区。AI不同于搜索引擎、平台入口、内容站，它的技术性远高于后者，在实际进入应用领域前，是纯粹科学和技术的事，也是纯投入的事业。

国内环境，人们对于AI的实质和AI的真正用途之间，有一道「理解鸿沟」，这首先是大模型的黑箱性质所造成的，但同时，国内的AI产品，无论是豆包、元宝、Kimi，还是激进地投入整条赛道的阿里做出来的东西，目前所呈现出来的能力，很难让用户持续买单，更别说让企业级用户认同。毕竟GPT-4o和Midjourney早已设立了标准。

苹果AI的确为国内市场打开了一条思路：跑分再高也只是抽象能力，自研模型够用就好，多模型融合，多层级协同，让AI上手做事，融入整体应用环境才是正经事。

从理论上来说，AI可以与迄今为止人类制造的所有软件、系统、数据库、云、电子设备结合，并产生新的交互模式。AI掌握了搜索引擎的使用方法和用户需求，就诞生了新的流量和内容入口，搜索就变成了AI的子功能，以前的计算广告投放模式会受影响。

AI吞噬一切，重新安排其重要性。

是时候拥抱新世界，做些新东西。总比苹果做好一切，国内再模仿来得强。AI 时代与流量时代完全不同，起码「模仿式创新」一定会变难。

二、AI改变个人工作流，但尚未改变行业

生成式AI的冲击改变了科技行业的轨迹，但普通人视角下，冲击在ChatGPT发布之后就逐渐放缓。

文字工作者（比如我）和广义的内容创作者们，早已全面拥抱AI。尽管AI很难写出80分的作品，但它可以高效满足创作者工作流中的离散需求：快速生产大纲、和用户一起头脑风暴、模仿文风、文本修改、长文本翻译、文字 – 语音互转、信息获取、数据整理、梳理财报等等，这些方面AI又快又好。

在艺术、影视、教育、人文学术圈，AI颇受欢迎，它提供了快速试错过筛的工具，加上自身也是卖点和噱头，AI成了一种隐喻修辞，代表着机遇，以及危机感。

任何研讨会加个「AI时代」的名头都能多吸引点注意力和流量。

这一波生成式AI的发展可能会经历四个阶段：惊艳的玩具，（多样化且具备替代效应的）生产力工具，个人化系统，（具有网络效应）的生态系统。

目前的产品大多在从第一阶段到第二阶段过渡。

大部分AI产品，包括国外的，长期用下来，除了内嵌在应用和网页中的AI和特定用途AI以外（比如wiki AI，notion AI，memo AI，Perplexity），大多还是花里胡哨，重复造轮子居多。

AI在当下，尝鲜多于工作，助力于个人多于组织，它只改变了游戏的乐趣，并未改变游戏规则，犹如个人写东西用Word 还是Ulysses，只有体验的细微区别，无关乎生产力。工具需的组织化、社会化、网络化，才能最大化效能（比如微信和github）。

回到产业，AI尚未颠覆任何领域，干掉任何公司——除了做二次开发（套壳）的公司，在每次OpenAI发布新产品时都哀叹不已。行业替代性在客服、审核等岗位的确存在，只是尚未爆发，因为AI还未先进到重塑流程。

与互联网浪潮不同，大模型时代也许不需要Killerapp，无论AI多么强大，整体提升Workflow，提供端到端的输出，都比较难。这些流程依赖于长程推理、常识和行业Know-how，光靠语义链接的桥梁还远远不够。

大模型作为一个概率模型，在低容错率场景时仍然面临很多问题，远没有我们想的那么神奇：我在写这篇文章时，让GPT-4o查询NVIDIA近年股票和市值变化，一个看似简单的问题，它需要现将问题拆分成步骤，然后分别去搜相应的信息，再做一个总结，最后居然还是错的，还不如直接用搜索引擎快。

此外，很多定制化的工作，可能90%的文档都不能满足大模型Embedding时的质量要求，还要做大量的数据清洗才能用。大模型的注意力也不够稳定，经常被不相关的问题干扰，出现幻觉。

大模型的产品发展与互联网的产品发展还有一个截然不同的地方：边际成本非常高，模型成本要远远高于人力成本和买量成本。移动互联网时代的App可以在小步快跑式迭代，但基于底层大模型开源小模型的鸡尾酒分层打法的App尚未找到类似路径。也因此，还未出现大公司被小公司弯道超车的可能性。

当然，假以时日，AI也许能在软件编写上有所建树。纽约市的风险投资基金Pace Capital的创始合伙人Chris Paik在「软件的终结」（The End of Software）一文里提出，大模型不一定会颠覆toC产品，但有可能颠覆软件生产，因为软件的成本在于开发人员，他们将人类语言翻译成计算机语言，大模型也许比人更擅长做这事，形成液态系统，建立中间层，链接一切。

「代码将变得灵活可塑，传统的技术栈概念将逐渐消失，取而代之的是由 AI 生成的微服务的流动海洋，这些微服务可以根据需要进行重新组合和再构」。

苹果说：我也是这样想的。

三、如果没有AGI，你还会期待AI吗？

不要太期待AGI。

在业界狂热讨论AGI何年达成之时，学界泼了三盆冷水。图灵奖得主、Meta首席AI科学家杨立昆（Yann Lecun）就并不认可AGI，他认为根本不存在通用智能，且大模型也不可能通向AGI。他还在X上说，「如果你是一名对构建下一代人工智能系统感兴趣的学生，不要研究大型语言模型（LLMs）」。

杨立昆并非唯一反对AGI的人。李飞飞从另一个角度论证了类似观点，她认为无论大模型有多少参数，AI都无法拥有「知觉」，即所有的感觉——饥饿、疼痛、坠入爱河，因此AI不可能拥有主观体验的能力，甚至不可能接近人类智能。

李飞飞曾经的老师，香港大学马毅认为，当前的生成AI其能力依靠规模定律（Scaling Laws）涌现其能力，但规模定律并非物理定律，而是一种偶然，早晚会失效，AI又不是只有喂数据堆参数这一种造法。

马毅在接受《晚点》采访时说，「如果你的信仰就是Scaling Laws，觉得把现在的系统做大就能实现AGI，我觉得你该改行了。因为你已经不可能有作为了，你就只能做一个螺丝钉」。大模型是有极限的，随着语料库耗尽，Scaling Law 失效，以及算力和电力几何级数增加，内部黑箱无法破解，也许有一天，生成式AI的发展出现停滞，不是不可能。

我想起，在AlphaGo/Zero大展威力的时代，人们对AI的能力感到格外惊奇和恐惧，代表人类最强棋手的李世石最后输给AI，似乎为碳基生命的命运写下最后注脚。但从现在回看，并没有那么悲凉。

当时，我偶然和人工智能早期先驱、《GEB》作者侯世达（Douglas Hofstadter）见过一面，我问他，你觉得Alphago是否实现了某种意义上的「智能」？他说，非也，即使Alphago战胜了人类，但相比于人类，AI还是太简单，如同缸中之脑，对现实一无所知。他确信深度学习无法抵达智能，但可以很好地解决一些问题。

Sora出现时，人们讨论它是否理解物理世界（尽管它内置了牛顿定律），物理主义者可能会认为 AI= 大脑 = 智能 = 有无限潜力的理解工具，但拥有常识的人则会认为这是错误的问题。

如果没有AI，AI前进的动力和目标在哪里？

OpenAI联合创始人Greg Brockman有一个很好的比喻，人工智能被「烘焙」进了经济之中。意思是，如何部署 AI，需要融入其他「原料」混合，它们以不同的方式运作，等待一段时间后，开始发挥作用。从消费者的角度来看，与 ChatGPT的对话只是调用一次API，就如同访问一次网站，下载一部电影。随着技术进化，公司把AI做细，AI融入软件之间、用户界面以及无数中间层，功能变得越来越细微，用户就会习惯AI。

Apple对AI深度整合，即使平庸，至少可用。在未来，也许AI能服务每个人的日常生活，最后，你无需感受到AI的存在。大模型还没有诞生杀手级应用，但手机形态可能会比大多软件商活得更久，这是2024WWDC能隐约看到的图景。

作者 | 向辉
编辑 | 周天

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符，请点击举报进行投诉反馈！