吴恩达最新预测：关于AI，这些事未来十年不会变

量子位 2024-01-02 21:51:55

2024年，AI的发展会有怎样的改变？

在吴恩达最新的一封来信中，他认为有几件事情在接下来十年内都不会发生改变。

亲爱的朋友们，

人工智能的发展速度超过以往任何时期，这一现象令人振奋。然而，快速变化可能导致迷失方向。在这种情况下，遵循杰夫·贝佐斯（Jeff Bezos）的建议是非常有益的，不仅要考虑变化中的因素，还要思考那些保持不变的因素。如果事物没有改变，投入精力和努力就更加值得。

以下是我相信AI在未来十年不会改变的一些事情：

我们需要社区。拥有朋友和盟友的人比孤身前行的人表现得会更好。即便人工智能领域每周都带来突破性进展，拥有朋友帮助你分辨真实和炒作、测试你的想法、提供相互支持，并与之共同创造，将使你处于更有利的地位。
知道如何使用 AI 工具的人工作效率更高。知道如何操纵数据的个人和企业可以更有效地了解真相、做出更好的决策并取得更多成就。随着人工智能的不断进步，这一点只会变得更加真实。
人工智能需要好的数据才能良好运作。正如人类需要好的数据来做出决策，从追求何种营销策略到决定孩子的饮食，人工智能在我们的算法不断扩大、演变和改进的过程中，也同样需要好的数据。

那么上述三点对我们每个人意味着什么？

让我们继续构建 AI 社区。这很重要！我希望你能与他人分享你所学到的东西，互相激励，并继续寻找朋友和合作者。
不断学习！最好让学习成为一种习惯。它可以让你更有效率，还有很多其他的好处。如果你正在考虑2024年的新年决心，那就把你的学习目标包括进去。随着人工智能的不断发展，每个人都需要一个计划来跟上这一浪潮。
继续培养以数据为中心的人工智能实践。随着企业采用越来越多的人工智能工具，我发现最重要的做法之一是控制自己的数据。我认为这对个人来说也会越来越重要。

虽然以上三点与人工智能有关，但我想分享另外两件事，不幸的是，我相信它们在未来十年将保持不变：⑴气候变化将继续成为人类面临的重大挑战。⑵贫穷，许多人几乎（甚至可能买不起）基本必需品，仍将是一个问题。我将继续思考人工智能气候建模如何帮助前者，以及我们如何利用人工智能来提升每个人的生活质量。

以上便是吴恩达对于未来AI发展的最新观点。

而就在新年伊始的这几天，AI圈中的多位大佬们也陆续发表了他们对于今年人工智能技术发展的预测。

一、被LeCun点赞的八大预测

最近，Meta一位研究员Martin Signoux写下了他认为AI在今年发展中的八大预测，而这些预测也得到了LeCun的高度认可。

吴恩达最新预测：关于AI，这些事未来十年不会变

（以下是Martin Signoux预测的原文）

1）AI智能眼镜会成为现实

随着多模态技术的兴起，领先的人工智能公司将加倍投入人工智能优先的可穿戴设备。

还有什么比眼镜外形更适合托管 AI 助手的呢？

眼镜腿靠近耳朵来传递音频，摄像头靠近眼睛来捕捉看到的输入，它们解放了我们的双手并且佩戴起来也很舒服。

我们和RayBan一起引领着这波潮流，但想想最近的OpenAI和Snapchat传闻……我们的故事才刚刚开始。

2）ChatGPT之于人工智能助手，不会像谷歌之于搜索

2023年是以ChatGPT作为开始，以Bard、Claude、Llama、Mistral和数千个衍生品作为结束。

随着商品化的继续，ChatGPT将随着参考估值修正而消失。

吴恩达最新预测：关于AI，这些事未来十年不会变

3）再见LLM，你好LMM

大型多模态模型（LMM）将持续涌现，并在热议中取代大型语言模型，包括多模态评估、多模态安全等等。

此外，LMM是迈向真正通用人工智能助手的一块垫脚石。

吴恩达最新预测：关于AI，这些事未来十年不会变

4）没有重大突破，但各方面都有所改善

新模型不会带来真正的突破（GPT5不会出现），大型语言模型仍将具有内在限制并容易产生幻觉。我们不会看到任何飞跃进展让它们在2024年能足够可靠地“解决基本通用人工智能（AGI）问题”。

迭代改进将使它们“足够好”地完成各种任务。RAG、数据管理、更好的微调、量化等方面的改进将使LLM在许多用例中足够鲁棒/有用，从而推动各行各业各种服务的采用。

5）小即是美

小型语言模型（SLM）已经存在，但成本效率和可持续性的考虑将加速这一趋势。

量化也将大大改善，推动消费者服务的设备上集成的主要浪潮。

6）开源模型将击败GPT-4，开源闭源之争将逐渐消失

回顾过去12个月开源社区所取得的活力和进步，很明显，开源模型将很快缩小性能差距。

我们在2023年底结束时，Mixtral和GPT-4在MMLU（多模态学习理解）测试中的差距仅剩13%。

但最重要的是，大家都意识到了开源模型将持续存在并推动进步，它们将与专有模型共存。

7）基准测试仍然会是个难题

没有一套基准测试、排行榜或评估工具成为模型评估的终极选择。

相反，我们将看到一系列的改进（就像最近的HELM）和新的倡议（如GAIA），特别是在多模态方面。

8）相比于现存风险，关于存在性风险的讨论不会太多

虽然2023年X-risks成为了头条新闻，但公众辩论将更多地集中在当前的风险和争议上，比如偏见、假新闻、用户安全等问题。

二、Runway CTO：用新工具讲新故事

Runway联合创始人兼CTO Anastasis Germanidis也发表了他对于今年AI发展的看法。

2023年是广泛应用人工智能系统（涵盖文本、图像、视频、音频和其他模态）发展的转折点。

仅在Runway公司，我们就看到了如Gen-1和Gen-2这样的视频生成模型的发布，以及使这些模型具有新型创造控制形式的工具。

在未来一年，我预计在以下几个领域会看到持续的进展：

视频生成：过去一年，生成视频模型（文本到视频、图像到视频、视频到视频）首次公开发布。在来年，这些模型的质量、通用性和可控性将继续迅速提高。到2024年底，互联网上相当一部分视频内容将在某种程度上利用这些模型。
实时互动性：随着大型模型运行速度变快，我们开发出更多结构化控制它们的方法，将开始看到围绕它们出现更多新颖的用户界面和产品，这些界面和产品超越了常见的提示到x或聊天助手范式。
自动化AI研究：开发者们已经接受了基于大型语言模型的编码助手，如GitHub Copilot。但是，很少有工具被设计用来专门加速AI研究工作流程；比如，自动化开发和调试模型代码、训练和评估模型等重复性工作。明年将出现更多这样的工具。
更多关注系统：大量的对话集中在单个网络的端到端训练能力上。然而，在实际应用中，部署在现实世界场景中的AI系统通常由一系列模型的管道驱动。将出现更多用于构建这种模块化系统的框架。

除了技术进步之外，构建这些系统最有意义的部分是，随着每次更新和能力的增强，新的受众被引入其中，讲述了以前没有讲过的新故事。我很兴奋地看到这将在未来一年继续发生。

三、斯坦福副教授：基础模型的透明度

斯坦福大学计算机科学副教授Percy Liang，则是将关注点聚焦到了基础模型的透明度上。

仅仅一年前，ChatGPT让世界意识到了基础模型的力量。但这种力量不仅仅体现在耀眼、令人瞠目的演示上。基础模型将以与计算和互联网在上一代社会变革中相似的方式，渗透到我们生活的每个领域、每个方面。考虑到这种预期影响的广度，我们不仅要问人工智能能做什么，还要问它是如何构建的。它是如何被管理的？谁来决定？

我们真的不知道。这是因为人工智能的透明度正在下降。在2010年代的大部分时间里，开放是默认的取向：研究人员发布论文、代码和数据集。在过去三年里，透明度减弱了。

关于最先进模型（如GPT-4、Gemini和Claude）的公开信息很少：用于训练它们的数据是什么？谁创建了这些数据，劳动实践如何？这些模型与哪些价值观相一致？这些模型在实践中是如何使用的？没有透明度，就没有问责，我们已经见证了缺乏透明度在社交媒体等以前一代技术中产生的问题。

为了使透明度评估严谨，基础模型研究中心引入了基础模型透明度指数，用于描述基础模型开发者的透明度。好消息是，许多透明度方面（例如，拥有适当的文档）是可实现的，并且与公司的激励相符。在2024年，也许我们可以开始逆转这一趋势。

目前，政策制定者普遍认识到需要管理人工智能。除了透明度，首要优先事项之一是评估。事实上，没有科学基础来理解这些模型的能力和风险，我们就是盲目的。大约一年前，基础模型研究中心发布了综合评估语言模型（HELM），这是一个评估基础模型（包括语言模型和图像生成模型）的资源。现在我们正在与MLCommons合作，开发一个安全评估的行业标准。

但这个评估很难，尤其是对于通用、开放式的系统。你如何覆盖几乎无限的使用案例和潜在危害空间？你如何防止操纵？你如何以公众能理解的方式呈现结果？这些都是开放的研究问题，但我们需要在短时间内解决这些问题，以跟上人工智能的快速发展。我们需要整个研究社区的帮助。

想象ChatGPT式助手将成为我们获取信息和做出决策的主要方式，并不遥远。因此，基础模型的行为——包括任何偏见和偏好——是重要的。

据说这些模型与人类价值观相一致，但我们谈论的是哪些价值观？再次，由于缺乏透明度，我们无法看到这些价值观是什么，以及它们是如何确定的。我们能否想象一个更民主的过程来引出价值观，而不是由单一组织做出这些决定？重要的是这个过程的正直性和合法性。

OpenAI希望在这方面资助工作，Anthropic也有一些这方向的研究，但这些都还处于早期阶段。我希望其中一些想法能够被纳入生产系统。