ChatGPT界面大更新，开始卷应用了？这次想灭谁？

硅星人 2024-10-16 00:09:29

就在OpenAI宣布获得史上最大规模66亿美元融资的第二天，又推出了自ChatGPT问世两年来的首次重大界面更新“canvas（画布）”。

canvas是一个全新设计的交互界面，专为写作和编程任务设计。不再局限于传统的聊天模式，而是通过在标准对话框旁开启的独立窗口，提供一个用户与ChatGPT的深度协作空间，共同创建和优化项目。

它基于特别训练的GPT-4o构建，用户可以直接在这里编辑文本或代码。选定任何需要修改的部分，ChatGPT就会基于上下文环境给出精准的优化建议。系统还提供了包含调整文本长度、更改阅读水平、代码审查修复、添加等在内的快捷菜单。此外，通过 “返回”按钮，用户可以轻松恢复之前的工作版本。

打开canvas很简单：在模型选择器中选择“GPT-4o with canvas”，只需输入“使用canvas…”或“启动canvas…”之类的提示，新窗口就会弹出。当ChatGPT检测到可能有帮助的场景时，无需用户调用，canvas也会自动打开。

具体来看看它的各项功能。

01 canvas辅助写作

canvas可以根据指令为你生成一个项目初稿，供你与AI一起编辑，也可以对现有草稿进行优化。适合长文章、报告、策划案或电子邮件等内容撰写。

内置5项实用的写作快捷功能：

建议编辑：由ChatGPT提供行内建议和反馈。
调整长度：将文档长度扩充或精简。
更改阅读水平：调整阅读水平，范围涵盖从幼儿园、中学、大学到研究生。
最终润色：全面检查语法、清晰度和一致性。
添加emoji：添加相关表情符号以增强趣味色彩。

例如以下视频中，用户先上传笔记至canvas生成博客内容，再为第一段添加举例让表述更丰富和润色题目，最后调至“大学阅读水平”。不到一分钟，粗略零散的笔记就变成了一篇完整的结构化博客文章。

硅星人也浅试了一下，在canvas里让GPT写一篇介绍OpenAI本周新闻的文章，然后翻译为中文。可以看到中文稿直接覆盖原英文生成，而不是以问答形式另起对话。

进一步用“建议编辑”补充内容后，分别生成“Graduate School”和“Kindergarten”版本来对比看看差异。

除了AI智能改进之外，还能直接在原文调整字体加粗、斜体、字号等格式。

简单来说，canvas拓展了一种与ChatGPT的全新交互方式。集成多种工具，让用户在聊天和文档编辑之间无缝转换，轻松将对话中的想法变为成熟的最终版本。在一个平台完成全套写作过程，有效避免了工作流的中断。

02 用canvas编程

与写作类似，编程也是一个需要反复迭代的过程，且对逻辑的严密性有更高的要求。

为了帮助开发者更高效完成代码编写和调试，canvas 也配备了一些相关的便捷功能，包括：

代码审查：ChatGPT提供编建议，供用户批准或拒绝，帮助优化代码质量。
添加logs：插入print日志输出，帮助开发者跟踪程序运行情况，方便调试。
添加comments：为代码添加注释，便于理解代码。
修复错误：自动检测并修复代码中的问题，减少调试时间。
代码移植：将现有代码转换为不同编程语言，如JavaScript、Python、Java等，便于跨语言开发。

下面的demo展示了在canvas界面生成Rust语言的API Web服务器，并进行代码优化和全局审查的过程。

1. 使用o1-preview输出的合成数据特别训练

OpenAI对canvas集成的GPT-4o进行了专门训练，使其能够在创作过程中担任更积极的协作者角色，并且具备更好的上下文感知能力。

为此，研究团队开发了“在写作和编程任务中自动触发画布、生成多样化内容类型、执行有针对性的编辑、重写文档、提供内嵌批注与建议”等核心功能。

训练方法上，应用了他们一直强调的合成数据生成技术，从o1-preview模型中提取输出，帮助GPT-4o针对目标功能进行后期训练。这一方法使ChatGPT能够快速提升写作质量，并适应新的用户交互模式，无需依赖人工生成的数据。

（如果担心自己上传的内容被OpenAI用于模型训练，记得到用户设置里关闭“数据共享”选项。）

2. canvas集成模型评估

为了评估模型表现，OpenAI进行了超过20项内部自动化测试。

其中一个关键挑战是定义何时触发canvas功能。研究团队教会模型在处理复杂写作任务时正确触发画布，比如“撰写博客文章”，而避免在类似“帮我做一道晚餐食谱”这样的简单问答中过度触发。经过优化后，GPT-4o在写作任务中的正确触发率达到83%，编程任务的正确率更高，达到了94%。

第二个挑战是模型在canvas被触发后的编辑行为。比如在用户明确选择特定文本时进行有针对性的编辑（targeted edit），其他情况下则倾向于重写（rewriting）。结果显示，特别训练后的GPT-4o在针对性编辑上的准确率比基线模型提高了18%。

此外，团队还通过人工评估验证了模型生成高质量评论的能力。相比零样本提示的GPT-4o，canvas集成的模型在评论准确性上提升30%，在评论质量上提升16%。

03 OpenAI开始卷应用

可用性方面，canvas测试版已对Plus和Team用户开放，下周起扩展至教育及企业用户，最终会让所有用户都能免费访问。

OpenAI表示，canvas目前仍处于早期阶段，但他们计划迅速提升其功能。对于那些需要频繁编辑和修改的复杂任务，让canvas成为传统聊天界面的有力补充，实现“更自然”的人机协作愿景。

Canvas并不算OpenAI掀起的全新交互模式，也离最理想的AI与人类交互形态还很远。而且，在canvas身上，用户能看到很多OpenAI对手已经做出来的产品形态的影子。它就像Anthropic的Artifacts工具及AI代码编辑器Cursor等明星应用产品功能的大杂烩，然后在这些基础上做了一些细节的升级。

很明显，卷应用是OpenAI新的发力方向。此前OpenAI其实在应用的交互体验和细节设计上都有些迟缓，这家公司在GPT模型依然能保持领先的阶段，并没有体现出对产品的重视。现在模型能力的格局已经完全不同，不仅差距缩小，而且当前多家大模型和消费级AI提供商都将可编辑工作空间作为生成式AI的最新突破点。

除了上面提到的几款应用，此前谷歌不仅将Gemini集成到Docs，它的NotebookLM近期创新的AI播客功能也大受好评，现在OpenAI也加入了进来。