如果你是Sora的产品经理，你会如何设计这款产品？

申悦 2024-02-28 18:11:49

Sora的出现，引发一众讨论热潮，但这款未正式发布的跨时代AI产品，还无法让我们直观感受到它的操作界面和使用效果。

那身为一名产品经理，我不禁好奇，这款产品会给人什么样的交互体验？如果我是它的产品经理，我会如何设计？

是像DALL-E 3那样直接融入ChatGPT里？还是像Pika那样单独的输入框和调试界面？又或者干脆做成剪映那种一站式视频生成和编辑器？

AI产品设计，要同时考虑技术特性、应用场景、操作流畅度和个性化定制程度这几点，下面我分别展开来聊聊。

一、技术特性

采用Diffusion Transformer架构的Sora，特点在于能够处理和生成具有复杂动态和空间关系的高质量视频。因此产品设计要重点考虑如何有效调整模型性能，控制它的泛化能力。利用Transformer的特性来提高视频的质量和多样性。

因此从产品设计上，提供高清分辨率、多场景模版、多镜头选择肯定是Sora和其他视频有差异化的配置参数。

与此同时，考虑到过度复杂的参数配置导致的过拟合问题，这类配置的选择也要控制边界，限制约束条件，不能让用户通过自然语言来随意控制。

二、应用场景

Sora的应用范围非常广泛，因此，在产品设计时，应考虑如何将Sora应用到如影视制作、游戏开发、教育教学、产品演示、内容营销等更多领域，从而扩大其市场影响力，覆盖到更多元的职业类型。

举个例子，影视制作就是官方指定的Sora应用场景之一。OpenAI曾公开表示，通过使用Sora，视觉艺术家、设计师和电影制作人可以获得关于如何推进模型对创意专业人士最有帮助的反馈。

但对产品经理而言，这样的定位更要求产品设计风格面向专业人士而不是普世大众。也许我们的界面，不应该只提供一个对话框，而是要以更贴近镜头语言、电影脚本那样的风格来给用户输入提示。就像DALL·E3的提示词生成器那样，明确规定用户要按：场景、人物角色、形象描述、背景介绍、表现说明那样的格式来撰写提示词。以剧本撰写为例，一个剧本通常由5个主要元素组成：时间、地点、人物、行为、对话。那我们的界面设计，就应该要求用户完善这些设定，才能享受到一部精彩的剧作。

如果你是Sora的产品经理，你会如何设计这款产品？

当然，不同行业Sora提供的能力范围也要有区别，比如在游戏领域，游戏开发者就可以利用Sora制作游戏中的角色动画和场景效果，提供更逼真丰富的游戏体验。从这个角度看，就无需复杂的脚本设定，只考虑如何把技术融入到游戏设定中就可以了。

三、操作流畅度

设计一个用户友好、操作简便的Sora视频生成界面，首先要确保界面的设计遵循人机界面的友好性和操作便利性原则

具体来说，可以考虑以下几个方面：

第一，简化操作流程：刚刚我有提到，Sora使用过程中，用户必须对想要显示的内容进行详细描述，包括场景、人物、动作和整体基调等。这意味着在设计界面时，应尽量减少用户的输入工作量，提供清晰、直观的选项和反馈，以帮助用户快速完成描述和设置，这时候就可以融入AI Copilot角色来辅助用户撰写内容。

第二，增强视觉体验：通过合理的排版和配色，使用户能够直观地了解页面内容，并享受到视觉上的美感。这不仅能提升用户体验，还能增加工具吸引力。我个人推荐类似GPTs那样的布局。既可以自然语言交互，又支持输入框配置参数，还可以直接预览，方便直观。

如果你是Sora的产品经理，你会如何设计这款产品？