字幕设计指南

阿青 2023-12-01 15:41:50

老师可以在我们平台上传视频资源，系统会自动生成字幕，老师也可对其再次进行编辑矫正。编辑的操作较为复杂，所以只放在 web 端处理，在移动端仅需展示对应字幕即可。

我在处理移动端字幕呈现时，发现字幕的数量会影响到字幕的呈现效果。如果一次展示太多字幕，会增加用户阅读难度，视频画面也会被字幕遮挡，影响观看效果。字幕太少的话，信息不足，尤其是语速较快时，可能会导致用户来不及看。

因为 web 端字幕的功能已经实现，所以我先去请教了 dev 在技术上如何限制的，结果他们也不是非常清楚，但给我看了一眼 web 端超过 5 行的字幕呈现效果，我。。。。

没有得到结果的我可太好奇了，接着就自己研究了一下，别说，还挺有趣～

一、字幕的故事

在无声电影时代，为了让观众更清楚的了解剧情，当时会配有电影解说员。解说员在银幕旁边站着，对电影内容评论和解释，黑泽导演在《蛤蟆的油》中也写到自己的哥哥黑泽丙午是浅草区一流电影院大胜馆的“活动弁士”，也就是电影解说员。

字幕最早出现是在 1903 年Edwin S. Porter导演的电影《汤姆叔叔的小屋》中，当时叫做字幕卡（intertitles）。字幕卡就是将要用语言表达的内容都印在硬纸板上然后拍下来，插在电影的序列之间来辅助讲故事。

那时的字幕还挺有趣的，不仅传达人物对白，还可以传达主人公内心活动。

1977 年《安妮•霍尔》的内心吐槽是用字幕呈现的。

奥斯卡还专门为字幕设置了奖项：最佳字幕写作奖。1929 年 5 月第一届奥斯卡上编剧 Joseph W. Farnham 拿走了这个奖。

1927 年有声电影发明后，字幕卡开始被历史淘汰。为了解决翻译问题，电影人们让不同的演员录音，录好后替换原来的音轨就行，配音译制出现了。

1929年1月26日，配有法语字幕的《The Jazz Singer》在巴黎上映。配音和字幕这两种译制方式很快在欧洲各国发展起来。

这种字幕相当于放映机镜头前加上刻好台词的“幻灯片”（Sciopticon）。放映员要根据说台词的时机，现场切换。哈哈，那时候的放映员可不太好摸鱼～

随着电影制作和播放技术的数字化，字幕的制作和编辑变得越来越便捷。通过专业软件可以智能获取视频中的字幕，也可以给视频手动增加字幕。看视频时，也可以按照自己的喜好调整字幕的字体、颜色、位置。

二、字幕的几个分类

Youtube 上的展示 CC 字幕是什么意思？先简单补充一下视频播放器原理，以便于更好地理解字幕几种分类的区别。

视频播放器会通过流媒体协议从服务器获取数据，下载的数据通常以特定的封装格式（如MP4等）呈现。播放器对封装格式数据进行解封装，提取视频流、音频流、字幕流。然后对音视频数据进行解码，解码后对图像帧渲染，并显示在屏幕中。

字幕在英文中有Caption 和 Subtitle 两种。

硬字幕（open subtitles）：字幕被合并在原始视频帧中，无法从封装格式的数据中提取字幕流，所以也无法关闭，修改。
软字幕或者隐藏字幕（closed subtitles）：可以从封装格式的数据中提取字幕流，是带有时间戳的特殊标记文本。可以在播放期间显示隐藏，可以使用专业的字幕编辑工具进行编辑。
CC字幕-隐藏字幕（Closed Caption）：主要针对耳聋或听力障碍人士设计的字幕。允许用户根据时间轴进行编辑，可在特定时间点添加、删除或修改字幕文本。

三、字幕的设置指南

（温馨提示：以下内容可收藏备用）

1. 英文

每行最多展示 42 个字符。
最多 2 行。
字幕在屏幕停留时间不应超过 7 秒，不应少于 1 秒。
成人节目：每秒最多 20 个字符；儿童节目：每秒最多 17 个字符。
每分钟最多 175 个字。

2. 中文

每行最多 21 个字符。
最多 2 行。
字幕在屏幕停留时间不应超过 7 秒，不应少于 1 秒。
成人节目：每秒最多 9 个字符；儿童节目：每秒最多 7 个字符。
每分钟最多 120 个字。

以上指南来自于wetranscriber。我翻看了Netflix的字幕样式指南，基本是差不多的。

Netflix字幕设置指南链接：https://partnerhelp.netflixstudios.com/hc/en-us/articles/219375728-Timed-Text-Style-Guide-Subtitle-Templates

四、字幕的呈现效果

根据以上字幕设置规则，考虑界面的呈现效果。

字幕样式需考虑：

样式选择哪种更合适？
竖屏是否需要展示字幕？如果展示的话字体大小是否合适？是否需要缩小？
当展示底部播放条时，字幕如何呈现？是降低透明度还是移动位置？
字幕的显隐怎么控制？

产品经理，产品经理网站

五、最后

当设定好字幕的显示限制规则后，对于呈现来说就很容易了。字幕是为了帮助观看者更好地理解对话和音频的内容，也可用于提供额外的场景信息。

这里的重点是：帮观众更好地理解内容。

内容的呈现方式会影响观众对内容的理解，所以需考虑字幕的显示数量和显示速度。内容本身也会影响观众对内容的理解，所以需考虑智能生成的文本是否准确传达视频内容，若不准确是否需要让老师可编辑。从观众角度来看，不同认知层次的观众对文字内容和呈现方式的要求也有些许差异。

不知为何，现实中大多数人往往过于关注视觉呈现，考虑极限状况，却忽略了功能的本质以及对用户的价值。

（最终研发有按照设计规则重新调整对接软件的参数，也许因为没人在意，所以没人推动，但我是忍不了呢）。

嗯，大概就酱～

作者

阿青，公众号：阿青碎碎念。B端UX设计师。

本文

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符，请点击举报进行投诉反馈！

标签：产品设计 CC字幕产品设计指南字幕卡字幕设计

上一篇 > 四张图搞懂支付架构
下一篇 > 一文搞懂上交所几大平台及其处理业务介绍