字幕设计指南
老师可以在我们平台上传视频资源,系统会自动生成字幕,老师也可对其再次进行编辑矫正。编辑的操作较为复杂,所以只放在 web 端处理,在移动端仅需展示对应字幕即可。
我在处理移动端字幕呈现时,发现字幕的数量会影响到字幕的呈现效果。如果一次展示太多字幕,会增加用户阅读难度,视频画面也会被字幕遮挡,影响观看效果。字幕太少的话,信息不足,尤其是语速较快时,可能会导致用户来不及看。
因为 web 端字幕的功能已经实现,所以我先去请教了 dev 在技术上如何限制的,结果他们也不是非常清楚,但给我看了一眼 web 端超过 5 行的字幕呈现效果,我。。。。
没有得到结果的我可太好奇了,接着就自己研究了一下,别说,还挺有趣~
一、字幕的故事
在无声电影时代,为了让观众更清楚的了解剧情,当时会配有电影解说员。解说员在银幕旁边站着,对电影内容评论和解释,黑泽导演在《蛤蟆的油》中也写到自己的哥哥黑泽丙午是浅草区一流电影院大胜馆的“活动弁士”,也就是电影解说员。
字幕最早出现是在 1903 年Edwin S. Porter导演的电影《汤姆叔叔的小屋》中,当时叫做字幕卡(intertitles)。字幕卡就是将要用语言表达的内容都印在硬纸板上然后拍下来,插在电影的序列之间来辅助讲故事。
那时的字幕还挺有趣的,不仅传达人物对白,还可以传达主人公内心活动。
1977 年《安妮•霍尔》的内心吐槽是用字幕呈现的。
奥斯卡还专门为字幕设置了奖项:最佳字幕写作奖。1929 年 5 月第一届奥斯卡上编剧 Joseph W. Farnham 拿走了这个奖。
1927 年有声电影发明后,字幕卡开始被历史淘汰。为了解决翻译问题,电影人们让不同的演员录音,录好后替换原来的音轨就行,配音译制出现了。
1929年1月26日,配有法语字幕的《The Jazz Singer》在巴黎上映。配音和字幕这两种译制方式很快在欧洲各国发展起来。
这种字幕相当于放映机镜头前加上刻好台词的“幻灯片”(Sciopticon)。放映员要根据说台词的时机,现场切换。哈哈,那时候的放映员可不太好摸鱼~
随着电影制作和播放技术的数字化,字幕的制作和编辑变得越来越便捷。通过专业软件可以智能获取视频中的字幕,也可以给视频手动增加字幕。看视频时,也可以按照自己的喜好调整字幕的字体、颜色、位置。
二、字幕的几个分类
Youtube 上的展示 CC 字幕是什么意思?先简单补充一下视频播放器原理,以便于更好地理解字幕几种分类的区别。
视频播放器会通过流媒体协议从服务器获取数据,下载的数据通常以特定的封装格式(如MP4等)呈现。播放器对封装格式数据进行解封装,提取视频流、音频流、字幕流。然后对音视频数据进行解码,解码后对图像帧渲染,并显示在屏幕中。
字幕在英文中有Caption 和 Subtitle 两种。
- 硬字幕(open subtitles):字幕被合并在原始视频帧中,无法从封装格式的数据中提取字幕流,所以也无法关闭,修改。
- 软字幕或者隐藏字幕(closed subtitles):可以从封装格式的数据中提取字幕流,是带有时间戳的特殊标记文本。可以在播放期间显示隐藏,可以使用专业的字幕编辑工具进行编辑。
- CC字幕-隐藏字幕(Closed Caption):主要针对耳聋或听力障碍人士设计的字幕。允许用户根据时间轴进行编辑,可在特定时间点添加、删除或修改字幕文本。
三、字幕的设置指南
(温馨提示:以下内容可收藏备用)
1. 英文
- 每行最多展示 42 个字符。
- 最多 2 行。
- 字幕在屏幕停留时间不应超过 7 秒,不应少于 1 秒。
- 成人节目:每秒最多 20 个字符;儿童节目:每秒最多 17 个字符。
- 每分钟最多 175 个字。
2. 中文
- 每行最多 21 个字符。
- 最多 2 行。
- 字幕在屏幕停留时间不应超过 7 秒,不应少于 1 秒。
- 成人节目:每秒最多 9 个字符;儿童节目:每秒最多 7 个字符。
- 每分钟最多 120 个字。
以上指南来自于wetranscriber。我翻看了Netflix的字幕样式指南,基本是差不多的。
Netflix字幕设置指南链接:https://partnerhelp.netflixstudios.com/hc/en-us/articles/219375728-Timed-Text-Style-Guide-Subtitle-Templates
四、字幕的呈现效果
根据以上字幕设置规则,考虑界面的呈现效果。
字幕样式需考虑:
- 样式选择哪种更合适?
- 竖屏是否需要展示字幕?如果展示的话字体大小是否合适?是否需要缩小?
- 当展示底部播放条时,字幕如何呈现?是降低透明度还是移动位置?
- 字幕的显隐怎么控制?
五、最后
当设定好字幕的显示限制规则后,对于呈现来说就很容易了。字幕是为了帮助观看者更好地理解对话和音频的内容,也可用于提供额外的场景信息。
这里的重点是:帮观众更好地理解内容。
内容的呈现方式会影响观众对内容的理解,所以需考虑字幕的显示数量和显示速度。内容本身也会影响观众对内容的理解,所以需考虑智能生成的文本是否准确传达视频内容,若不准确是否需要让老师可编辑。从观众角度来看,不同认知层次的观众对文字内容和呈现方式的要求也有些许差异。
不知为何,现实中大多数人往往过于关注视觉呈现,考虑极限状况,却忽略了功能的本质以及对用户的价值。
(最终研发有按照设计规则重新调整对接软件的参数,也许因为没人在意,所以没人推动,但我是忍不了呢)。
嗯,大概就酱~
作者
阿青,公众号:阿青碎碎念。B端UX设计师。
本文
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!