如何定性内容？先有标准后有天，用算法的眼光看内容

内容平台 2023-07-24 00:01:48

有一条视频描述了这样的场景：在某综艺节目中，一个篮球明星表演踢足球。

那么这条内容应该属于什么主题合适呢？

运营甲认为是综艺，因为视频的上下文是综艺节目；运营乙认为是足球，因为视频内主要的活动是在踢足球；运营丙则认为是篮球，因为主要人物是个篮球明星。

公说公有理婆说婆有理，大家各执一词最后无法形成共识，各自按各自的想法工作，导致统计口径不一致，严重影响业务的判断。

1. 为什么需要标准？

内容识别主要运用在内容分发和内容决策两个方面，在分发之前系统需要利用规则或者模型识别出内容的特征，方便给用户匹配感兴趣的内容。

以主题分类为例，我们需要一个模型能够自动识别一篇文章的主题是新闻、体育还是其它。而模型的训练很大程度上依赖于样本的标注，如果标注同学没有依据统一的标准进行标注，那标注的准确率就会很低，而以这些低准确度样本训练的模型准确率必然更低，这将直接导致主题模型不可用。

从内容决策的角度，错误的识别结果将直接导致错误的运营决策。假设上面训练出的错误模型会把新闻类的内容都标注成体育，这样运营人员误以为体育类内容很受欢迎从而大力引入、扶植体育类内容。最后不但导致浪费了大量资源，而且用户真正感兴趣的新闻类内容受到挤占，体验也相应地变差。

“标”是投射器，“准”是靶心。标准合用，意为行为和结果要相符，常用于工业生产领域。

国家标准GB/T 3935.1—83定义：

“标准是对重复性事物和概念所做的统一规定，它以科学、技术和实践经验的综合为基础，经过有关方面协商一致，由主管机构批准，以特定的形式发布，作为共同遵守的准则和依据。”

从国标的定义可以看出标准针对重复性的事物，结合实践，目的是让参与各方达成一致共同遵守。标准的一般呈现形式是一个文档，可以附带解释说明的文件。

对于给内容分类打标这样重复性的工作，主观性极强，如果不能统一参与同学的想法，打标效果就会有很大的水分。而且后面新来的同学也不能利用之前积累的经验，一开始工作可能无从下手，效率极低。

因此我们需要套用工业领域的标准，在内容领域建立内容标准，统一所以参与者的判断，出现不一致的情况下也能有据可依。

定制标准也是一门技术活，并非单纯罗列条款那么简单。我们接下来聊聊什么样的内容标准才是合格的，并用一个内容标准的实例来加以说明。

（1）标准的标准

标准的核心目标是让使用者能够快速与标准的描述达成一致，为了制订提高标准的质量和效率，可以给标准也规范标准，这样在后续制订各种不同标准的时候就有了参考依据。

明确目标：首先需要明确的是标准的目标，整个标准主要面向什么类型的内容，有什么目的。让使用者充分意识到它的使用场景和价值，这样有利于标准后续的推动和执行；
描述清晰：标准的描述语言尽量客观中立，不容易引起歧义，用定性的语言让使用者大致了解描述的是什么样的内容，给使用者一个大致的预期。但是定性描述还是含糊的，这时候需要定量描述来补充说明。如判断图片模糊的标准有两条候选。第一条是“图片模糊不清”；而第二条则更细致，“人物五官不清晰，出现明显的锯齿或马赛克或图片一半以上的面积模糊不清”。两边对比显然后者不容易产生歧义，方便执行；
抓大放小：标准创作者的精力和知识有限，不可能穷举所有的情况。因此优先描述主要情况，对于不常见的情况可以忽略或简单描述。至于哪些是常见情况可以抽样统计获得；
突出案例：如同英美法系以判例为重要依据，在标准的条款中加入真实的案例远比文字描述更加生动形象。值得注意的是反例和正例一样重要，反例就是那些容易出错的例子，加入到标准中有助于避免此类情况发生；
明确边界：对于模糊有歧义的情况或者经常被误判的情况应当专门加以说明。

（2）一个典型的标准

下面展示一个实际被运用且符合上诉标准的“恶心（gross）内容标准”，由于案例图片可能引起读者不适就不在此呈现，但是真实标准中需要体现：

1）标准目标

部分内容中含有令消费者感到恶心不适的内容，直接展示给用户会严重影响观感。其中严重的部分会引起大多数人的强烈反感，应当直接下架处理；恶心情节较轻的内容，有部分用户不敏感，部分厌恶，则可以限制其曝光范围。本标准目标是识别此类内容，减少用户感到恶心的机会。

2）标准条款

情节严重者，使大部分用户会感到强烈不适，对未成年人有严重不良影响，应当做下架处理：