公众号“乱序”猜想
最近在看《内容算法》,一本有关内容推荐的入门书,前今日头条产品经理闫泽华写的。
书不厚,但干货不少,既解答了我此前对于头条号、豆瓣、知乎等内容平台部分功能设计的疑问,也给我关于公众号“乱序”(官方称之为公众号智能推荐)的思考提供了一个解题方向。
01 公众号此前存在的两个问题
1. 内容重复
内容重复是内容生态大繁荣的伴生问题,是所有内容平台发展到一定阶段的通病,非公众号一家独有。
一个热点事件发生后,权威新闻源(比如人民日报,城市官媒等)会发布新闻通告,自媒体会从不同角度进行评论,营销号会批量产出蹭热点的内容。所以我们之前经常会在订阅号列表里看到,“n屏都是看了标题就不想点进去的内容”。
一篇优质文章(尤其是爆文)诞生后,大量账号也会加入转载行列。比如“得到”公众号发布罗振宇2021“时间的朋友”跨年演讲全文后,在我关注的公众号中,包括但不限于“罗辑思维”、“笔记侠”、“腾讯科技”、“深燃”等都进行了转载,有的是标题、封面、描述不做修改的转载,有的是调整其中一个或多个元素的转载(之所以强调这一点,是因为它涉及到内容推荐优化的一个逻辑,第二部分会细讲)。
大家来看一个数据,新榜1月9日发布的:据新榜日常监测的162万微信公众号样本数据显示,2020一整年,公众号发文总篇数超过了3.87亿,其中标注原创篇数为2289万篇,占比为5.92%。
2289万篇文章,其中有多少比例是转载的,这份成绩单里没写。
不过,我们可以从新榜2017年的数据略窥一二:2017年原创文章占比4.6%(略低于5.92%),其中11月标记转载和原创的比例是3:1,也就是说,平均每1篇原创内容被转载3次。
要知道,这数据还是平均过后的,大号每篇文章被转载的真实数据往往都是几十几百的,而且好的文章会在各个大号中互转,内容重复展现是比较寻常的。
2. 内容“折叠”
这里的内容“折叠”,不单指公众号次条以下被真实折叠了的文章,还包括那些出于各种原因没被读者读到的文章。
因为职业需要,我关注了各种各样的订阅号,数量有点多,1071个。所以我的订阅号消息列表每天都会很热闹,有好几百条更新。不过,我获取一次性消息的对象条数是有限的,一般是两位数。也就是说,很大一部分内容是没有被自己看到的。
这不是个例。
据微信团队统计,在严格的时间排序下,用户在消息列表看到的卡片,大多其实都是完全不读的帐号,用户本身常读号的卡片,大量都没有被用户看见。
内容重复和内容“折叠”这两个内生问题,直接影响了用户的内容消费体验。长此以往,用户会大量流失,创作者会陆续出走。这样的情景绝不是微信公众平台想看到的,必须作出应对。
公众号“乱序”(智能排序)就是微信团队给出的一个解决方案,目的“是为了让用户看到更多更好看的内容。”
02“乱序”该怎么设计才合理?
那“乱序”究竟是怎么“让用户看到更多更好看的内容”的?
所谓公众号“乱序”,从表面上看,是系统在原本严格的逆序时间线里,把部分历史文章抽取出来,穿插其中(经观察,基本都是穿插在发布5分钟内的文章之后)。
这就引出大家都很关心的一个问题,系统是怎么抽取这些文章的,存在哪些策略或规则?
我们把时间拉回2018年,当时公众号刚内测按逆序时间线排序的“信息流”(行业内是这么口口相传的,尽管张小龙本人不认为这是“信息流”),知名自媒体人caoz在体验后就提出了一套可能的“信息流”设计策略:
- 原创指标,被认证的原创文章可以获得1小时的优先资格。
- 置顶指标,用户置顶的公众号,其内容可以获得8个小时的优先资格。
- 好友指标。如果一篇文章在近期有多个好友点赞,或多个好友转发,我认为这个应该是我会优先关注的内容。这个前提是,我已经订阅的内容。
- 负评指标。当负评达到一定程度,在排序的时候扣除其一定的时间资格,并基于此降低其排序和曝光量。
这套策略已经有“乱序”的影子了,其中置顶指标,有点类似目前微信团队已经公布出来的“常读用户”指标,而好友指标,很可能也是当下“乱序”策略的重要参数。可谓非常有预见性的想法了。
不过,它主要还是站在保护原创者利益的角度出发,是有局限性的。caoz自己也在文章中承认了这一点,“存在屁股决定脑袋的现象,可能不够公正和中立。”
还有一点就是,它没有解决我们前面提到的内容重复和内容“折叠”的问题。所以我在想,有没有可能引入另外一个指标:内容消费预判指标(指标名字是自己编的,思路来自《内容算法》这本书)来优化读者的阅读效率。
根据用户对内容的消费过程,我们可以将读者对内容的消费拆解为列表页消费和详情页消费。前者关系到点击前的消费预判(下图左),后者则代表了用户点击后的消费体验(下图右)。
基于这两个维度拆分,我们能够得到这样一张表格(如下图):
三种场景分别对应了公众号内容重复的三种处理方式:
情况A(甲、乙两篇内容,详情页都相同,即转载):
从消费者角度看,甲、乙两篇内容对用户来说是具有替代性的。用户消费了甲内容之后,大概率不需要再消费乙内容了。
那么,如果读者关注的公众号中相近时间段内发布了甲、乙两篇相同的文章,且读者已经读过甲文章了,乙文章就没必须通过“乱序”穿插到前序消息列表中;但如果读者两篇文章都没看过,系统可以根据其它维度比如原创,选择其中一篇文章进行穿插。
情况B(甲、乙两篇内容,列表页相同/相似,详情页不同,即同选题):
前面提到,每次热点事件发生后,都会产生大量追热点或蹭热点的文章。尽管用户点击后的消费体验不同,但是相似的列表页展示(标题、封面和描述)会给用户带来消费决策上的困惑。
如果用户点击过了甲内容,他很有可能会认为乙内容和甲内容是重复的,或者并不想在当下密集地看到相似内容,从而忽略/错过了乙内容。对于乙内容来说,这会导致曝光减少。对于这种情况,应该拉长两篇内容的展示间隔,通过呈现顺序的改变,将相似的内容分散开,从而避免用户视觉疲劳。
当然,这里的拉长依然遵循当下的“乱序”规则,不是指在发布后的5分钟内。
情况C(甲、乙两篇内容,列表页和详情页都不同):
这种情况是最简单的,两篇完全不同的内容,互相不构成对用户消费预判的影响,从其它维度进行“乱序”排列即可。
最后,来聊聊官方已经公开的另一个指标,即时效性指标。
公众号“乱序”功能上线后,一些对时间敏感的用户比如我们做媒体要求新闻时效性,就会很不习惯。对于这一点,微信团队在接受知晓程序采访时透露,“我们的团队也在加紧对时效性的问题进行更新,我们不是让时效性的文章一定会出现在所有用户的第一位,我们会通过算法调节,让喜欢看时效性文章的用户,他的时效性文章能够更快地排到前面去。”
这段话大有深意,不仅直接表达了时效性指标的存在,也间接说明了公众号完全可以根据我们的内容消费标签,实现相对精准的内容排序展示。
注:以上仅代表自己对公众号“乱序”的猜想,不代表当下公众号“乱序”的真实算法。
03“乱序”建立的新秩序
微信团队关于“乱序”的解读中,我觉得有一段话非常值得深思:
“我们会认为读者点关注这个按钮,代表的是过去的他关注了过去的你,因为你的内容也是在变化的,他的喜好、行为习惯其实也都是在发生变化的,人都是在变化的,内容也都是在变化的。他关注的时候仅仅是代表那个时候的他喜欢那个时候的你,并不能代表未来。
看到一篇好文章,我一般会认为创作它的公众号会是一个高质量账号,然后会不吝惜点下“关注”按钮。
但随着看到的好文章越来越多,关注的公众号列表也越来越长,原本严格时间线排列带来的秩序,反而造成了一种混乱和错位。
有些账号可以给当时的你大致符合需求的内容,你开始也确实非常喜欢觉得还不错,当你的订阅号列表被这些已经不太喜欢的内容占据时,你真正想看的内容的位置就被挤占,比如你通过一个公众号已经获取了你看似需要的内容,那你去获取新内容的动力就已经不太强了。
而“乱序”的出现,就是尝试打破这种看似有序的平衡,进而建立新的秩序。
这种新秩序,关于内容,也关乎内心。
作者:一拳超人的弟弟,互联网媒体人,产品爱好者;个人公众号:游牧志(ID:nomadic-diary)
本文作者@游牧志
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!