解密微信视频号推荐机制(一)
微信视频号定位
首先我们要看一下视频号的定位,视频号与公众号不同。
对于内容创作者来说,公众号是一个中心化的产品,好像一个封闭的鱼塘,池塘好不好要看鱼有多少。而视频号是去中心化的一个产品,视频号好像一个广场,只要你的内容够好,就能吸引更多的人来观看你的内容。
这个多怎么定义呢?
有可能是全国的11亿微信用户,所以视频号的核心在于推荐机制。现在视频号还在内测阶段,就如同初期的抖音一样处于红利期。
给大家看一组数据,公众号的打开率在3%左右,也就是说如果你有10000个粉丝,每篇文章的阅读量也就是300人。
而截止到2020/4/14日华仔的视频号粉丝只有51人,但是单个视频最高观看量已经达到1000+,华仔视频号总观看量已经达到5000+。
这组数据也就是华仔不得不做视频号的原因,绝对是一波红利。
上文已经讲过视频号的核心是微信团队设计的推荐机制,华仔花了2周时间每天都刷视频号,察觉到一些视频号推荐机制的蛛丝马迹,通过接下来的这两篇文章分享给你。
推荐系统入门
我们先对推荐系统入个门,如下图所示推荐分为三个阶段:召回、过滤、排序。
什么是召回呢?就是通过一个一个的推荐引擎(推荐算法),计算你喜欢的商品。简单介绍一下两个召回算法:比如基于用户的协同过滤算法(推荐引擎),就是你朋友喜欢的东西你也有可能喜欢,物以类聚,人以群分的算法。
第二个是基于物品的协同过滤算法(推荐引擎),我们都知道啤酒与尿不湿的案例,假如你在超市买了啤酒就很有可能买尿不湿。这个算法认为如果大多数人买了商品A,又买了商品B,那么A和B就是比较相似的。假如你买了A,我就可以给你推荐B。
再来看下什么是过滤,比如在视频号你刚刷了某个明星的短视频,接下来是不需要再给你推荐某个明星的这个视频,还有比如在电商网站你买过的东西,近期就没必要再推荐给你,这就是过滤。
最后看一下什么是排序,比如基于用户的协同过滤算法推荐出来了商品A,你喜欢的概率是0.98,基于物品协同过滤算法推荐出了商品B,你喜欢的概率也是0.98。
那我应该把A优先推荐给你还是把B优先推荐给你呢?两套算法都相互不服,就好像两个武林高手谁都不服谁,那么我只能这样做,请一个裁判再给两套算法比个武,谁赢优先推荐谁。这就是排序算法。
视频号用到的召回算法
本文主要讲视频号的召回算法,通过华仔观察到的结果反推视频号的推荐机制,微信视频号团队都用了哪些召回算法。
华仔连续下拉了13次视频号的首页,记录了每次刷新的第一的视频,为什么记录第一个?因为第一个放在最前面大概是因为视频号认为它是华仔目前来说最可能喜欢的视频。测试的结果如下:
我们来分析一下为什么推荐给我这些视频,要想搞明白为什么是这些视频,首先要搞明白微信都有华仔的那些数据。我们拿华仔的个人微信号举个例子:
华仔的微信号有1300+的好友、关注了384的公众号,平时没事打打王者和联盟、开了个产品经理公众号、写写文章、是一个非典型90后男同胞。
(1)基于用户协同过滤的视频号推荐算法
首先对于社交产品最重要的一定是华仔的好友数据,华仔的好友都看了那些视频,那个视频华仔的好友看的最多,那么就可以优先把这个视频推荐给华仔看,说不定华仔也喜欢看。所以华仔的朋友千万不要看不良内容,说不定华仔就刷到了。这就可以用到基于用户的协同过滤算法。
当刷到第九个时,后面连续都是 提示 “多位朋友看过”,说明视频号用到了基于用户的协同过滤,而且推荐结果在排序算法中权重很高。
(2)基于用户标签的视频号推荐算法
其次腾讯知道华仔关注了384个公众号,公众号在创建时是需要选择类别的,另外公众号发文章时时也要选择类别,华仔平时会看什么类型的公众号、看那些类型的文章,腾讯都知道,就可以给华仔打上各种各样的标签。
比如华仔经常看产品经理、汽车、美食相关的公众号和文章,那么腾讯就会给我打上产品经理、汽车美食等等标签。有了这些标签就可以给华仔推荐相关的视频,于是华仔的推荐列表里出现了“1.YYP颜宇鹏车言论”、“7.产品经理看世界 ”、3.迪哥爱吃 这些视频。
这里又产生了一个问题,微信视频号是怎么找到产品经理、汽车、美食相关的视频呢?一定要给这些视频打上产品经理、汽车、美食相关的标签,这里发现了视频号给视频打标签的三种方式:
第一是通过视频的标题关键字,这个是最直接的,因为“1.XXX说车”、“7.产品经理看世界 ”这两个视频的标题就包含了车和产品经理,微信可以通过视频的标题给视频打上 汽车和产品经理的标签。然后可以基于华仔个人爱车、产品经理、美食的标签匹配视频的标签,这样就完成了推荐。
第二个是利用用户填的话题,当用户用视频号创建一个视频时,用户可以针对视频选择一个话题,其实用户输入的话题就间接的给视频打上了标签。如下图#微信读书#这个标签,点击标签是可以看到标签下的视频的。
第三种方式比较高级,试用了一下微信的视频号搜索功能,比如华仔搜索“说车”二字,搜索结果分为上下两块:
- 第一种是视频号主,出现了“猫叔说车”等几个结果。
- 第二个是说车相关的视频,这里发现微信视频号已经能识别视频的内容包括视频里的文字和图片,这里用到了深度学习等算法,在视频上传后可以基于视频的内容打上相应的标签,一旦有了标签就可以和用户标签做匹配。
通过以上两个召回算法除了2.钛铂新媒体 、5.粥左罗 这两个视频,其他视频都能解释清楚了,要么是基于我的好友推荐 要么还是基于标签推荐。
其他视频推荐召回算法
那腾讯为什么会推荐:2.钛铂新媒体 、5.粥左罗 给我呢?
这里有两种可能:
第一种是因为在推荐系统中有个概念叫“信息茧房”,就是如果你观看的视频都是你喜欢的视频,就很有可能进入死循环,没有其他新的视频。推荐系统为了解决信息茧房的问题会给推荐系统增加一些随机性,推荐一些你从未看过的视频而这些视频,满足你的好奇心。现实中人也是这样的如果长时间只看某些东西,就会产生厌烦情绪,突然看到一个新的东西,会感觉很新奇。
第二种可能就是微信加入了视频热度的召回算法比如5.粥左罗这个视频点赞量1997、评论量480,热度一般是一些综合的指标的权重计算如观看量、点赞量、评论量、播放完成率等指标计算视频的热度,热度高的视频,用户喜欢的概率相对来说就会高一点。
下一篇系列文章会讲微信视频号视频用到了实时推荐机制以及视频号的冷启动策略,欢迎持续关注。
相关文章:解密微信视频号推荐机制(二)
#作者#
Wilton华仔,微信公众号:改变世界的产品经理。产品经理能力咨询,教你从0到1搭建数据中台。
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!