个性化算法要合规整改，“个推”政策限制下如何做好算法推荐？（上）

卡卡的产品札记 2023-07-31 20:20:10

8月27日，国家互联网信息办公室发布《互联网信息服务算法推荐管理规定（征求意见稿）》（以下简称《意见稿》）并公开征求意见。

《意见稿》对具有舆论属性或社会动员能力的算法推荐服务提供者进行重点规则，从内容推荐要求坚持主流价值导向，到不得实施流量造假、控制热搜等影响网络舆论，剑指微博、今日头条、百度、快手、抖音等资讯信息及短视频平台。

《意见稿》对个性化推荐开关、个性化推荐等做出明确规定，APP要在规定时间内整改合规。以下是关于《意见稿》的部分截图：

【上篇】个性化算法要合规整改，“个推”政策限制下如何做好算法推荐？

大数据算法为王时代，个性化算法是潮流（但算法背后衍生出不少个人隐私问题），《意见稿》基于人权益本身出台。平台如何在个性化推荐合规情况下，进一步做好人工推荐或精准推荐，达到双管齐下效果？本篇浅谈个人对算法推荐的看法。

一、什么是个性化推荐？

个性化推荐为什么受到平台“吹捧（喜欢）”？算法主要解决了什么问题？什么是个性化推荐？

个性化推荐就是在特定场景下，人和信息之间更有效率的一种连接。各平台热衷于做算法推荐的目的是要把内容/物品变成价值的效率系统，提升产品整体的使用转化。

二、个性化推荐的利与弊

个性化推荐可谓互联网经济最核心的取胜武器。《意见稿》的出台是要逆时代洪流发展？当然不是！

任何事物都有两面性，个性化推荐算法也一样，利弊结合。

1）好处

用户打开产品能快速找到自己想要的物品，提升整体查找效率；
方便用户快速了解自己感兴趣的内容；
方便用户专注于了解自己喜欢的领域，形成自身优势。

2）坏处

所有便利都是通过出让更多个人隐私换来的。一旦平台存储的数据泄露，将是人类史上一场无法预估的信息灾难。
大数据比你自己更懂自己，但长期下去容易形成信息茧房，不利于个人认知成长。
个性化相似内容推荐频次过高，重复看到相似推荐等于浪费个人时间。

《意见稿》基于个性化算法所暴露出的弊端，进行了强制约束和整改。

三、推荐的进化史

近10年算法推荐发展迅速，但不少平台仍然保留着“个人推荐+算法推荐+个性化推荐”几种不同的推荐策略，三者之间有何区别？

1. 人工推荐

个人推荐是推荐的1.0版本，由平台运营/编辑根据自己对内容或物品的品质、热度等做出评分，最后将评分高的内容推荐给用户。个人推荐的内容通常是千人一面，平台需要花费较长时间去验证人工挑选的内容是否符合市场/用户的需求，整体推荐效率滞后。

人工推荐目前仍广泛应用于传统行业，如报纸、媒体、出版等。

2. 算法推荐

算法推荐是推荐的2.0版本，即平台根据推荐诉求（如提升内容的CTR、CVR等指标），形成简单的算法逻辑，让内容满足平台大多数用户的需求。

比如常见的排行榜、新品榜、人气榜、飙升榜等，但算法推荐仍然是千人一面的推荐效果。

【上篇】个性化算法要合规整改，“个推”政策限制下如何做好算法推荐？

3. 精准推荐

精准推荐是推荐的3.0版本，它是前两种算法推荐的综合产物。主要通过给用户、内容、物品打上各类专属标签，再给贴有不同标签的用户推荐他们可能喜欢的内容，在某种程度上精准推荐“简单”的实现了千人千面的推荐需求。

精准推荐目前广泛应用于APP推送、广告投放等。

【上篇】个性化算法要合规整改，“个推”政策限制下如何做好算法推荐？

4. 个性化推荐

个性化推荐是推荐的4.0版本。它跟人工推荐最根本的区别在于，人工推荐是对用户“被动的投喂”，而个性化推荐则是用户“主动的选择”。

个性化推荐的核心在于推荐模型的训练，主要包括召回和排序两种主模型，且个性化推荐进一步细分为搜索推荐和个性化推荐。

搜索推荐是将海量内容与用户表意明确的查询意图的相关联，通过分词、变换、扩充、纠错等过程，更好地了解用户的搜索意图，实现精准推荐。而个性化推荐则是将海量内容与用户表意不明确的偏好相关联，最后输出用户可能偏好的推荐物。

因此个性化推荐的逻辑是——APP通过大数据收集，记录下用户每一个行为动作、行为路径、停留时长等，实时分析用户的主要意图，再通过以物推物、以人推物、协同过滤等规则，将用户偏好内容先召回，最后按排序规则计算出要给用户推荐的内容。

个性化推荐解决用户千人千面的需求，目前广泛应用于各大头部APP，其中以BATJ四大巨头为主。

四、个性化推荐存在的问题

个性化推荐发展迅猛，但仍然存在不少问题，其中最常见的4个问题便是：

1. 重复推荐问题

当机器算法足够了解你之后，算法能快速计算出用户偏好的内容，但同品类、同热点甚至是相似度极高的内容，无法避免内容重复出现在一屏或多个推荐位的问题。

将APP页面拆分成不同板块分析下，以淘宝APP为例，页面可分为搜索区、轮播banner区、分类icon区、特价划算区、直播区等不同榜单模块。淘宝的算法推荐业内数一数二，所以从物品推荐来看推荐的内容重复度低，但目前推荐能做到四大巨头这程度的企业较少。

【上篇】个性化算法要合规整改，“个推”政策限制下如何做好算法推荐？

因为榜单之间的推荐系统其实比较复杂。举个简单的例子，APP一共有10个榜单栏目，其中2个榜单是纯人工干预，剩余8个榜单纯算法推荐。这种推荐逻辑至少会出现3种重复推荐的问题——人工推荐的榜单之间存在重复推荐、纯算法榜单之间存在重复推荐、人工榜单和算法榜单之间存在重复推荐。

如果榜单跟榜单之间制定去重规则，能降低重复推荐的概率。然而去重限制并不能100%保证页面不再出现重复内容。因为榜单越多意味着去重规则越复杂，越靠后的榜单可能会出现去重后无内容召回的情况，无内容召回时系统会自动启用兜底推荐，这便衍生出其他2种重复推荐问题——人工榜单跟兜底榜单存在重复推荐、纯算法榜单跟兜底榜单存在重复推荐。