添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
小红书推荐算法的秘密

小红书推荐算法的秘密

“这是麋鹿先生Sky的第536篇原创文章,本文约4000字,预计阅读需要5分钟。


最近偶尔会有人来公司找我聊聊天,但话题嘛,都是围绕小红书转的,有意思的是基本每次到最后,都会聊到小红书的推荐算法是什么?


根据我的观察,来者不管对小红书是否真正的理解,但大家普遍都有一个共识“ 小红书的流量是有算法的 ”,不要笑,这样的共识很重要,因为有算法,就会有权重,这也是一切逆推的基础。

1 有哪些流量入口?


在开始聊算法之前,我也想和大家一起统一一个概念,很多人都说小红书的流量都来源于推荐,但实际上, 小红书上的流量入口有很多,并非完全都来源于推荐。

这里我做了个整理,可以发现小红书的流量入口大致可以分为六个。

1、搜索结果页: 打开小红书App,搜索词后进入搜索结果页

2、发现页: 打开小红书App选择顶部发现页

3、关注页: 打开小红书App选择顶部关注页

4、个人页: 打开小红书App点击笔记博主头像进入个人页(含其他形式进入主页)

5、附近页: 打开小红书App选择顶部附近页

6、站外: 站外带来的流量(含PC与H5)



我们 常说的推荐以及算法,其实就是指的“发现页”流量

聊到这了,顺便说一句,其他的流量入口就不存在权重和算法吗?其实也存在,比如搜索结果页,谁排前面谁排后面,这都是有学问的, 只要不是随机的,不是人工的,就一定有算法; 但每个流量入口给用户的价值并不相同, 每个流量入口的算法也自然各不相同 ,不能一概而论。

当然,你也可以去问小红书客服, 小红书会不会限流?笔记有没有权重?小红书客服会告诉你,什么都没有。 不过对于我们而言,只能内心一笑,一切尽在不言中。

2 小红书的推荐算法


明确一下,我们这里聊的推荐算法, 只是针对小红书发现页的算法。

在小红书一篇笔记发布到推荐的流程是什么样的?

1、笔记发布

2、语义分析/分类/打标签

3、平台审核

4、分配流量池(权重:账号状态,账号在类目内表现情况,类目竞争情况)

5、增加流量池(权重:互动情况,用户行为,笔记发布时间)

6、推荐结束


稍微做个分析,我们会发现,一篇笔记的流量推荐主要由“2、4、5”组成,其中2是为了将笔记内容做识别,匹配给有需求的用户,4/5的意义就是给大众用户推荐好的内容。


所以我们做一下总结,小红书推荐流量的本质就是两件事, 一个是如何精准匹配用户,一个是如何判断“好”的笔记。


我们先说如何精准匹配用户,这就涉及到了语义分析,也涉及到了给笔记分类目和打标签,目前为止,小红书的识别已经不止文字了,假设文字基本不写,也能通过图片或视频来识别内容是什么。


你或许会疑问,聊算法怎么扯到精准匹配了?因为精准匹配就是推荐算法的前提。


首先平台为了让用户感觉推荐满意,保险起见, 会尽量推送你近期有浏览行为的相关笔记 ,我相信你应该有过在小红书搜索某个产品后,推荐页会立刻推荐相关产品的其他笔记的经历,就是这个原因。


这个问题代表什么呢?代表一篇笔记必定是有分类的,必定是有受众人群的,假设你不是受众人群,平台会推荐给你吗?完全不会。 因此发布一篇笔记之后,本质上不是在与所有笔记竞争,而是与同样分类下的相似笔记在竞争 ,这个时候你问其他博主今天流量好不好,其实没什么意义,大家的类目都不同,竞争关系也不同。


这就是你在小红书,极少看到一篇笔记有上百万的点赞的原因,是小红书用户量不多吗?不是, 是因为这些笔记没有机会被推送给“全部用户”


精准匹配到这里就结束了,下一步就进入到了推荐算法环节,也就是平台如何判断一篇笔记“好”。


不用多想也知道,平台本身无法判断笔记好坏,于是就会借助用户的力量, 让用户自行投票(点赞收藏评论)来决定笔记好不好。


讲到这,又会多出一个疑问,一篇新笔记刚发布,肯定是没有人投票的,只有小红书把笔记推荐出去,才会有人根据内容来投票,新笔记发布的时候推荐多少人合适呢?推荐的少了,从统计学的角度来说,不太具备科学性;推荐的多了,万一这篇笔记就是不好,那岂不是给用户推荐了垃圾内容了?


怎么办呢?于是平台出了一个新办法, 根据权重综合决定这篇笔记该拿多少初始流量。


这些权重,比如:


1、账号状态


当前账号有没有违规?是不是限流?是不是垃圾营销号?有没有保持活跃? 一切正常且表现良好的,自然给的多一点,不正常,那就按最小原则来分配; 这就是有些批量运营的账号或者断更账号发布笔记流量少的原因。


这里不得不提一句,有些账号一注册就会被认为账号异常,比如用虚拟运营商的手机号注册,就会被识别为疑似异常账号,别问为什么, 问就是其他灰产都是这么干的


2、账号在类目内表现情况


近期账号在该类目下是不是连续发布笔记(主运营类目)?是不是经常出爆文(笔记写的好)?好,那就多给点。 这就是有些博主出过爆文,再次发布一篇同类笔记,爆文概率非常高的原因,一部分是掌握了当前用户的喜好,一部分也是初始流量给的就多。


3、类目竞争情况


当然,其他两项都是决定多给和少给的问题,但决定具体给多少,实际上是类目竞争情况决定的;


比如夏天发一篇羽绒服的笔记,受众必然是近期浏览过羽绒服的用户,但夏天啊,哪有多少人看羽绒服?假设全国一天就1万人,每天还新增几十篇笔记,为了保证每个正常的笔记都有流量可推,所以就会减少初始流量的绝对值,比如只给100个曝光,剩下的流量还得留给好的笔记呢。但要是夏天发裙子,那就会有所不同,裙子在夏天本来流量就大,初始流量可分配的也就多了一点。


以前零克Club群里总会有人问, 初始流量池是多少?是100还是200?看过以上这段话,你就应该知道了,没有绝对值,也不是直接用100还是200去定义的,而是根据不同的类目当前的流量情况,在结合账号状态以及历史笔记表现情况(权重)来综合得出的 ,而且完全由系统自动执行,我相信就连小红书的运营,也办法告诉你初始流量池是多少。


有了初始推荐流量后,不少用户就能看见这篇笔记了,有的点进来觉得不错,点了个赞,有的点进来觉得不行,直接退出了, 这些用户的动作,都会成为小红书判断笔记质量的因素。


小红书的内容算法CES全称community engagement score;
模型是:CES=点赞数*1分+收藏数*1分+评论数*4分+转发数*4分+关注数*8分


我相信你们都看过上面网传的小红书推荐CES算法, 但实际上,这已经是2017年以前的小红书算法 ,当时的小红书还无法获取用户太多的动作(没有埋点),仅能凭借基本的用户互动来判断笔记质量。


放到现在,如果单独只看用户的互动,这个CES的互动评分(互动以重要程度排序)还是合理的,但现在2022年了,不只看互动了,小红书也看笔记的完播率,跳出率等等。


何况如果小红书的算法就是简单的加法和乘法,那么小红书的程序员都可以下岗了,更别提判断因素仅仅有“互动”。


因此,一篇笔记有了初始流量池后,小红书会根据以下几方面来判断笔记的质量:


1、点击率

2、互动率(含转发等)

3、完播率/完读率

4、互动值


其中互动值(点赞收藏评论),完播率是我们能看见的,而点击率,互动率都是我们暂时无法看见的,每一个行为也都是用户的一种表态,因此用户做出动作的,一定会权重占比更高,比如点赞,收藏以及评论,其中评论最复杂,所以评论的权重一定比点赞收藏更高,同理点赞收藏肯定也比完播率这些不用做出动作的要更复杂, 核心就是互动难度越高,权重占比越高 ,平台就是根据这些综合得出一篇笔记到底算不算优秀,值不值得去推荐。


有些零克Club会员会问, 到底有多少点赞才能进入下个流量池?到底有多少点击率才能进入下个流量池?看完上文这段话,你就知道我也回答不了这个问题,小红书的人也回答不了这个问题,因为小红书的算法根本就不是按互动绝对值作为衡量优秀标准的,衡量标准是动态的,要按照当下类目其他笔记表现来算。


如果大家都很差,那么你稍微好点,就可以了,如果大家都很好,那么就很难了。


就像高考时大学的录取分数线也是动态的一样(某些),是由实际录取的最低成绩的学生决定的,我也称之为 动态平衡机制


假设,我们能过了初始流量这一关,那么就可以进入下一个流量池了,但这里进入下个流量池并不是非黑即白的关系, 不是只有表现最好的10%才能进入,剩下90%都进不去,而是10%进入更好的流量池,40%进入小一点的流量池,余下的小部分才不会分配流量。 (具体%是不清楚的,只是举例子)


与初始流量池的考核逻辑一致,如果下一个流量池表现很好,就能进入再下一个流量池,直到这个类目下没有匹配流量可以进行推送为止。


我猜看到这里,你会有个疑惑,如果我的笔记表现还行?类目流量也很大,是不是就能一直无限推下去?


实际上是不会的,因为我们一直都少提了一个因素,就是时间因素,新发布的笔记权重最高,老笔记的权重相应递减,这点很好理解, 平台肯定不希望推荐一些旧东西。 所以在逐渐进入新流量池时,时间因素也会发挥重要作用, 比如发布了1-2天的笔记,表现很好,你会明显感受到笔记流量还是很多的,但是即便你的笔记表现很好,互动率很高,10多天的笔记也基本没什么流量了 ,这个就是时间的原因。平台不会把流量放在一篇旧笔记上!这也是作为博主必须持续不断的更新笔记的原因,老本是吃不起的。


目前来看, 小红书的自然流量最长也就在30天左右 ,这还是极好表现的笔记或者是小众类目(内容不多)的笔记, 一般的笔记也就在3-14天结束自然推荐


至此,整个小红书的流量推荐就结束了。

3 知道算法又如何?


看完上面文章,了解小红书算法之后,我猜你会觉得,好像知道了和没知道,没啥区别?


其实这挺正常, 因为看完文章后会发现无法利用小红书算法作弊。


很多人想了解算法,就是想通过逆向思维进行作弊,比如知道点赞高就能有流量,那么直接刷点数据呗?知道算法有什么Bug,就利用算法的Bug薅点流量呗?


但是根据现在的结果来看,会发现小红书算法非常复杂,很难通过简单的动作就进行干预,这对不少人来说,无疑感觉很失望,最终还得通过识别用户的兴趣,做好内容才行,还是不能投机取巧。


但这也合情合理, 算法的意义就是尽可能的公平,让做的好的,有能力的博主脱颖而出,这也是算法存在的意义。


在我看来, 了解算法背后的逻辑和意义,并非为了去作弊,而是通过算法知道自己的笔记被如何运行在了小红书上,如何被推荐,为什么流量好,为什么流量不好,通过算法的原理去反思问题在哪里,去优化问题,这才是学习算法的真正意义。


而且有些算法上的问题也是完全可以被实际应用调整的, 比如笔记的类目和标签(可以用零克追踪zz.lingke.pro查询)被小红书官方打错了,举个例子,洋娃娃的衣服本应是玩具类目,结果被分到了时尚,理论上不会有什么好的效果,这个时候我们就应当调整笔记的内容,更多的出现玩具和洋娃娃这样的词,笔记就会被分到正常的类目下,流量也会顺其自然的好起来。


再比如我们发布了一篇笔记,互动不错,发现笔记每天都有流量,但是每天都不多,这时候就要反思是不是类目过于小众,当前类目的流量是不是总体就不够大导致的,最佳方法当然就是调整账号的方向。


相应的可根据算法进行反思调整的可能点还有很多, 但这依赖于根据真实场景的分析,而非别人的提醒。


但以上都是基于免费的自然流量而言, 假设自己的内容就是认定不错,就是每次无法突破小流量池怎么办?小红书也提供了动态平衡下的人工可干预机制,付费购买薯条,也就是付费购买流量 ,但诚实的说,这不便宜。


加油吧,小红书的从业者们。


-----

关于我:零克互动创始人,先后在 拉勾 ,腾讯音乐娱乐集团等任职运营管理层;
对运营和品牌营销&战略规划有着丰富的经验,目前MCN创业ing,帮助1000个小红书素人成为KOL,同时也在帮助品牌方在小红书更好的做笔记投放,请认准:知乎:麋鹿先生Sky ,公号:麋鹿先生sky , 个人微:yiciyuansky ,本人未授权任何内容转载,抄袭必纠!

发布于 2022-08-31 11:22

文章被以下专栏收录